Googleの印象的なライブキャプションは、携帯電話の音声に字幕を追加します

著者: Laura McKinney
作成日: 10 Lang L: none (month-011) 2021
更新日: 1 J 2024
Anonim
LINGVOTUBE - APP - VIDEO SUBTITLE TRANSLATOR ON YOUTUBE / NEW 2021
ビデオ: LINGVOTUBE - APP - VIDEO SUBTITLE TRANSLATOR ON YOUTUBE / NEW 2021

コンテンツ


Google I / O 2019オープニング基調講演の大きなテーマの1つは、包括性でした。 Android Qの新機能は、電話で再生されるほぼすべてのオーディオまたはビデオにインスタントキャプションを提供することにより、耳が聞こえず難聴な人の包括性を改善することを目的としています。

この機能はライブキャプションと呼ばれ、AIを使用して、スマートフォンで再生される音声を高速で正確なキャプションに変換します。この機能の特長は、オーディオまたはビデオを再生するかどうか、およびコンテンツがサーバーからストリーミングされるか、ローカルストレージから再生されるか、または人間がその場で生成するかに関係なく、どのアプリでも機能することです。

Google Pixel 3a XLレビュー:カメラに来て、体験してください

ライブキャプションは、ポッドキャスト、ビデオ、オーディオ、Duoなどのビデオチャットアプリで動作します。 Google I / O基調講演の段階で見たデモは非常にスムーズで印象的でしたが、実際の結果は明らかに異なる場合があります。

ライブキャプションには1回タップするだけでアクセスできます。ユーザーは、システムの音量を変更するときに表示される新しいアイコンをクリックすることでアクティブにできます。すべてがローカルで処理されるため、サードパーティが会話を聞くことを心配する必要はありません。

キャプションは、通常のインターフェイスの上にオーバーレイされた黒いウィンドウに表示されます。キャプションは後のために保存されないため、対応するオーディオが再生されたときにのみキャプションが表示されます。

ライブキャプションは、ポッドキャスト、ビデオ、オーディオ、Duoなどのビデオチャットアプリで動作します。

耳の不自由な人はこのクールな新機能の大部分の恩恵を受ける可能性がありますが、Live Captionはさまざまな状況で他の多くのユーザーに役立つ可能性があります。オーディオがゼロになった場合でも機能し、周囲の人を邪魔することなくコンテンツを消費できます。

ライブキャプションは、Android Qに組み込まれた新しいアクセシビリティ機能です。使用する前に設定から有効にする必要があります。現時点では、その機能がすべてのOEMによってAndroid Qデバイスに含まれるかどうかは不明です。


ライブ中継

ミュートで動画を視聴できる機能は非常に優れていますが、ライブキャプションテクノロジーが一部の人にとっては人生を変える効果と比較しても些細なことです。 Googleは、Live Captionが、昨年初めてデビューしたSmart ReplyおよびSmart Composeの機能と相まって、話すことができない人が会話するのにどのように役立つかを示しました。ライブリレーと呼ばれるこの技術は、音声を、聴覚障害のあるユーザーが簡単にやり取りできるテキストに変換できます。次に、回答が合成音声に変換され、回線の終わりに人に中継されます。

プロジェクトユーフォニア

Googleの研究者は、物事を一歩進めて、音声認識モデルを訓練して、st音、脳卒中、その他の障害に苦しむ人々のような非標準の音声を理解する方法も探しています。長期的な目標は、音声障害のある、またはまったく話せない数百万の人々をコンピューターに理解させることです。

Googleは、文字通りすべての人にとってテクノロジーを機能させるためのこの探求には、まだやるべきことがたくさんあると警告しました。スンダ・ピチャイ最高経営責任者は、音声障害のある人々を招待して、より包括的な認識技術の構築に役立つ音声サンプルを提供しました。

Google I / Oの詳細をお楽しみに。

本日、Googleは台湾で大規模な拡張を開始していることを発表しました(経由 TechCrunch)。検索大手は、現在の台湾のキャンパスからそれほど遠くないところに新しいキャンパスを建設し、何百人もの新しい従業員を雇います。現在、Googleには台湾に約2,000人の従業員がおり、その一部は台北101地区の新北市にある現在のキャンパスで働いています。新しいキャンパスは台北遠東テレコムパークにあり、...

Googleは数年前にWord Lenを買収し、Google Tranlateにスマートフォンのカメラを使用して単語を翻訳する優れた機能を提供しました。これはかなり実用的な機能ですが、一連の新しい追加によりさらに良くなっています。1つは、インスタントカメラ翻訳が60以上の言語をサポートするようになり、88の言語から100以上の言語に翻訳できるようになりました。顕著な追加には、アラビア語、ヒンディー...

人気の出版物