AI

Googleの音声解析って複数の音声をちゃんと聞き分けられるの知ってた?

最近Googleの話題で頭がいっぱいです。みなさんいかがお過ごしでしょうか。

先日投稿した記事、

あわせて読みたい
Googleアシスタントで使えるAI電話機能、すげー。早速なんだけど、このツイートを見てほしんですよ。 Watch Google Assistant make a real call ...

の中にかかれていた、「Google AI」の機能について。

まずはこちらの動画をご覧ください。

いかがですか?

それぞれの言葉をちゃんと声を聞き分けて、話の内容が盛り上がって白熱していても

会話をしている人ごとに字幕を生成してくれるんです。

リアルタイムでテレビに字幕を入れるお仕事とか、高速で字幕を作成して表示する仕事とか、そういうのは今までもありましたが、やっぱり機械。精度も速度も違う

今現在Google Homeが最大6人の声を聞き分けらることもできますが、今回のは声の違い(声の高さ、声を登録しているかどうかなど)で個々を認識するだけではないんです。

発音や言葉の癖とかを認識して、

会話の内容を正確に理解をし、なおかつ文字を字幕として文字起こしもしてくれるんですよ。

今後の音声解析機能

あわせて読みたい
Googleアシスタントで使えるAI電話機能、すげー。早速なんだけど、このツイートを見てほしんですよ。 Watch Google Assistant make a real call ...

YouTubeの動画はデモでしたが、先日紹介した上の記事の内容みたく(是非見てね)、相手の会話や話している内容までをも理解し、認知し、それに対してのレスポンスを返すこの仕組み、技術、そして精度は、これから益々上がっていくに違いない。

これが実用化されてくると、テレビで見る国会での内容を記している議事録も自動で文字起こしがされるようになるし、

はたまた年中メディアによって制御されている芸能ニュースの記者会見。正直あんな風に芸能人になったからといって晒し者になっている環境は異常だと思いますが、そういうリアルタイムニュースも、会見会場にAIを外部からつなげるようにして、記者の質問は全てAIが行いその質問と回答文を文字起こしてもらい、会場にはカメラのみ。なんならそのカメラも遠隔でAIから撮れるようになれば、記者会見場は会見者のみ。YouTuberみたいな状況で淡々と喋っていく。みたいな状態にもなるかもしれない。

あー、頭の中が膨らみますなぁ。すごいぞGoogle。すごいぞAI。

まだまだ発展途上ですからね。

これまで複数が同時に発言すると、お互いの文がごっちゃになっちゃって字幕文がわやな感じになってたんですよね。そりゃ、ただ文字を起こしてたんだろうからそうなりますわな。

その懸念点をいい感じにできる機能を作って毎度驚かせてくれるGoogle。偉いぞ。

この記事が気に入ったら
いいね ! しよう