Video OCR|動画も文字認識の時代へ突入

Video OCR|動画も文字認識の時代へ突入

ソフトバンク・au・ドコモの方は、公式のオンラインショップを利用すれば頭金不要で通常のショップよりお得に購入できます。

ここ最近、画像認識も身近なものになりつつあります。

まだ一般的な普及までは時間を要するのかもしれませんが、その精度は日々高まり、誰でも簡単に開発ができるようになりつつあります。
実際にiOS11から実装される予定の「Core ML」を用いて、簡単な画像認識をricemanさんがやってみせたぐらいです。
<bitWave関連記事『「iOS11」新搭載の「Core ML」を駆使してMNISTの手書き数字認識を試してみた』>

ただし、世の中の通信技術も同様に高まり、時代は着々と「静止画」から「動画」へとシフトしつつあります。
当然ながら静止画がなくなるということはないでしょうが、「動画」であるからこそ使えなくなる技術というものも出てくるでしょう。
先に挙げた「画像認識」もその一つです。

しかし、その「画像認識」の進化を見くびることなかれと、私を見くびっている紅孔雀さんがこんな最新技術を共有してくれたのです。
<参照:Microsoft TechNet『Azure Media Analytics の Video OCR のプライベート プレビューを発表』>

動画内テキストを認識できれば……

共有してくれたサイトではプレゼンテーション動画内にある資料のテキストを文字起こししてくれています。
これはなかなかスゴイこと!

この技術を持ってすれば、自動運転技術で用いる(以下の動画ような)トラッキングデータから、並走する他車のナンバープレートを抜き取ることもできるでしょう。

また、録画したテレビ番組のデータから、関心のあるキーワードを含むテロップが出た際にマークすることもできますね。

世の中には動画が溢れかえっている以上、この技術を用いて整理することができれば、効率よく視聴することもできますね。。。

残すは音声認識の精度向上か

動画内の文字認識が可能なのであれば、あとは音声認識に精度向上が残されることになるでしょう。

実際にYouTubeなどでは音声からの自動字幕機能を実装していますが精度が低く、結局は自分で用意した字幕をはめ込まなければいけないようなクオリティです。

再生時にフレーム下部に表示される[字幕]アイコンをクリックすれば、自動生成の危うさが理解できるハズ

「動画文字認識」+「動画音声認識」がよりハイレベルな域で実現すれば、動画管理も新次元に突入したと言えますし、そこから新たなビジネスモデルが確率することは確かでしょう。

今から楽しみですね!

ソフトバンク・au・ドコモの方は、公式のオンラインショップを利用すれば頭金不要で通常のショップよりお得に購入できます。

【週刊bitWave】(メルマガ)始めました!

登録はこちらからメールアドレスを入力してお申込みください。

ご登録いただいたメールアドレスは 【週刊bitWave】の更新情報の配信にのみ使用します。

個人情報の取扱いに関しては、「プライバシーポリシー」をご確認ください。解除はいつでもこちらから行うことが可能です。

あなたにおすすめ

描いた絵を判定するだけじゃない!!|「Quick, Draw」が実施していたトンデモ実験... かつて「Quick, Draw!」というサイトで公開されている “手描きの絵をAIは判定できるのか” というニューラルネットワークの実験を4名のbitWaveライター陣を対象に試してみたことがありました。 <bitWave関連記事『Can...
萌えキャラを愛でる時代は終わった……|嫁を自動生成、オリキャラを愛でよ!... はぁ~癒やされたい、癒やされたい。 カワイイ女の子に癒やされたい。。。 7~8月と微妙な気候が続いたせいか、いつにも増して疲労感がハンパない9月ではないでしょうか。 みなさんもカワイイ女の子に癒やされたいですよね? ただ、カ...
ディープラーニングが新種発見!?|AIがコレクションを再分類する... もう夏も終わりですね。 みなさんはセミの抜け殻、どのくらい集めることができましたか? 今年は台風の影響もあってか、そんなにコレクションもはかどらなかったのではないでしょうか。 えっ!? 集めてない? 何を言っているんですか、...
衛星画像、下から見るか?横から見るか?|「衛星画像解析×AI」脅威の人探し... 既婚の男性読者の方、ちゃんとまっすぐ家に帰っていますか? 昨今では衛星画像のクオリティが上がり、マンホールの位置や郵便ポストの位置まで解析できるようになっています。 つい先日、某国のミサイル発射場でバレーボールを楽しむ兵士たちの画像...