Video OCR|動画も文字認識の時代へ突入

Video OCR|動画も文字認識の時代へ突入
■ 店頭より得で、予約しやすいオンラインショップ。
 → ドコモオンラインショップ
 → auオンラインショップ
 → ソフトバンクオンラインショップ

ここ最近、画像認識も身近なものになりつつあります。

まだ一般的な普及までは時間を要するのかもしれませんが、その精度は日々高まり、誰でも簡単に開発ができるようになりつつあります。
実際にiOS11から実装される予定の「Core ML」を用いて、簡単な画像認識をricemanさんがやってみせたぐらいです。
<bitWave関連記事『「iOS11」新搭載の「Core ML」を駆使してMNISTの手書き数字認識を試してみた』>

ただし、世の中の通信技術も同様に高まり、時代は着々と「静止画」から「動画」へとシフトしつつあります。
当然ながら静止画がなくなるということはないでしょうが、「動画」であるからこそ使えなくなる技術というものも出てくるでしょう。
先に挙げた「画像認識」もその一つです。

しかし、その「画像認識」の進化を見くびることなかれと、私を見くびっている紅孔雀さんがこんな最新技術を共有してくれたのです。
<参照:Microsoft TechNet『Azure Media Analytics の Video OCR のプライベート プレビューを発表』>

動画内テキストを認識できれば……

共有してくれたサイトではプレゼンテーション動画内にある資料のテキストを文字起こししてくれています。
これはなかなかスゴイこと!

この技術を持ってすれば、自動運転技術で用いる(以下の動画ような)トラッキングデータから、並走する他車のナンバープレートを抜き取ることもできるでしょう。

また、録画したテレビ番組のデータから、関心のあるキーワードを含むテロップが出た際にマークすることもできますね。

世の中には動画が溢れかえっている以上、この技術を用いて整理することができれば、効率よく視聴することもできますね。。。

残すは音声認識の精度向上か

動画内の文字認識が可能なのであれば、あとは音声認識に精度向上が残されることになるでしょう。

実際にYouTubeなどでは音声からの自動字幕機能を実装していますが精度が低く、結局は自分で用意した字幕をはめ込まなければいけないようなクオリティです。

再生時にフレーム下部に表示される[字幕]アイコンをクリックすれば、自動生成の危うさが理解できるハズ

「動画文字認識」+「動画音声認識」がよりハイレベルな域で実現すれば、動画管理も新次元に突入したと言えますし、そこから新たなビジネスモデルが確率することは確かでしょう。

今から楽しみですね!

■最新のiPhoneの購入・機種変更なら店頭より得で、予約しやすいオンラインショップ。
機種の頭金や使わないオプションパックをつけて年間何万円も損していませんか?
オンラインショップなら故障のサポートもしっかりしていて最低限の費用。待たされることもありません。
 → ドコモオンラインショップ
 → auオンラインショップ
 → ソフトバンクオンラインショップ

最新のiPhoneを得して乗り換えるなら、
キャッシュバックキャンペーン実施中!【おとくケータイ.net】
がお得です。

以下の記事も読まれています。