自社制作『OCR』がどんな環境でも文字認識ができるのかテストしてみた

  • 2017年5月19日
  • by 
自社制作『OCR』がどんな環境でも文字認識ができるのかテストしてみた
■ 店頭より得で、予約しやすいオンラインショップ。
 → ドコモオンラインショップ
 → auオンラインショップ
 → ソフトバンクオンラインショップ

こんにちは、M.Sです。

先日、ひょんなことから『OCR』のテストを行う機会がありました。
これまで自社サービスのサービスインやアップデートの前段階で検証を行うことがほとんどだったわけですが、今回の『OCR』検証は初めての体験。

普段使い慣れている「Selenium」が使えない状況の中、どのように『OCR』検証を行ったのか。
今回はその実施した検証内容についてご紹介したいと思います。

『OCR』とは

まずは『OCR』とは何なのかご紹介します。

”紙面を写した画像などを解析して、その中に含まれる文字に相当するパターンを検出し、書かれている内容を文字データとして取り出す装置やソフトウェアのこと。また、そのような方式による自動文字認識。”
<参照:IT用語辞典 e-Words『OCR』>

印字されたデータや手書きのものなどを解析し、アナログからデジタルにデータ変換するという機能なんですね。

同様に手書きのものを読み取る機能としてマークシートを読み取る「OMR」というものもありますが、マークシート自体を思い出していただければ分かる通り、印刷された丸をなぞったり、穴埋めしたりするなど手書きとはいえ制限がありました。
その点、『OCR』は汎用的な文字や記号を読み取る機能であるため、高機能であると言えます。

ただし、万能のように聞こえる『OCR』ですが、活字こそ高い精度を誇るようになったものの、手書きのものであれば正しく認識できない可能性もあるというのが現状です。
つまり『OCR』の普及には、読み取り機能の精度向上が必須ということなんですね。

社内初の試み “合同テスト” を実施!

テストで用いる『OCR』はまだ世に出ていない、完全自社制作のもの。
検証内容は「スマホで撮影した画像から読み取った文字が、正しく入力フォームへ反映されるか」です。つまり文字(アナログ情報)がフォーム(デジタル情報)に変換されるかということです。

このテストは初の試みだったということもあり、社内の複数人が検証を実施しました。
大半の人は机の上に置いて撮影、もしくは手で持って撮影といったいたってベーシックな撮影環境で実施。

「確実に読み取れそうな条件下で撮影したパターンが多いな」と個人的に推測しておりましたが、結果はその予想通り。
特定の文字はうまく読み取れないという結果ではあるものの、ほとんどの場合では正しく文字を読み取ることができ、かつ正しくフォームへ反映されていました。

仮にこの『OCR』がサービス化された場合、ユーザはそんなに都合よく、コチラの想定通りの環境で使ってもらえるものなのでしょうか?
前記の「OMR」のように、読み取り位置が固定になっているならまだしも、汎用性に特色のある『OCR』では様々なパターンで読み取れることが重要になります。

汎用性がウリの『OCR』はいかなる環境でも機能することが必須

もう少しユーザの立場になって考え、色々な環境や条件で撮影を行ってみることにしました。具体的には……
・撮影場所は自宅のリビングなどの屋内
(自宅は会社と違って、間接照明で薄暗かったり、オレンジ系の照明もあるため)

というわけで、撮影場所はリラックスできる雰囲気のある場所をイメージし、早速テスト開始!
そのテスト結果を下記にまとめましたのでご覧ください。

ロケーション1:社内休憩室

 検証環境:iPhone6S(iOS10.2/Safari/Wi-Fi)

【検証1-1】
<概要>
・多少写真がぼやけ気味
・窓際(ブラインドが下がっている)
・電球色の照明
<結果>
ほとんどの文字が入力フォームに反映されない

【検証1-2】
<概要>
・鮮明な写真
・窓際(ブラインドが下がっている)
・電球色の照明
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映された

【検証1-3】
<概要>
・写真内から対象撮影物の両端が見切れているものの、読み取りたい文字自体はフレーム内に収まっている
・窓際(ブラインドが下がっている)
・電球色の照明
<結果>
一切反映されない

【検証1-4】
<概要>
・対象撮影物の背景に建物が写り込んでいる
・窓際(ブラインドを上げている)
・電球色の照明
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映された

【検証1-5】
<概要>
・対象撮影物の背景が木目(机上で撮影)
・対象撮影物が縦向き(読み取る文字も90°回転している状態)
・対象撮影物に手の影あり
・電球色の照明
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映された

【検証1-6】
<概要>
・対象撮影物の背景に机の一部と白い壁が写り込んでいる
・対象撮影物の上下を持っている
・電球色の照明
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映された

【検証1-7】
<概要>
・写真が暗め
・対象撮影物の背景にソファ、ダンボール、自分の足の一部が写り込んでいる
・対象撮影物の左上角に指が触れている
<結果>
一切反映されない

【検証1-8】
<概要>
・対象撮影物の背景にソファ、ダンボール、自分の足の一部が写り込んでいる
・昼光色の蛍光灯の下で撮影
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映された

【検証1-9】
<概要>
・ソファの上でやや斜めに撮影
・対象撮影物の右上に光が当たっている
・昼光色の蛍光灯の下で撮影
<結果>
読み取れないカナがある。また、光が当たっている箇所は一切反映されない

【検証1-10】
<概要>
・何かに立てかけて撮影
・対象撮影物が台形に写っている(パースがついている)
・昼光色の蛍光灯の下で撮影
<結果>
意図しない文字が入力フォームに反映された

【検証1-11】
<概要>
・新聞の上で撮影
・昼光色の蛍光灯の下で撮影
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映された

ロケーション2:社内の自席

 検証環境:iPhone6S(iOS10.2/Safari/Wi-Fi)

【検証2-1】
<概要>
・白い机の上で真上から撮影
・昼光色の蛍光灯の下で撮影
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映された

【検証2-2】
<概要>
・白い机の上で真上から撮影
・Apple社製ではないカメラアプリを使用
<結果>
一切反映されない

ロケーション3:カフェ(社外)

 検証環境:iPhone6S(iOS10.2/4G回線) ※写真はイメージ

【検証3-1】
<概要>
・対象撮影物が台形に写っている(パースがついている)
・Chromeブラウザを使用
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映される。また、Wi-Fi回線と比較して遅延が発生

【検証3-2】
<概要>
・対象撮影物が台形に写っている(パースがついている)
・Safariブラウザを使用
<結果>
読み取れないカナはあるものの、ほぼ正しく入力フォームに反映される。また、Wi-Fi回線と比較して遅延が発生

“正しい!?” 自社制作『OCR』の撮影方法とは

“どのような環境であっても機能すべき” という『OCR』検証の本来の目的から相反しますが、今回検証を行った『OCR』を “確実に読み取らせる” のであれば、以下のような環境である必要がある、というデータが検証結果から得られました。

・デフォルトで搭載されているカメラを使う
・机などに置いて真上から撮影する
・なるべく明るい場所で撮影する
・ぼやけないように撮影する
・影や光が写りこまないように撮影する

手で持って撮影しても読み取れるようですが、撮影対象物に触れる指の場所によって、うまく読み取れないこともしばしば。つまり、置いて撮影したほうが確実なようです。つまり、落ち着いて真上からピンボケしないように撮影する必要があるというわけです。

結論、理想とすべき『OCR』までの道のりは長く険しいということが確認できただけでも成果です。世の中にある『OCR』もまだカンペキなものがない以上、取り組む企業は悪戦苦闘を強いられているかと思われますが、よりカンペキな『OCR』に近づけられるよう、日々開発・検証が行われているのでしょうね。

■最新のiPhoneの購入・機種変更なら店頭より得で、予約しやすいオンラインショップ。
機種の頭金や使わないオプションパックをつけて年間何万円も損していませんか?
オンラインショップなら故障のサポートもしっかりしていて最低限の費用。待たされることもありません。
 → ドコモオンラインショップ
 → auオンラインショップ
 → ソフトバンクオンラインショップ

最新のiPhoneを得して乗り換えるなら、
キャッシュバックキャンペーン実施中!【おとくケータイ.net】
がお得です。

以下の記事も読まれています。