AI(人工知能)プロジェクト③ ~ようやく目的地へ

AI(人工知能)プロジェクト③ ~ようやく目的地へ
■ 店頭より得で、予約しやすいオンラインショップ。
 → ドコモオンラインショップ
 → auオンラインショップ
 → ソフトバンクオンラインショップ

ようやくAIプラットフォームの第1弾の実装、及び検証が終わりました。
より正確にお伝えするのであれば、プラットフォーム上に搭載する一つのAIソリューションの実装が完了したということです。

プラットフォームはいつでも拡張できる設計にしています。
AIプラットフォームに仕立てるには、若干のマッチング機能などを要するためです。
これらは次回の旅の途中で実装することになるでしょう。

<これまでのおさらい>
AI(人工知能)プロジェクト① ~いざ迎える出港の時
AI(人工知能)プロジェクト② ~もうすぐ目的地へ

我々のAIの概念は、以下の3点 ――

1点目はAIはあくまでも人間が作り出したシナリオの補完機能にすぎないということ。我々はAIに委ねすぎないことが重要であると思っております。
2点目はアルゴリズム(数理モデル)を複雑化しないこと。
最後の3点目は、AIの分析は低コストで実施できることが望ましいということです。

今回は3つの概念について解説していきましょう。

概念1:AIはあくまでも人間が作り出したシナリオの補完機能

我々の未来はAIに支配されるような社会になる ――
ここ数年、人工知能の話題になると、そのようなことを耳にする機会が多くなりました。

しかし、実際にはまったくそうではありません。
機械学習は「人間が作成したシナリオありき」であると言いたいのです。つまり、人間とAIのコラボレーションとも言えるのではないでしょうか。

最近の機械学習では「教師あり」と呼ばれる正解データをAIに与え、そこからルールやパターンを自動で学習させる方法が主流となっています。
この方法も面白いとは思うのですが、人間が作ったようなストーリー性はそこにはなく、精度が良ければ使いましょうと言わんばかりの、まるで機械任せで運用しているきらいがあるような感じがします。

人間が考えるシナリオこそ当然ながら人間味もあります。そして、そこから新たな知恵やアイデアが生まれてくるのではないでしょうか。
そういった人間味を考慮し、今回は理屈なしの類似性をもったクラスタ(かたまり)を機械が、暗黙的に持つ規則性(ルール)を抽出してくれる「教師なし」クラスタリングを実装いたしました。
この得られたクラスタがどういった特徴を持つ集まりなのかを、人間が見て類推する必要を持たせています。
この結果をみて、人間がより創造性を発揮できるようになっていただければ幸いです。

概念2:アルゴリズム(数理モデル)を複雑化しない

2点目は、機械学習の数理モデル(アルゴリズム)を複雑にしたところで、必ずしも分析の精度が高くなるとは限らないということです。むしろ複雑化してしまうことで、アルゴリズムの概念の説明を困難にしてしまい、導き出された結果検証が不明瞭なものとなってしまうケースがあるということです。
これが「アルゴリズムはブラックボックス」と言われている所以です。

分析自体がうまくいっており、最初から結果さえ良ければ問題なしという観点であれば、その過程の説明や検証は問題ないでしょう。
ただし我々の経験上、AIの分析をたった一度で成功させることができるとは思えないのです。

例えば、ある特徴量(カラム)を削除することや、クラスタリングであればクラスタ数を調整するなどの必要性が生じてくるからです。つまり、用途やサービスのシナリオに沿ったモデルを確定しなければならず、そのモデルを何度も検証する必要があるのです。
その際に「このアリゴリズムだから、このような結果が導き出されている」といった、専門的な統計的処理の中身までは理解しないにしても、少なくとも概念だけでも理解しておかなければ、「何をどのように処理、対応すればいいのか」すら分からなくなることでしょう。

過去にAI分析を行ったけど、うまくいかなかったという方は、そのあたりも要因ではなかったでしょうか?
アメリカ企業のようにトップダウンでなく、日本企業は現場レベルから上長に “稟議” を上げて進行していく商習慣であるが故に、現場の方が社内できちんと説明できるレベルに理論武装する必要に迫られ、概念以上の専門的な知識を得ようしすぎて足元をすくわれているように思えてなりません。

概念3:AIの分析は低コストで実施できることが望ましい

3点目において、我々の理想形は「電子レンジ」のようであること、と捉えています。
温めたい食品や材料を入れて、自分が温めたい時間を設定しさえすれば、それだけで食べ物が温まっている。
このようなレベル感でAI分析ももっと分かりやすくシンプルにし、分析にかける時間を少なくすれることができるのであれば、自ずとコストも下がっていくであろうという概念です。

それでは今回、我々が実装したモデルを紹介しましょう。

PCA(主成分分析)という次元を削減することを目的とした、つまり、あまり重要でないと思われる特徴量(カラム)を削除する方法があります。
この手法は、現在ある元データを新しい次元で見ることから始まります。つまり、元の特徴量から新たな指標を合成することになります。

元データに対する情報量が大きい(分散が最大となる方向)順番に「第1主成分、第2主成分」と呼びます。正反対に分散が少ないということは、大きな特徴を持っていない、あまり意味がない主成分と考えられます。つまり、最もデータの説明力が大きいのが「第1主成分」ということになります。ここで説明力の小さい主成分を捨て、使う特徴量を少なくすることで、AI分析をより効果的に実践させるという数学(統計学)手法です。
かいつまんで申しますと「何でもかんでもデータを機械学習にかけるのではなく、あまり重要でないデータは取り除き、少ない情報量で機械学習をかけましょう」という考え方です。

このPCA手法はかなり標準的な手法です。実際の企業のデータ(実データ)で検証を行った場合、想像している以上に色々とありますので、何度も検証していく必要があることでしょう。これらを自動的に行う仕組みを構築し、幾度の検証を繰り返してモデル精度を高めていくのです。
料理のレシピを「モデル」、そして分析結果を出てきた「料理」と例えると、砂糖や塩の量はあらかじめ決まっていたとしても、ぐつぐつと時間をかけて煮込むことで、より美味しい料理ができあがるいったイメージでしょうか。

アカデミックで使用されるデータ・セットはある意味正規化され、つまり、データが整っているので、きれいな結果が出るようになっています。ただし、実際の生きたデータは都合よくきれいに整っているわけではありません。むしろ、そこが機械学習の醍醐味であり、非常に面白い部分なのです。
モデルの話は、難しくなりますので、このあたりで終えたいと思います。

我々は次の新たなミッションを挑戦しております。
顧客にとってAIを使うことを目的としているわけではありません。あくまでも手段なのです。

出てきた結果に対して、どのように解釈すればいいのか、いわば、医者の所見のようなことが求められるわけです。レントゲン技師からの所見もあれば、担当医師からの所見もあるように、この所見は必ず一定の法則性があると思っております。もちろん新種、もしくはまったく今までにないようなこともあるかもしれません。
しかし、この所見の部分で共通化できる部分は自動化にしていくといった繰り返しの行為が、AIプラットフォームの精度を上げていくことが重要です。そして、我々は誰もが納得して使えるAIプラットフォームになってくれることを目指していきたいと思っております。

今回は1つのレシピ(モデル/アルゴリズム)を実装しましたが、他にも面白そうなレシピがたくさんあります。
コグニロボのウェブサイトは、このレシピを開発して下さるエンジニアと、そのモデルを実際に使ってみたいと思う企業のマッチングサイトを目指しております。このプラットフォーム上には、検証済みのモデルのみを掲載していく、その掲載するかどうかの検証を当社が担っていきたいと考えております。

3回にわたる「AI(人工知能)プロジェクト」のブログシリーズは、今回でいったん終了とさせていただきます。
ご愛読ありがとうございました。

■最新のiPhoneの購入・機種変更なら店頭より得で、予約しやすいオンラインショップ。
機種の頭金や使わないオプションパックをつけて年間何万円も損していませんか?
オンラインショップなら故障のサポートもしっかりしていて最低限の費用。待たされることもありません。
 → ドコモオンラインショップ
 → auオンラインショップ
 → ソフトバンクオンラインショップ

最新のiPhoneを得して乗り換えるなら、
キャッシュバックキャンペーン実施中!【おとくケータイ.net】
がお得です。

以下の記事も読まれています。