潜入・人工知能学会①|「インタラクティブ情報アクセスと可視化マイニング研究会」に参加してみた ~riceman’s view編

潜入・人工知能学会①|「インタラクティブ情報アクセスと可視化マイニング研究会」に参加してみた ~riceman’s view編

去る3月4日、人工知能学会が主催するイベント『インタラクティブ情報アクセスと可視化マイニング研究会』の第15回発表会に参加してきました。
<参照:sigam『インタラクティブ情報アクセスと可視化マイニング』>

開催場所はなんと日本の最高学府、東京大学っ!!

これまで幾多のセミナーには参加してきましたが、このような研究会への参加は初体験。そして赤門ではないものの、天下の東大の校門をまたぐのも初めて。

 果たして私たちが参加することで得られるものはあるのか?
 そもそもにして、理解が難しいのではないか?

様々な懸念が頭をよぎりましたが「知らぬは一生の恥」の精神でいざ参加!!
結論から言えば「思ったほど難しい内容ではなく、思ったより実務的な内容」といった印象でした。

これはみなさんに共有せねば……ということで、今回はこの研究会で発表された内容の中で、ricemanの心に刺さった発表内容を抜粋して4つご紹介させていただきます。

<編集部より>
「riceman」同様、本研究会に参加した「岡村 公平」の記事も週明け公開です。併せてご一読ください。

心に残ったテーマ①『分散表現を用いた有害表現判別に基づく炎上予測』

<参考資料:http://must.c.u-tokyo.ac.jp/sigam/sigam15/sigam1501.pdf

このチームの研究テーマは『SNS上で投稿される悪口などの書き込みから事前に炎上が起こりそうな投稿を機械学習を用いて予測する』というもの。

なお、このチームが実践している機械学習での学習方法は「Word2Vec」を用いているそうです。
まず「Word2Vec」とは、単語をベクトル空間上に置き換えることで、近い意味(ベクトル上近い距離)の言葉を探し出したり、「男→女」や「王→女王」のような似たような向きの情報を調べることのできるニューラルネットワークのことを意味しています。

本発表でとても面白かったのが、評価実験においてうまくいかなかった部分も共有してくれる点。
今回の仕組みも「wwwww」などのネットスラングをうまく検知することができなかったということですが、とても良い提案だなぁと思いました。

心に残ったテーマ②『データマイニングとテキストマイニングの連携によるデータ分析支援』

<参考資料:http://must.c.u-tokyo.ac.jp/sigam/sigam15/sigam1503.pdf

コチラのチームの発表テーマは『データマイニングとテキストマイニングは今まで別々に扱われていたけど一緒にしたらもっとより良くなる!』というもの。
今回はお見せできませんが、実際のデモ動画を見てみたらめちゃくちゃ面白い!!

例えばこんな表があるとしましょう。何かの商品のレビューだと思ってください。

ID性別評価コメント
114小さくて使いやすい
225お風呂場で使えそう
324音が静か
414置き場所に困らない
525バスルームに重宝しそう
............

これまではこの表で言うところの、「評価から左」と「コメント」の部分を分けて扱われることが多かったのですが、合わせて考えることで以下のような点も見えてきます。

  • 大前提として評価が「4」以上のものに絞り込まれている
  • 単語の出現頻度を見てみると「コンパクト」や「お風呂場」が多い
  • 5の評価の人の性別を見てみると「女性」が多い

これらを関連付けて見ると、「お風呂場で女性が使う商品」としてもっと良いものができるのではないか、といったリサーチがソフトウェアで直感的に操作できるというものです。

実際には、こんなにちゃんとした形式のデータを扱っているケースは少ないのですが、これをSNSやAmazonからとることができたら面白い展開も期待できますね。
それにしても、みなさんにこのデモ動画を見せてあげたかった……。

心に残ったテーマ③『密度に基づく時空間分析システムにおける 学習済み深層ネットワークを用いた画像分類』

<参考資料:http://must.c.u-tokyo.ac.jp/sigam/sigam15/sigam1505.pdf

あなたにおすすめ

『coremltools』を使って「Keras」で作った学習モデルをコンバートしてみた... ricemanさん執筆の記事を読んでいたら、急な無茶振りが飛んできた “新人開発員・中村くん” こと、紅孔雀です。 今回の記事がbitWave初投稿。ナマ暖かい目で見守って下さいませ。 iOSで「Keras」のモデルを動か...
『iOS11』新搭載の「Core ML」を駆使してMNISTの手書き数字認識を試してみた... 今回もありましたね~、Apple社主催カンファレンス「WWDC2017(※注釈)」 ※World Wide Developer Conference:Apple社が毎年開催するデベロッパー向けイベント 新製品の「HomePod」を始...
Udacity「自動運転車エンジニアコース」で今時のプログラムを学ぶ!... 「みなさ~ん、お元気ですか?」 これは昭和から平成へと元号が変わろうとしているタイミングで放映された、クルマのテレビコマーシャルで使われていたフレーズです。 若者のクルマ離れは周知の事実ですが、それに合わせてクルマにまつわるテレビコ...
勝手にIT業界流行語大賞2016 年末の慌ただしい中、皆様いかがお過ごしでしょうか? さて、今回はIT業界ハードウォッチャーのricemanが、“独断と偏見”によって『IT業界専用の流行語大賞』を作ってみました。 みなさんが想像する“神ってる”キーワードはあるの...