みんなAIについて誤解してませんか?

ニュースを見ていると「AI」「人工知能」「機械学習」といった言葉が氾濫し、なにか「AI」が完成の域に達しつつあり、それを導入すれば、人間ができないようなことが、いとも簡単に出来るようになるとという風潮を感じる。

 

確かに、最近のAI技術の発展は著しいものがあるし、応用範囲も広がってきていて面白い。しかし僕の理解では、「AI」はまだ、よちよち歩きの段階で、なんにでも応用できる状況ではないし、実際に導入するにあたっては課題も多い。

 

今、話題のAIって何がすごいの?

過去にAIブームは何度かあった。現在は、第3次AIブームと言われていて、GoogleのAlpha Goが囲碁の世界王者を倒したことから注目を集めている。

技術的な詳細は、別途の纏めようと思っているが、主に情報処理性能の向上とディープラーニング(深層学習)という技術を用いることで、特徴量の抽出を自律的に出来るようになったことが大きなを進展だと理解している。

 

従前は、情報処理の判断基準を人間がプログラムに記述し、あとは力任せに総当たり的な分析を行うことで正解を探すというのが主流であった。しかし、ディープラーニングという技術を用いることで、人間が判断基準を教えてあげる必要なく、データを与えれば、自分で学習し理解できるようなった。

 

特徴量の抽出ってなに?

画像認識を例に説明しよう。「イヌ」という概念は、皆、普通理解しており、イヌの画像をみせれば、イヌだと分かる。しかし、イヌかイヌでないかの判断根拠を言葉で説明しろと言われても、ちょっと困る。

 

イヌという画像には、何等かのイヌ的な特徴があって、それを認識しているので、イヌと判断されるのであろう。アリストテレスのイデア論に近いが、イヌという特徴(=イデア)を、経験的に、なんとなく理解している。

 

今までの人工知能では、画像認識をさせる場合、事前に「目と鼻の角度は●度で、色は●~●で、耳の形状は・・・」といった判断基準の記述が必要だった。それは、印刷されたアルファベット程度であれば、何とかできたかもしれないが、色も形も向きも態勢も異なるような画像データでは非常に困難であり、できたとしても、膨大な判断基準の入力が必要であった。

 

しかし、ディープラーニングを使って、多くのイヌとイヌ以外の画像データを見せることで、AIは、イヌとイヌ以外を区別する「特徴」を徐々につかみ取っていく。そして、何がイヌっぽくて、なにがイヌっぽくないのかが、分かるようになる。

 

これを応用すると、人間が認識できていないような特徴量も抽出することが可能となる。

例えば、膨大すぎて人間が処理しきれないようなデータも、AIなら力業で乗り切れるので、今まで人間では気付けなかった関連性などを発見することも期待されている。

 

なお、データの提供は必ずしも最初に与えなくても良くて、場合によっては、試行錯誤を行って失敗したりうまく行ったりしながら、経験を重ねることで、正しい結果を導き出せるようになるというやり方もある。

 

なんだか、人間ぽいですね。

 

AI活用の切り口

では、AIを使えば、何ができるのだろう?

僕は、AIを活用することで得られるメリットは、大きく「自立学習」「特徴抽出」「大量処理」の3点だと考えている。

 

自律学習

事前に人間がプログラミングすることなく、自分で必要な判断基準、動作基準などを学ぶことができるロボットやシステムの構築が可能となる。

  • 様々な環境に柔軟に対応しやすいロボットを作ることが可能となる
  • ロボットやシステム導入の初期コスト、カスタマイズの負担が減る
  • 環境や状況の変化にも柔軟に対応が可能となる
  • 自主的に効率的な作業法などを発見することが可能となる

 

特徴抽出

人間では処理しきれない膨大なデータのなかから、今まで気づかなかった新しい特徴の発見

  • 一見関係が無さそうな、複数の疾患の関連性の発見
  • レントゲン写真での疾患の発見
  • 薬物の分子構造から、作用の推定
  • 投資において、新しい投資手法の開発、掘り出し物の発見
  • なにげない行動・兆候から、犯罪リスクや倒産リスク等の発見

大量処理

必ずしもAIそのものの強みではないが、高度な判断力を有するAIにより、従来は人間がやらざるを得なかった判断を大量に行うことが可能になる

  • 大量のメールの中から、違法なやり取りを発見
  • 大勢の人のなかから、特定の人を見つける
  • 大量の事務処理
  • 大量の文献の中から、必要な文献の抽出
  • 特定の情報から、必要な情報を再構成して提供

 

まだまだ多いAIの課題

ここまで見ると、非常にAIというものは万能な感じがするかもしれないが、以下のような課題も多数残っており、これらの点が他分野での実用化のハードルになっている。

 

学習するためのビッグデータの必要性

一定の分野では、試行錯誤さえせて、自律学習させることで効果を得られる分野もあるが、多くの分野では「学習用のデータ」の用意が必要である。そして、その学習用データには、分析対象となる「入力データ」と、得たい結果である「解答データ」がそろっている必要がある。

 

例えば、画像を沢山あつめても、それが、イヌなのか違うのかがわからなければ、学習用データとして役に立たない。また、解答に誤りがあると、誤って学習させてしまうことになる。

また、用途にもよるが、数万~数百万単位のデータがないと、判断の正確性が上がらない場合もあり、これらのデータが揃っている分野は必ずしも多くない

 

ビッグデータの選択

そもそも論として、AIに学習させるデータを、人間が選択してあげているという問題がある。

画像の学習なら、画像データの塊。囲碁の学習なら棋譜データの塊。。。。画像認識のように、判断材料が決まっていたり、囲碁のように、ルールが決まっているものであれば、あまり問題起きないのだが、そういう状況はそんなに多くはない。

 

日常生活の中では、多くの場合、「総合的な判断」を求められるケースが多い。その場合、用意したデータでは適切な学習には不十分だというケースがあり得る。

例えば、敏腕トレーダーの投資判断は、おそらく単に市場データ、金融ニュース、企業業績を見て判断しているわけではないだろう。ちょっとした同僚との会話、無関係そうなニュース、通勤時の街中の様子、子供から聞いた流行、世間を取り巻くなんとなく重たい・浮かれた雰囲気なども、無意識に投資判断に採用しているものと考えられる。

また、自然言語の理解も、単に言葉だけではなく、その場の状況、声色、顔色、文脈、話題の頻度なども考慮に入れられて解釈されるであろう。

 

となると、人間がAIに与える情報は、人間がこれが必要情報と仮説を立てたものに限定されてしまい、正確な判断に本当は必要とされる情報が欠けてしまっているケースがあり得るだろう。

 

過剰適合(Over fitting)の問題

AIを学習させるとき、学習用データを用いて正解率を上げていき、そうすることで、新規データにおいても正確な判断ができるようになることを期待するのがが一般的である。

しかし、学習用データに対する適合度を上げすぎてしまうと、本来判断には不要なノイズなどにも最適化してしまい、そのことで、実際に活用する際のデータでは正解率が落ちてしまうといったことが起きる。過剰適合(Over fitting)、過剰訓練(Over Training)の問題ともいわれる

 

過剰適合のイメージ。縦軸が誤答率、右軸が学習量。青線は学習用データでの成績、赤線は実データに適用した時の成績。
学習しすぎることで、実際に運用する際のパフォーマンスが悪化する。

 

また、過去のゲームのルールが必ずしも将来のゲームのルールには当てはまらないことも多々ある。少なくともルールが変わったという判断が必要になるケースがある。そんなとき、とても対応できないのが現状だ。

リーマンショック前のデータで投資判断をしても、リーマンショック後では通用しない。

 

AIはまだまだこれからなんです

僕個人的には、AIには、まだまだもう何段階かのブレークスルーが必要だと思っています。少なくとも以下の3つのポイントで進展が必要だと思っています。

 

様々な情報へのアクセス

人間を超える判断ができるようになるには、人間による提供データの選択というプロセスを経ない仕組みが必要だ。

そのためには、AIが、自律的に多くの情報・ビッグデータにアクセスできる環境や能力が必要となってくるだろう。それらは、かならずしもコンピュータ上、ネット上の情報に限らず、目や耳のような、外界からの情報が得られる感覚器が必要になってくると思われる

 

少ない情報での判断力の向上

人間をはじめとする動物には、かなり少ない情報から、比較的精度の高い判断を行っている。

馬は何回か転んで、立ち上がり走れるようになる。子供は限られた環境のなかで言語を理解するようになる。

おそらく、本能にプログラムされているのだろうが、ビッグデータといった情報量を必要としていない。そこには、何らかの形で効率的にウェイト付けができる仕組みがあるはずだ。

Alpha Goは、過去の10万局の棋譜を学習し、対局を300万局実施したという。一方、トップ棋士であっても棋譜で学習するのはせいぜい1~2万局、対局経験などは数千ぐらいであろう。

 

やはり人間には、少ない情報からより精緻な学習・判断の導出というメカニズムがあるのだと思ってならない。

 

消費エネルギーの削減

Alpha Goがトップ棋士と戦った際、Alhpa Goの消費電力は25万ワットだそうだ。対するトップ棋士は電力換算で20~25ワット程度。エネルギー効率では、人間が1万倍も効率的である。

これは、単に情報処理量に差があるだけではなく、脳が効率的な情報処理システムとして設計されている証左であり、新しいタイプのハードウェアの仕組みがあり得ることが予想される。

スポンサーリンク

スポンサーリンク


コメントを残す