AIに手を出す前に-ディープラーニングとは?

こんにちは。株式会社インフォファームの西部です。昨今、「AI」という言葉を目にしない日は無いくらいAIブームですね。「Chat GPT」はまるで人と対話しているような形式で結果を返してくるので、ウケも良いです。 今回は、「AI」という言葉について、掘り下げて考察してみたいと思います。

「AI」とは何ものなのか?

ところで、普段何気なく使っている「AI」もしくは「人工知能」という言葉は、どこまで理解して使っていますか?実は、これは、ものすごく曖昧な言葉なのです。「AI」と聞いて、"人間と同じような知的な処理をする機械(情報処理システム)"なんだろうという点においては、多くの人にとって共通の認識です。では、明確な定義はどうかというとこになると、いまだに定義がありません。「AI」という言葉が初めて使われたのは1956年ですから、今から70年近く経っているにも関わらずなのです。 定義が無いということは、ある技術を使っていなければならないとか、あるタスクができなければならないといった明確な基準がないということでもあります。つまり、内部的に古典的な手法で制御していたとしても、使う側にとって人間っぽい動作と思わせることができるなら「AI」と呼ぶことができる、ということになってきます。「AI」という言葉を目にした時、人の目を引くために使われているケースがあり得るので、注意した方がいいでしょう。

「ディープラーニング」とは?

エンジニアとして「AI」のことを調べていくと、「ディープラーニング」もしくは「深層学習」という言葉が出てきます。この「ディープラーニング」とは、「AI」つまり人間っぽい感じで予測をしたり認識をする為の手法の1つのことです。 「ディープラーニング」の基礎技術として「機械学習」というのがあります。これは、大量のデータを与えて、データの傾向や特徴を見つけ出させておいて、未知の値に対して当たらずも遠からずの値を予測させる技術です。古典的な予測システムは、頭の良い人が試行錯誤を繰り返しながら計算式をつくって予測することをしますが、機械学習では生のデータを大量に与えて計算式を作らせることになります。ディープラーニングは、この機械学習の仕組みを何重にも積み重ねて、より高度な判断ができるようにしたものです。 流行りのchatGPTもディープラーニングの技術をベースにしています。つまり、現時点のAIに人間的な感情や価値観がある訳ではなく、大量のデータの最大公約数を吐き出しているに過ぎないと言うことができます。

ディープラーニングに飛びつく前に

ここまでで述べたように、ディープラーニングをベースにしたAIシステムは万能なツールではないということはご理解頂けたのではないでしょうか?AIに未来を予測させようとした場合、大量の過去データを用意する必要があるし、最大公約数を求めるにはふさわしくない値を除外したり、文章の中からキーワードを抽出してコンピューターが扱える形式に変換(例えば数値化)するなどの事前処理も必要になってきます。そして、このように苦労して集めた過去データをディープラーニングにかけてAIモデルを作ったとしても、思い通りの結果が得られないこともあり得ます。
じゃあどうするのか?まずは、目の前にあるデータを統計学的な視点で解析してみると何かが見えてくるかもしれません。例えば、3要素までなら3次元のグラフにプロットすることができます。もっとたくさんの要素がある場合でも、主成分分析という手法で要素の数を削減することもできます。このようにして、データを眺めて見ることは傾向と対策を判断する上で、とても重要なアプローチです。 総務省統計局のHPに「なるほど統計学園」というコーナーがあります。Excelでグラフを作図する手順なども書かれていますので、参考にしてみるのも良いでしょう。

まとめ

「AI」という言葉に明確な定義はない。 AIシステムのベースには、「ディープラーニング」という技術が使われている。 ディープラーニングは大量のデータが必要になる。 AI・ディープラーニングの前に、統計学的な視点での分析が重要である。