P1

 AI(人工知能)論議が喧しい。その1冊を世に送り出そうとしている私が言うのは少し変ですけれど、巷間にはAI本が溢れています。
 曰く、「AIが神になる」、「AIが人類を滅ぼす」、「シンギュラリテイが到来する」――。そんな扇情的なタイトルを目にするたびに、私は突っ込みを入れています。
 「AIが神になる?」――なりません。「AIが人類を滅ぼす?」滅ぼしません。「シンギュラリテイが到来する?」――到来しません。

 P2

 AIは神に代わって人類にユートピアをもたらすことはないし、その能力が人智を超えて人類を滅ぼしたりすることもありません、当面は。当面と言うのは、少なくともこの本を手に取ってくださったみなさんや、みなさんのお子さんの世代の方々の目の黒いうちにはということですが、AIやAIを搭載したロボットが人間の仕事をすべて肩代わりするという未来はやって来ません。それは、数学者なら誰にでもわかるはずのことです。AIはコンピューターであり、コンピューターは計算機であり、計算機は計算しかできない。それを知っていれば、ロボットが人間の仕事をすべて引き受けてくれたり、人工知能が意思を持ち、自己生存のために入類を攻撃したりするといった考えが、妄想に過ぎないことは明らかです。

 P31

 次に、A工にイチゴを教えます。そのために、AIに「これがイチゴだよ」と教えるデータを作ります。それを「教師データ」と呼びます。どの画像に何が写っているかラベルをつけたものが教師データです。つまり、イチゴが写っている画像に「イチゴ」というラベルをつけるわけです。画像にはさまざまなものが写っている場合が多いので、画像のどの部分に何が写っているかも含めてラベルをつけます。教師データは基本的には人間が作ります。ですから、教師データを大量に作るにはとてつもない労力と資金が必要です。精度を求めるには、万単位のデータが必要だからです。一般物体検出では、スタンフォード大学の研究グループがイメージネットというデータを整備しました。世界中の研究者がそれを活用して精度を競っています。これでようやく機械学習をする準備が整いました。
 デジタルの世界では、画像も「どの位置に、どの色が、どの輝度で写っているか」を「0、1」で表現します。膨大な「0、1」の列ができます。これをピクセル値行列と言います。その上下左右関係から、どんな要素が写っているかを把握します。種と実の色や輝度のコントラスト、種からできる影など、できる限りの特徴を検出し、それがイチゴであると判断する上でどれほど重要な要素であるかを、イチゴが写っているデータとそうでないデータから数値化します。それぞれの特徴に「重み」をつけるのです。たとえば、実の赤さと緑のヘタとのコントラストの重みは0.7で、種と実のコントラストは0.5というように。重みを調整していく過程を「学習」と呼びます。
 機械学習では、コンピューターが与えられたデータを繰り返し学習することで、そのデータの中にあるパターンや経験則、そしてその重要度を自律的に認識します。特に、画像は部品である特徴量の、比較的単純な足し算で表現できます。ここが重要なポイントです。特徴量の総和が大きければ大きいほど、「イチゴらしさ度」が高まり、ある基準を超えるとイチゴだと判断すれば大体当たるのです。

 P33

 熟練工のようなエキスパートが特徴量を設計していた機械学習の効率を画期的に飛躍させたのがディープラーニング(深層学習)です。ディープラーニングでは、どの特徴に目を付けるべきかということ自体を、機械(AI)に検討させます。マシンパワーをふんだんに使った力技のようなものです。デイープラーニングでは、単純な総和ではなく、特徴量をいくつか組み合わせて、「丸い」とか、「放射状」などのやや抽象的な概念を表し、それがどのように画像に含まれているかを何段階かで判断します。こうすると、直感頼みだった特徴量の設計が自動で最適化できるようになります。実際に、それでデイープラーニングは、短期間で物体検出の飛躍的な精度向上を実現したのです。

 P34

 他にも画像には特異な性質があります。たとえば、イチゴは画像のどこに写っていてもイチゴです。真ん中に写っていたらイチゴだけれど、右上に写っていたらバナナだということはありません.回転しても拡大縮小してもやはりイチゴはイチゴで、解像度を下げてもやはりイチゴです。何を当たり前なことを、と思われるかもしれませんが、ここがとても重要なのです。膨大な教師データを作成しようとすると、普通ならとてつもないコストがかかります。でも、画像の場合は、「枚の教師データを回転したり拡大縮小したりすることで、教師データの数は一気に増えます。業界ではこれを「水増し」と呼んでいます。お得です。
 デイープラーニングは、「大量のデータを与えればAI自身が自律的に学習して人間にもわからないような真の答を出してくれる仕組みのことだ」と誤解されていることが多いようですが、そんな夢のようなシステムではありません。一定の枠組み(フレーム)の中で十分な量の教師データを準備すると、これまで人間が手作りで試行錯誤していた部分も含めてAIがデータに基づき調整することで、伝統的機械学習に比べて、低コストでそれと同等か上回る正解率に達しやすいのです。夢のような誤解をすることの危うさを、少しはおわかりいただけたでしょうか。

 P35

 目的や目標と制約条件が記述できる課題では、こうした強化学習による最適化がうまくいくことがあります。自動車に「なるべく早く目的地に到着する」という目標を与え、「障害物にぶつからない」という制約条件を与えて、勝手に試行錯誤させる。すると、最初は衝突したり、動けなくなったりしていたロボットカーが、やがて秩序を維持して動くようになっていくのです。他にも、巨大プラントのエネルギー効率を最適化するというような課題が強化学習に適しています。

 P36

 「いつの日か、教師データを作ったり、目的や制約条件を設定したりという作業から人間は解放されますか」とよく尋ねられます。省力化はされるかもしれませんが、完全に解放されることはないと思います。AIやロボットは「人間社会で」役立つように作られる必要があります。「役に立つとは何か」を知っているのは、人間だけです。ですから、人間がなんらかの方法で正解をAIに教えなければなりません。

 P50

 人間であれば、それを見つければ、答を見つけたのと同じですが、AIにはそこからまた一仕事残っています。なぜなら、AIには文章が読めないからです。

 P83

 数式処理だけではありません。自然言語処理では、そもそも何を計算すればよいのかがわからないような問題が山積みです。つまり、どれもこれもスパコンを使えば計算できるという類のものではありませんでした。その意味で、「スパコンの能力が向上しさえすれば、人聞の知性を超えられる」というのは出鱈目です。量子コンピュターを使っても状況は変わりません。たとえて言うなら、すべての英単語を憶えても、なければ、英語を読んだり話したりできないのと同じです。

 P84

 物凄いスパコンが登場したら、あるいは量子コンピューターが実用化されたら、「真の意味でのAI」ができる、とか、シンギュラリテイが到来するという人がどうしてこんなにたくさんいるのか、以前から不思議でなウませんでした。1秒間の演算処理の回数と知性に、科学的な関係があるとは思えないからです。
 なぜ、そのような誤解が生まれているのか、最近、理由が少しわかったような気がしま
した。頭の良い人のことを、「頭の回転が速い」と言いますよね。それは、単なる言葉の綾に過ぎません。ですが、それを科学的な事実だと誤解すると、「1秒間の演算処理回数11頭の良さ」と思い込んでしまう。しかも、一部の研究者やメディアが「デイープラーニングは人間の脳を模倣したものです」という安易な解説をする。その結果、「スパコンでディープラーニングすれば超頭のいい人と同じ」と早合点する人が増えてしまったのではないでしょうか。

 P105

 東ロボの価値はまさにここにあるのです。英語チームが経験したような「失敗」は論文に掲載されることはありません。ニュースで取り上げられることもありません。取り上げられるのは、ディープラーニングがうまくいったときだけです。でも、あなたの会社にとって有用なのは成功の情報だけでしょうか。どれだけ投資してもディープラーニングはうまくいかない、という情報こそが今まさに喉から手が出るほど必要なのではありませんか。東ロボはあなたの代わりに、身を切ってそれを実証して公開したのです。

 P107

 けれど、AIは意味を理解しているわけではありません。AIは入力に応じて「計算」し、答を出力しているに過ぎません。AIの目覚しい発達に目が眩んで忘れている方も多いと思いますが、コンピューターは計算機なのです。計算機ですから、できることは基本的には四則演算だけです。AIには、意味を理解できる仕組みが入っているわけではなくて、あくまでも、「あたかも意味を理解しているようなふり」をしているのです。しかも、使っているのは足し算と掛け算だけです。
 AI(コンピューター)が計算機であるということは、AIには計算できないこと、基本的には、足し算と掛け算の式に翻訳できないことは処理できないことを意味します。ですから、AI研究者は、世の中のあらゆることを、たとえば、画像処理をするための方法を、質問に応答する方法を、あるいは英語を日本語に翻訳する方法を数式で表そうとして、日々、頭をフル回転させているのです。

 P111

 天文ビッグデータを用いることで、その年の作柄から、生まれた皇子の運まで、すべてを予測したいと熱望したハプスブルク家の姿は、私には、数学とは何かを理解せずに「ビッグデータでAIが実現できる」と信じる人々の姿に重なって見えます。

 P117

 そこで、次善の策として、観測可能な情報(アンケートなど)と過去のデータからそこに潜む規則性をなんとか見出そうとするのが統計なのです。未来の予測に役立てるのです。確率と統計は似ているようですが、アプローチの仕方がまったく反対です。確率は理論から結果を予測しますが、統計はデータが先にあって、データの分析で仮説を見つけるのです。 数学は4000年の時間をかけて、論理、確率、統計という表現手段を獲得しました。けれども、反対の言い方をすると、数学が説明できるのは、論理的に言えることと、確率.統計で表現できることだけだということです。つまり、先述のとおり、数学で表現できることは非常に限られているということです。
 論理、確率、統計。これが4000年以上の数学の歴史で発見された数学の言葉のすべてです。そして、それが、科学が使える言葉のすべてです。次世代スパコンや量子コンピューターが開発されようとも、非ノイマン型と言おうとも、コンピューターが使えるのは、この3つの言葉だけです。

 P118

 数学には超越数という概念があります。たとえば、「X2乗+5X+6=0」のような多項式の方程式の解にはならないような実数のことです。円周率πや自然対数の底であるeは超越数です。超越数は、そうでない数に比べると途方もなく膨大に存在することが理論的にはわかっています。けれども、πやeとそれらの組み合わせ以外の超越数はほとんど見つかっていません。「πやeは神様が作った特別の数だから」などと中世の数学者のようなことを言う人がいますが、多分そうではありません。単に、超越数を発見するための数学の言葉が圧倒的に足りていないのだと思われます。

 P119

 いかがでしょうか。少しは、数学とは何かについて、理解する助けとなったでしょうか。数学は、論理的に言えること、確率的に言えること、統計的に言えることは、実に美しく表現することができますが、それ以外のことは表現できません。人間なら簡単に理解できる、「私はあなたが好きだ」と「私はカレーライスが好きだ」との本質的な意味の違いも、数学で表現するには非常に高いハードルがあります。これが、東ロボくんの成績が伸び悩んでいる根本的な原因だと言えるでしょう。

 P120

 たとえば、「この近くのおいしいイタリア料理の店は」と、訊いてみてください。Siriは、GPSで位置情報を判断して、近くにある「おいしい」イタリア料理の店を推薦してくれるはずです。でも、それは話のポイントではありません。次に「この近くのまずいイタリア料理の店は」と訊ねてみてください。すると、似たような店を推薦します。評判の悪い店から順に表示することはありません。Siriには「まずい」と「おいしい」の違いがわからないのです。さらに、「この近くのイタリア料理以外のレストランは」と訊いてみてください。また、似たような店を推薦します。つまり「以外の」ということがわからないということです。

 P163

 コンピューターが数学の言葉だけを便って動いている限り、予見できる未来にシンギュラリティが来ることはありません。そう言うと、「夢がない」とか「ロマンがない」と批判されることがありますけど、来ないものは来ないと言うしかありません。

 P164

 つまり、「真の意味でのAI」が人間と同等の知能を得るには、私たちの脳が、意識無意識を問わず認識していることをすべて計算可能な数式に置き換えることができる、ということを意味します。しかし、今のところ、数学で数式に置き換えることができるのは、論理的に言えること、統計的に言えること、確率的に言えることの3つだけです。そして、私たちの認識を、すべて論理、統計、確率に還元することはできません。