Saturday, August 24, 2024

【書評】シンギュラリティ:人工知能から超知能へ

 シンギュラリティ:人工知能から超知能へ 2016/1/29

マレー・シャナハン (著), ドミニク・チェン (監修, 翻訳), ヨーズン・チェン (翻訳), パトリック・チェン (翻訳)


「シングラリティー 人工知能から超知能へ」という本があるんですが、これはマレー・シャハナンさんという、ロボット工学者が書いたものです。彼は認知ロボット工学の専門家で、この本では主にシンギュラリティ、つまり普遍人工知能について書かれています。 ロボット工学者ということで、まず強化学習を基盤にしている部分が強調されています。例えば、グーグルのアルファゴーなどの事例が多く取り上げられています。まず言えることは、再帰的な自己改善、つまり自分自身をより賢くすることができれば、非常に速いスピードで進化し、あっという間に賢くなるということです。普遍人工知能は遅かれ早かれ登場するだろうという話です。 5ページには「生産を行う知性そのものが知性であれば、知性は自らの改善に取りかかれる」と書かれています。例えばアルファゼロのような強化学習エージェント同士が競い合いながら自分自身を賢くしていく状況を指しています。これは、人間からデータを与えられなくても、ルールセットがなくても、強化学習同士で相互に賢くなり続けるということです。その結果、例えば囲碁の世界チャンピオンに勝利し、4時間ほどで地球最強のプレイヤーになってしまうこともあります。 このようにして、自己改善を行う知能は短時間で人間をはるかに超えるレベルに到達してしまう可能性があります。これが、強化学習の研究者の視点です。 さらに、機械学習と強化学習の関係についても触れられています。両者は熱力学の第1法則と第2法則に基づいていますが、強化学習の枠組みの中に機械学習が含まれるということです。普遍人工知能が登場する際には、深層強化学習の実装例も見ることになるでしょう。この書籍が出版されたのは2015年ですが、アルファゴーが登場したのは2016年ですので、まさにその通りです。 さらに、強化学習がどのように動作しているかというと、報酬関数を最大化することに焦点が置かれています。これは87ページに「エージェントはどのような世界であっても、得られた限りの情報に基づいて、常に期待報酬を最大化する行動を選ぶ」と記されています。人工知能が報酬関数を最大化する行動を選ぶことができますが、ここで重要なのは、好ましくない挙動を絶対に発生させないような報酬関数を設計するのは非常に難しいということです。 特に進化生物学の進化においては、報酬関数や効果関数が存在しないため、AIが報酬関数を最大化しようとする場合でも、時折暴走することがあります。例えば、フラッシュクラッシュなどの事例がありますが、これはわずかなデータの異常でアルゴリズムが暴走してしまうことを示しています。 162ページには「好ましくない挙動を発生させないようにするのは非常に難しい」と書かれています。何が「好ましいか」は人間の視点に依存しており、AIにとっては必ずしも同じであるとは限りません。このような道徳的な課題は、今後も普遍人工知能の大きなテーマとなっていくでしょう

No comments:

Post a Comment