>>369
関連(これをメモとして貼っておきます)
https://ja.wikipedia.org/wiki/Google_DeepMind
Google DeepMind(グーグル・ディープマインド)はイギリスの人工知能企業である。2010年にDeepMind Technologiesとして起業された。
2014年にGoogleによって買収された際に現在の社名に改称された。
Google DeepMindは、人間と似たようなやり方でどのようにビデオゲームをプレーするかを学ぶニューラルネットワークを作成している[3]。
また、従来のチューリング機械のように外部記憶装置にアクセスできるニューラルネットワークを作成しており、これによって人間の脳の短期記憶を模倣することがコンピュータにできる可能性があるかもしれない[4]。
Google DeepMindは、開発したプログラムAlphaGoが人間のプロ囲碁棋士を初めて破ったことで2016年に大ニュースとなった[5]。

深層強化学習
IBMのディープ・ブルーやワトソンといった予め定義された目的のために開発され、その範囲内でのみ機能するその他のAIとは対照的に、DeepMindは自身のシステムが事前にプログラムされていないと主張している。
DeepMindのシステムは、データ入力として生のピクセルのみを使用し、経験から学ぶ。
技術的には、畳み込みニューラルネットワーク上での深層学習(ディープラーニング)と新たな形式のQ学習(モデルフリー強化学習の一形式)を使用する[1][31]。
DeepMindは、ビデオゲーム、特にスペースインベーダーやブロックくずし(ブレイクアウト)といった初期のアーケードゲーム上でこのシステムを試験した[31][32]。
コードを変更することなしに、このAIはゲームをどうやってプレーするかを理解し始め、ある程度プレーした後、いくつかのゲーム(中でも特にブレイクアウト)については、どの人間よりも効率的にプレーできるようになった[32]。
しかし、ほとんどのゲーム(例えばスペースインベーダー、パックマン、Qバート)については、DeepMindは現在の世界記録を下回っている。
DeepMindのAiのビデオゲームへの応用は、現在1970年代と1980年代に作られたゲームへのものであり、1990年代初頭に初めて登場したDOOMといったより複雑な3Dゲームへ作業も行われている[32]。