WEBVTT

00:00.240 --> 00:02.460
こんにちは､ このチュートリアルにようこそ｡ 

00:02.490 --> 00:07.800
さて､ それではいよいよ最初のAIを作りましょう｡ 今はまだAIクラスで命令のマニュアルを作っただけで､

00:07.800 --> 00:12.090
オブジェクトは何も作っていない状態です｡

00:12.090 --> 00:17.490
このAIクラスのオブジェクトを1つ作成するところでしたので､ まだ実際のAIはありませんが､

00:17.490 --> 00:20.220
今まさに手に入れようとしているところです｡

00:20.220 --> 00:25.260
そしてこの物体は､ 脳と身体を持つAIに他なりません｡ 

00:25.650 --> 00:25.980
わかりました｡ 

00:25.980 --> 00:26.960
では､ こうしてみましょう｡ 

00:26.970 --> 00:32.340
クラスですべてを定義したので､ 実はとても簡単なことなのです｡ 

00:32.340 --> 00:38.550
というのも､ AIを作るときには､ 見ての通り､ 脳をインプットする必要がありますが､

00:38.550 --> 00:42.180
同時に身体もインプットする必要があるからです｡

00:42.180 --> 00:44.040
そこで､ ボディも作成する必要があります｡ 

00:44.040 --> 00:50.640
そして､ 脳のオブジェクトと体のオブジェクトを作ったら､ まあ､ AIを作ることになるのですが､ 心配は無用で､

00:50.670 --> 00:54.000
脳と体を懐中電灯で作っていきます｡

00:54.000 --> 00:55.620
そして実は､ 今すぐにでも実行しましょう｡ 

00:55.620 --> 00:57.000
まずは脳から｡ 

00:57.000 --> 01:02.550
脳は畳み込みニューラルネットワークであり､ CNNクラスのオブジェクトとなるため､

01:02.550 --> 01:05.490
脳をCNNと呼ぶことにする｡

01:05.490 --> 01:07.470
だから､ CNNと呼ぶのは理にかなっている｡ 

01:07.590 --> 01:14.870
そこでCNNイコール､ そして今回のCNNクラスを､ カッコの中に､ 曰く付きで入力します｡ 

01:14.880 --> 01:20.460
さて､ 今の時点では､ クラスのオブジェクトを作るときに入力しなければならないのは､

01:20.460 --> 01:25.710
ごく単純にinit関数の引数で､ それはナンバー・アクションなんです｡

01:25.710 --> 01:30.750
そして､ 以前ズーム環境を取得したときに行ったことのおかげで､ すでにこの数字アクションがあるので､

01:30.780 --> 01:37.920
ここに数字アクションをCNNクラスに入力するだけでいいのです｡

01:37.920 --> 01:38.790
完璧です｡ 

01:38.790 --> 01:40.140
だから､ 今は脳があるんです｡ 

01:40.140 --> 01:42.030
さあ､ バディを作ろう｡ 

01:42.330 --> 01:47.370
self max bodyクラスのオブジェクトを作成し､ このオブジェクトをsoft

01:47.370 --> 01:51.180
max bodyと呼んで､ AIのボディとします｡

01:51.180 --> 02:05.790
そして､ このオブジェクトはソフトマックスバディクラスのオブジェクトで､ ソフトマックスボディクラスのinit関数の唯一の引数である温度tを入力する必要があるので､

02:05.910 --> 02:10.410
ここではtを入力しています｡

02:10.410 --> 02:11.760
だから､ tは等しい｡ 

02:11.760 --> 02:17.580
そして､ まずは小さな温度のものから始めますが､ これはとても効果的かもしれません｡ 

02:17.580 --> 02:20.340
そして実は､ これがとてもうまくいくことをすでに知っているのです｡ 

02:20.340 --> 02:23.520
だから､ でも､ 他の温度でも試してみてください｡ 

02:23.520 --> 02:27.690
その仕組みがわかったからこそ､ 自分の行動がより確かなものになる｡ 

02:27.690 --> 02:32.730
つまり､ Q値が最も高い行動は選択される確率が高く､ それ以外の行動は選択される確率が低く､

02:32.730 --> 02:38.250
したがって探索も少なくなる｡

02:38.250 --> 02:40.500
でも､ とにかく1つから始めればいいんです｡ 

02:40.560 --> 02:43.080
これで､ いい体が手に入る｡ 

02:43.900 --> 02:44.410
わかりました｡ 

02:44.410 --> 02:49.300
これでブレーンができて､ バディができたわけですから､ そろそろ決勝戦にしましょうか｡ 

02:49.300 --> 02:50.610
結局､ 私が｡ 

02:50.620 --> 02:54.610
では､ これからどのように物事がシンプルになっていくのかを見ていきましょう｡ 

02:54.610 --> 02:56.860
直感がピークに達したときです｡ 

02:56.860 --> 03:03.850
AIを作るには､ eyeクラスから､ もちろんeyeと呼ぶオブジェクトを作るだけでよい｡ 

03:03.850 --> 03:10.180
そして､ 目は脳と身体で構成されているので､ 畳み込みニューラルネットワークである脳はもちろん､

03:10.180 --> 03:17.680
対象物とソフトマックスボディに他ならない身体を入力します｡

03:18.700 --> 03:21.190
ソフトマックの本体クラスのオブジェクト｡ 

03:21.190 --> 03:30.340
そして､ ほら､ 脳と体をインプットするだけで､ 懐中電灯の中にAIを作り､ 今すぐにでも訓練できるAIが完成したのです｡

03:30.340 --> 03:38.740
だから今こそ､ 経験を積んだ深い畳み込み学習のプロセス全体を立ち上げ､ 10ステップで適格なトレースのそのボーナスを再生する時です｡

03:38.740 --> 03:43.660
そして最終的には､ これらが揃ったところで､ AIを訓練して賢くしていくのです｡ 

03:43.750 --> 03:45.820
だから､ 早くやりたいです｡ 

03:45.820 --> 03:51.190
次のセクションでは､ 経験リプレイの設定について説明します｡ 自動運転車のように､ 何度も繰り返し実装する必要がないように､

03:51.190 --> 03:56.770
すでに実装されていることを良いことに､ このセクションは進んでいます｡

03:56.770 --> 03:57.880
だから早いでしょう｡ 

03:57.880 --> 04:03.280
この体験リプレイファイルの中にあるリプレイメモリークラスでオブジェクトを作成するだけです｡ 

04:03.280 --> 04:09.550
そのため､ 私たちは新しいこと､ そして最も重要なこと､ つまりトレーニングに素早く取りかかることができます｡

04:09.760 --> 04:13.750
では､ 次のチュートリアルで攻略していきましょう！それまでは､ お楽しみにI｡ 
