WEBVTT

00:00.390 --> 00:05.320
Bonjour et bienvenue dans l’entraînement des yeux avec un kuning convolutionnel profond.

00:05.490 --> 00:06.240
C'est vrai.

00:06.240 --> 00:11.550
Maintenant que nous avons construit l'IA AI avec l'architecture du réseau de neurones, le corps, la façon dont les actions sont

00:11.550 --> 00:12.830
jouées et tout le reste.

00:12.840 --> 00:17.040
Il est temps de m'entraîner avec Cuellar convolutionnel profond.

00:17.220 --> 00:21.100
C’est donc à partir de maintenant que nous mettrons en œuvre votre expérience de replay.

00:21.210 --> 00:23.770
Travailler avec les valeurs en travaillant avec des mots.

00:24.000 --> 00:27.820
Et il y aura même un bonus qui s'améliorera beaucoup.

00:27.840 --> 00:33.870
Le processus de formation, appelé trace d'éligibilité, est une technique puissante qui consiste à

00:34.110 --> 00:41.880
accumuler le mot en plusieurs étapes. Les valeurs de cube sont apprises sur cette accumulation de mots, contrairement à

00:41.880 --> 00:46.860
celles où les valeurs de cube étaient apprises après chaque transition.

00:46.860 --> 00:52.800
Par conséquent, après avoir reçu chaque mot cette fois, nous allons apprendre les valeurs après avoir reçu plusieurs récompenses au

00:53.040 --> 00:54.480
lieu d'un seul mot.

00:54.660 --> 01:00.530
Ainsi, au lieu d’avoir une transition après l’autre et de savoir mettre à jour la valeur Q à chaque fois.

01:00.660 --> 01:07.620
Eh bien, les valeurs q vont être mises à jour à chaque étape, car l'éligibilité trace les radicaux et les étapes, le suivi, puis

01:07.710 --> 01:13.500
la fin de l'éligibilité est ce nombre après lequel les valeurs q vont être mises à jour et dans notre

01:13.500 --> 01:13.820
modèle.

01:13.820 --> 01:15.600
Ici, nous allons avoir des appels alors.

01:15.630 --> 01:21.570
Cela signifie donc que la trace d’éligibilité en 10 étapes sera mise à jour et que nous apprendrons les valeurs q toutes

01:21.840 --> 01:22.880
les 10 étapes.

01:22.890 --> 01:26.820
Après avoir accumulé les mots sur ces 10 étapes, c’est un bonus.

01:26.820 --> 01:32.400
Cela rendra notre modèle encore plus puissant et vous verrez qu'à la fin nous obtiendrons des

01:32.400 --> 01:33.180
résultats exceptionnels.

01:33.180 --> 01:36.020
J'ai été vraiment étonné quand j'ai vu le résultat final.

01:36.030 --> 01:40.430
J'avais l'habitude de travailler sur Merle qui prenait beaucoup de temps à exécuter.

01:40.430 --> 01:45.780
Vous savez que l'IA a mis beaucoup de temps à s'entraîner, mais vous le constaterez avec celui-ci ainsi que le réseau de neurones que

01:45.780 --> 01:46.640
nous avons créé.

01:46.860 --> 01:49.390
C'est notre cerveau et notre corps ici avec des trucs.

01:49.390 --> 01:55.740
Nous obtiendrons ensuite une foule très puissante et donc une IA très puissante, car vous verrez qu'elle va vraiment guérir

01:55.740 --> 01:56.600
les mensonges.

01:56.610 --> 01:59.090
Comprends-tu de quoi je parle?

01:59.370 --> 02:05.440
Comme vous pouvez le voir dans cette partie 2, nous commençons par obtenir l'environnement Dume et en préparant les

02:05.440 --> 02:06.740
lignes de code.

02:06.780 --> 02:12.790
Nous utilisons simplement le fichier externe de prétraitement d'image à partir d'un dossier de répertoire de travail.

02:12.930 --> 02:19.520
Donc, en gros, l’ordre consiste plutôt à prendre d’abord cette ligne de code qui ne la rend pas devant les tribunaux.

02:19.590 --> 02:24.450
0 0 est le nom de l'environnement du jeu auquel nous jouons.

02:24.450 --> 02:30.930
Nous importons donc d’abord l’environnement avec cette gemme qui fait que c’est ce que vous pouvez trouver sur la page ouverte

02:30.930 --> 02:31.970
et les didacticiels.

02:32.190 --> 02:40.230
Mais ensuite, nous utilisons cette classe d’image prétraitement, qui est une classe de prétraitement d’image pour pré-traiter les images

02:40.290 --> 02:45.870
qui entreront dans la nouvelle qui fonctionne. Pour rappel, c’est parce que dans

02:45.870 --> 02:54.060
notre nouveau modèle qui fonctionne bien, nous définissons nos images d’entrée de manière à ce que les moteurs de

02:54.360 --> 02:58.530
mesure aient un moteur temporel de 80 sur 80.

02:58.560 --> 03:03.490
Rappelez-vous que l’un est le nombre de canaux et qu’il signifie donc que nous travaillons avec des images en noir et blanc.

03:03.660 --> 03:06.350
Voilà donc l'échelle de gris ici.

03:06.900 --> 03:14.070
Et 80 sur 80 signifie que la dominance de nos images d’entrée sera de 80 sur 80 et c’est ce que nous définissons dans

03:14.070 --> 03:20.190
le réseau de neurones, mais nous devons bien sûr spécifier cela lors de la mise en place des images, ce que

03:20.190 --> 03:23.150
nous faisons exactement ici avec ce prétraitement. classe d'image.

03:23.670 --> 03:29.610
Et ensuite, après avoir importé l'environnement avec le bon format des images d'entrée, nous importons le jeu entier avec les vidéos

03:29.610 --> 03:34.920
avec cette ligne de code et nous nous souvenons de la chose intéressante à ce propos: nous verrons

03:34.920 --> 03:40.350
à la fin que les vidéos sont lues. Doom Nous verrons donc comment il va tuer les monstres pour

03:40.350 --> 03:43.410
essayer d'atteindre le meilleur et tout sera super excitant.

03:43.440 --> 03:48.170
Et rappelez-vous que ces vidéos iront dans ce dossier.

03:48.630 --> 03:49.100
D'accord.

03:49.230 --> 03:54.990
Et dernière ligne ici mais je veux vous le montrer parce que c’est important, c’est maintenant plus lié à l’IA

03:55.200 --> 03:56.710
AI que nous construisons.

03:56.910 --> 04:02.680
Rappelez-vous que notre réseau de neurones prend comme actions un nombre d’entrées.

04:02.880 --> 04:07.950
C'est parce que vous savez que nous voulons créer une AI que nous pouvons facilement tester sur plusieurs

04:07.950 --> 04:09.660
environnements et plusieurs environnements Dume.

04:09.660 --> 04:15.100
Et puisque les différents environnements ont un nombre d'actions différent, nous avons spécifié cette

04:15.120 --> 04:19.070
variable d'actions comme entrée du CNN dans le cerveau.

04:19.380 --> 04:26.250
Et donc maintenant, nous allons obtenir cette variable de nombre d'actions en utilisant l'environnement Dumah que nous venons d'importer

04:26.250 --> 04:29.340
et que nous avons créé dans cette variable.

04:29.340 --> 04:34.860
Et plus tard, ce nombre est très bien ce que nous sommes sur le point de créer sera l’entrée du cerveau.

04:34.890 --> 04:36.000
Alors faisons ceci.

04:36.000 --> 04:42.690
Je présente ce nombre réel d'actions à nombre variable d'actions égales.

04:42.720 --> 04:47.870
Maintenant, nous allons prendre notre environnement catastrophique qui est la variable que nous avons créée.

04:48.150 --> 04:49.330
Alors fais mon.

04:49.500 --> 04:56.250
Ensuite, nous ajoutons ici cela et ensuite nous y voilà, nous prenons le premier espace d'action qui est l'ensemble de

04:56.250 --> 04:57.200
vos actions.

04:57.230 --> 05:01.960
Je vous encourage à regarder l'ouverture chez Horrible pour voir comment cela fonctionne.

05:02.010 --> 05:05.530
Vous savez comprendre comment ouvrir les environnements de gymnastique fonctionnent.

05:05.670 --> 05:07.940
Mais fondamentalement, c'est l'ensemble des actions.

05:08.040 --> 05:14.070
Et à partir de cet ensemble d'actions, nous pouvons accéder au nombre d'actions dans l'environnement et faire ces

05:14.120 --> 05:15.770
données ici et ensuite.

05:16.080 --> 05:25.050
Et c'est le nombre d'actions et donc de malheur et cet espace d'action retournera 7 6:48 car il y

05:25.050 --> 05:26.550
a sept actions.

05:26.760 --> 05:32.640
Je sais que nous pouvons voir six actions dans les deux environnements sur la page d’ouverture, mais je pense que nous pouvons

05:32.640 --> 05:33.400
aussi courir.

05:33.490 --> 05:39.000
Et pour que vous sachiez que nous pouvons avancer, avancer, aller à gauche, aller à droite, tourner à gauche, tourner à droite et tirer.

05:39.000 --> 05:45.090
Et en plus, nous pouvons courir avec sept actions, et c’est tout pour que nous puissions créer un environnement.

05:45.330 --> 05:47.010
Nous devons faire notre environnement.

05:47.040 --> 05:52.640
Nous avons un certain nombre d’actions, nous avons donc jusqu’à présent tout ce dont nous avons besoin pour notre cerveau.

05:52.800 --> 05:58.320
Nous allons ensuite simplement créer un objet ou un objet du cerveau que nous appellerons CNN lettres minuscules.

05:58.500 --> 06:04.500
Et comme chaque fonction prend un certain nombre d'actions en argument, nous allons mettre le nombre d'actions dans

06:04.900 --> 06:11.160
la scène sur un objet que nous allons créer, puis nous allons bien sûr créer le corps et éventuellement

06:11.160 --> 06:11.690
l'IA.

06:11.850 --> 06:18.090
Et c’est pourquoi la section suivante, que je qualifierai de «construction d’une intelligence artificielle», nous pouvons désormais construire autant d’œil que

06:18.090 --> 06:19.170
nous le voulons.

06:19.170 --> 06:22.070
C'est ce qui est génial avec la programmation orientée objet.

06:22.110 --> 06:24.290
Nous pouvons construire toutes les IA que nous voulons.

06:24.320 --> 06:29.820
Nous allons donc construire notre intelligence artificielle dotée d'un cerveau sophistiqué et c'est exactement ce que nous

06:29.970 --> 06:31.690
ferons dans le prochain tutoriel.

06:31.860 --> 06:33.430
Jusque-là, profitez de l'IA.
