WEBVTT

00:00.510 --> 00:02.990
Bonjour et bienvenue dans ce tutoriel sur Python.

00:03.240 --> 00:08.400
Très bien, maintenant nous allons créer la fonction avant qui propagera les signaux de sortie de notre

00:08.400 --> 00:13.550
cerveau vers le corps de l'IA afin que celui-ci joue l'action appropriée pour atteindre la veste.

00:13.770 --> 00:20.100
Mais il n'y a pas encore de réaction car il n'y a pas de formation que nous n'avons pas encore formée pour

00:20.100 --> 00:25.920
l'IA mais c'est exactement ce que nous ferons en partie pour mettre en œuvre une curine convolutionnelle profonde qui, par

00:25.920 --> 00:29.720
la même occasion, je renommerai la formation de l'IA avec Killary convolutionnelle profonde.

00:29.940 --> 00:35.340
Mais pour le moment, nous devons transférer le signal de la couche de sortie du cerveau au corps.

00:35.370 --> 00:40.170
Et c'est exactement ce que nous allons faire avec cette fonction avancée qui est la dernière fonction de notre

00:40.170 --> 00:40.670
corps.

00:41.420 --> 00:42.860
Alors faisons ceci.

00:42.860 --> 00:50.140
Nous commençons avec Teff forward et selon vous quels arguments cela va prendre.

00:50.330 --> 00:55.030
Eh bien, ça va prendre force d'abord, puis il y en a un autre.

00:55.220 --> 00:56.740
Eh bien oui il y a.

00:56.870 --> 00:58.140
Et qu'est-ce que ça va être.

00:58.310 --> 01:04.700
Naturellement, nous voulons transmettre le signal de sortie du cerveau au corps et l’entrée sera donc

01:04.700 --> 01:07.470
le signal de sortie du cerveau.

01:07.850 --> 01:10.480
Et maintenant, nous devons donner un nom à ces signaux extérieurs.

01:10.610 --> 01:14.390
Et donc je vais ajouter ici l'argumentation exposée.

01:14.460 --> 01:21.200
Cela correspond donc aux signaux de sortie du cerveau après que les images d’entrée soient propagées dans tout le cerveau

01:21.200 --> 01:26.540
pour atteindre la sortie plus tard qui est X ici revient par la fonction avant du

01:26.540 --> 01:27.170
cerveau.

01:27.380 --> 01:32.480
Et maintenant, ce signal de sortie du cerveau sera transmis au corps avec cette nouvelle fonction

01:32.480 --> 01:35.410
avancée que nous allons créer dans la classe suivante.

01:35.460 --> 01:41.760
Faisons cela, ajoutons un peu de couleur ici et maintenant, comme vous l'avez compris, nous allons utiliser la

01:41.870 --> 01:43.940
méthode suivante pour jouer l'action.

01:43.940 --> 01:49.820
Cela signifie que le corps de notre IA après avoir reçu les signaux de sortie du cerveau jouera les

01:49.820 --> 01:51.440
actions avec la technique suivante.

01:51.440 --> 01:56.510
Donc, fondamentalement, ce que nous devons faire est exactement identique à ce que nous avons fait pour la voiture.

01:56.600 --> 01:59.390
Nous allons obtenir notre distribution de probabilités.

01:59.540 --> 02:05.960
C'est la première étape et ensuite nous allons échantillonner une action en fonction de cette distribution de probabilités.

02:05.960 --> 02:11.510
Donc, fondamentalement, nous pourrions maintenant obtenir notre fichier de voiture autonome et copier-coller ce que nous avons implémenté

02:11.510 --> 02:14.570
pour la fonction de sélection dans la voiture autonome.

02:14.810 --> 02:15.700
Mais faisons-le encore.

02:15.710 --> 02:19.710
Ce sera une bonne pratique et en réalité, vous pouvez essayer de le taper avant moi.

02:20.150 --> 02:23.870
OK, nous allons donc commencer par obtenir nos probabilités.

02:23.870 --> 02:29.930
Je rappelle donc qu’il s’agit d’une distribution de probabilités pour chacune des q valeurs qui dépendent de l’image

02:29.960 --> 02:31.790
d’entrée et de chaque action.

02:31.790 --> 02:38.120
Nous avons donc une valeur clé pour chacune des six ou sept actions possibles et nous obtenons donc une distribution de

02:38.120 --> 02:43.600
sept probabilités, puis de sept parce que je pense qu'il y a sept actions au lieu de six.

02:43.670 --> 02:50.010
Parce qu'en plus de se déplacer pour gauche à droite ou de tirer, nous pouvons aussi courir qui fait

02:50.420 --> 02:57.260
sept actions possibles et donc nous obtenons une distribution de sept probabilités une pour chaque valeur q associée à chaque action.

02:57.260 --> 02:58.930
Donc, Propst égale.

02:59.040 --> 03:00.670
Et maintenant rappelez-vous ce que nous devions faire.

03:00.860 --> 03:06.650
En gros, nous devons utiliser la fonction soughed max du module fonctionnel.

03:06.680 --> 03:13.010
C’est très simple. Nous prenons d’abord notre module fonctionnel, puis nous prenons ensuite notre fonction

03:13.130 --> 03:13.700
suivante.

03:13.700 --> 03:14.480
C'est ici.

03:14.570 --> 03:22.430
Nous appuyons sur Entrée et nous plaçons maintenant les arguments de la fonction suivante que je rappelle sont les éléments pour lesquels

03:22.430 --> 03:25.290
vous voulez créer une distribution de probabilités.

03:25.550 --> 03:30.560
Et donc, bien sûr, les valeurs q qui constituent les sorties du réseau de neurones.

03:30.680 --> 03:35.830
C'est la sortie du réseau de neurones pour laquelle vous voulez créer une distribution de probabilités.

03:35.990 --> 03:41.270
Rappelez-nous maintenant que nous voulons créer cette distribution de probabilités pour pouvoir explorer les différentes actions

03:41.270 --> 03:45.760
au lieu de choisir directement celle qui a la valeur Q maximale.

03:46.010 --> 03:51.020
Si nous choisissons directement celui qui a la valeur Q maximale où nous n'explorons pas beaucoup les autres actions et nous

03:51.350 --> 03:52.650
risquons de rater quelque chose.

03:52.880 --> 03:58.760
Mais avec cette méthode suivante, nous pouvons explorer davantage et donc peut-être trouver des solutions cachées dans

03:58.760 --> 04:01.520
les modèles qui pourraient être bien meilleurs.

04:01.850 --> 04:08.060
Donc, encore une fois, je recommande fortement le matériel Nax et à partir de maintenant, ce que nous devons faire est de saisir les valeurs

04:08.060 --> 04:09.560
qui sont notre sortie ici.

04:09.560 --> 04:13.860
Les sorties de notre cerveau sont tellement sorties que nous partons.

04:13.970 --> 04:21.710
Mais nous avons ensuite ce paramètre de température que nous pouvons utiliser et que nous pouvons configurer pour personnaliser l’exploration.

04:21.710 --> 04:28.130
Rappelez-vous que plus nous établissons la température, moins l'exploration des autres actions sera effectuée, car la meilleure action

04:28.130 --> 04:33.260
sera sélectionnée avec une probabilité plus élevée, par opposition aux autres actions qui seront

04:33.260 --> 04:35.910
sélectionnées avec des probabilités plus faibles.

04:35.930 --> 04:42.620
C'est exactement comme avec une voiture et nous devons donc multiplier la sortie ici par notre paramètre de température

04:43.010 --> 04:51.800
t pour que nous devenions parfaits maintenant nous recevons un petit avertissement car nous n'avons pas encore utilisé les préparations mais nous sommes sur le

04:51.810 --> 04:53.220
point de l'utiliser maintenant.

04:53.260 --> 04:55.540
Et cela nous amène à la prochaine chose que nous devons faire.

04:55.540 --> 04:57.750
Comment allons-nous utiliser ces probabilités?

04:57.910 --> 05:04.390
Nous allons échantillonner l'action finale de cette distribution de probabilités. Nous devons donc maintenant

05:04.990 --> 05:10.960
utiliser la fonction multinomiale pour échantillonner l'action en fonction de cette distribution

05:10.960 --> 05:12.080
de probabilités.

05:12.370 --> 05:15.030
Alors maintenant, nous sommes prêts à recevoir nos actions.

05:15.190 --> 05:20.500
Je crée donc un nouveau voïvode ici parce que cela deviendra des actions qui seront jouées par le corps

05:20.500 --> 05:21.490
de notre IA.

05:21.520 --> 05:30.330
Et donc maintenant nous prenons notre distribution de probabilités probs à laquelle nous ajoutons des points et ensuite la méthode multi

05:30.880 --> 05:31.480
normale.

05:32.220 --> 05:38.030
Très bien et maintenant nous avons nos dernières actions à jouer là assemblées à partir de notre distribution d'accessoires.

05:38.430 --> 05:39.570
Ok parfait.

05:39.570 --> 05:42.300
Alors maintenant, nous étions prêts à retourner ce que nous voulons.

05:42.360 --> 05:44.450
C'est l'action à jouer.

05:44.670 --> 05:48.720
Et ce sont bien sûr des actions et maintenant l'avertissement devrait disparaître.

05:48.840 --> 05:50.440
Nous utilisons tout ce que nous voulons.

05:50.460 --> 05:51.270
Nous y voilà.

05:51.270 --> 05:52.020
Parfait.

05:52.210 --> 05:53.950
Alors maintenant, la fonction de transfert est prête.

05:54.080 --> 05:55.740
Et félicitations

05:55.800 --> 05:57.300
Le corps est également prêt.

05:57.540 --> 05:59.070
Alors maintenant, nous avons notre cerveau.

05:59.190 --> 06:05.760
Nous avons notre corps et donc nous sommes prêts à les assembler pour faire de la future IA notre future AI

06:05.760 --> 06:08.900
Je ne serai composé que d'un cerveau et d'un corps.

06:08.970 --> 06:14.160
Et c'est donc ce qui a une intelligence et un corps pour jouer les actions qui seront les

06:14.160 --> 06:16.610
bonnes actions à jouer grâce à son intelligence.

06:16.620 --> 06:22.060
Mais rappelez-vous avant de devoir former son intelligence et c'est ce que nous ferons en partie

06:22.070 --> 06:25.180
pour former l'œil grâce à l'apprentissage cool convolutionnel.

06:25.200 --> 06:25.500
D'accord.

06:25.500 --> 06:28.470
Faisons donc l'IA dans les prochains travaux.

06:28.490 --> 06:31.810
Je pense que ça va encore être une classe de deux fonctions.

06:31.950 --> 06:34.510
Et si celui-ci nécessite deux ou trois tutoriels.

06:34.680 --> 06:35.660
Donc je ne peux pas attendre.

06:35.670 --> 06:36.780
Ce sera passionnant.

06:36.780 --> 06:37.930
Et jusque là je