WEBVTT

00:00.630 --> 00:03.850
Bonjour et bienvenue au cours sur l'intelligence artificielle.

00:03.990 --> 00:09.260
Dans le tutoriel d'aujourd'hui, nous commençons la section sur l'apprentissage cool par convolution profonde.

00:09.420 --> 00:11.010
Voyons donc de quoi il s'agit.

00:11.010 --> 00:14.040
Auparavant, nous avons parlé d'apprentissage en profondeur.

00:14.040 --> 00:21.270
Nous avons donc eu un environnement dans lequel un agent et un vecteur décrivant cet environnement ont été introduits dans un réseau

00:21.270 --> 00:26.310
de neurones et à la fin, nous avons obtenu les valeurs q comme sorties.

00:26.310 --> 00:29.970
Et bien sûr, nous avons découvert comment restreindre l’apprentissage.

00:29.970 --> 00:34.650
Nous avons découvert comment les actions sont décidées en fonction de ces valeurs qui font partie de l'action.

00:34.650 --> 00:42.380
Et nous avons parlé des politiques de sélection des actions et de différentes choses sur le fonctionnement de l'apprentissage en profondeur.

00:42.420 --> 00:51.240
Mais ici, le concept clé pour tout cela est comment pouvons-nous passer de cela de l’environnement réel et

00:51.240 --> 00:54.450
des états au réseau de neurones.

00:54.480 --> 00:56.190
Eh bien, la transition est ici.

00:56.220 --> 01:02.250
Les vecteurs d’entrée sont donc le Lehre d’entrée de notre réseau de neurones et c’est un vecteur.

01:02.250 --> 01:06.570
Donc, ce que nous examinons est OK, nous sommes donc en train de prendre de la vitesse.

01:06.600 --> 01:08.830
Ce n'est pas le terme correct nous ne regardons rien.

01:08.940 --> 01:12.330
L'agent a essentiellement cette information.

01:12.330 --> 01:18.490
Donc, l'environnement est en train d'analyser cette information en disant OK, l'agent dans lequel vous êtes actuellement est

01:18.560 --> 01:26.160
décrit par le secteur dans cet exemple simplifié décrit par ce vecteur X-1 de 1 x 2 sur 2, de sorte que

01:26.160 --> 01:31.410
vos coordonnées sont 1 2 et c'est tout votre état dans un environnement plus complexe.

01:31.410 --> 01:37.920
La déclaration et toutes les autres choses que l'agent peut observer, mais le point ici est qu'il est possédé

01:37.920 --> 01:39.040
comme un vecteur.

01:39.240 --> 01:45.750
Et le problème, c’est que cela n’arrive pas dans la vie réelle, sauf pour les systèmes GPS et d’autres choses du

01:45.780 --> 01:46.470
même genre.

01:46.530 --> 01:51.830
Mais dans la vraie vie, ce que nous utilisons la plupart du temps, nous utilisons nos sens, nous utilisons nos yeux même en GPS.

01:51.930 --> 01:53.670
Ce n'est pas construit dans notre cerveau.

01:53.670 --> 01:56.420
Cela ne nous dit pas les coordonnées à travers notre cerveau.

01:56.430 --> 02:02.880
Nous utilisons donc toujours nos yeux pour regarder le GPS et comprendre ce qui se passe là-bas.

02:02.910 --> 02:09.620
C'est donc une sorte de triche pour l'IA de pouvoir obtenir des informations similaires sur l'environnement en tant que vecteur.

02:09.620 --> 02:12.030
C'est trop simple, ce n'est pas comme ça que ça marche dans la vie réelle.

02:12.030 --> 02:17.040
En tant qu’êtres humains, nous ne fonctionnons pas ainsi. Nous voulons en définitive créer une intelligence

02:17.340 --> 02:23.310
artificielle capable de fonctionner de la même manière que les humains, c’est-à-dire qu’elle peut relever les mêmes défis que les humains.

02:23.320 --> 02:28.740
Ainsi, dans le monde humain, nous n'avons pas ce que nous n'avons pas, nous n'avons pas ces coordonnées

02:28.740 --> 02:33.870
ou d'autres types de vecteurs qui nous sont transmis qui expliquent l'état dans lequel nous nous trouvons.

02:33.870 --> 02:37.350
Nous allons donc devoir supprimer cela pour le rendre plus réaliste.

02:37.410 --> 02:42.180
Et ensuite que pouvons-nous remplacer par ce que nous voyons ou ce que nous faisons en tant qu’être humain pour obtenir des informations.

02:42.180 --> 02:46.860
Bien que la plupart du temps, nous voyons tous nos sens, mais la plupart des informations

02:46.860 --> 02:51.300
que nous obtenons sur le monde qui nous entoure nous parviennent par la vue.

02:51.510 --> 02:59.340
Et c'est pourquoi nous allons changer cette petite flèche que nous avions en un réseau de neurones convolutionnel

02:59.340 --> 03:00.090
complet.

03:00.090 --> 03:02.700
C'est donc de notre Onix.

03:02.700 --> 03:08.400
Deuxièmement, nous avons la convulsion de Larry et c'est pourquoi il est important que vous soyez assez à l'aise avec les réseaux

03:08.460 --> 03:13.290
de neurones conditionnels d'évolution et comment cela fonctionne si vous avez eu un rapport sexuel ODP et vous devriez

03:13.350 --> 03:14.910
être à l'aise avec cela.

03:14.930 --> 03:20.490
Ou vous pouvez simplement regarder le numéro deux suivant. Nous avons là de très bons tutoriels d’intuition.

03:20.670 --> 03:26.160
Nous avons donc ici l'opération de convolution qui se produit, nous allons donc examiner cela

03:26.160 --> 03:27.330
sous forme d'image.

03:27.330 --> 03:31.350
Donc, ceci est une image de l'environnement Net.

03:31.350 --> 03:33.990
Et donc l'agent regarde réellement l'environnement.

03:33.990 --> 03:39.870
Donc, dans ce cas, il n'a pas l'air de regarder comme ça.

03:39.930 --> 03:44.710
Disons qu'il joue ceci sur un ordinateur et qu'il peut voir cet environnement et donc il

03:44.760 --> 03:48.480
peut voir comme où se trouve réellement cette figure représentant un agent.

03:48.480 --> 03:53.340
Vous pouvez voir tout son contenu dans un virus ou tout ce qu'un humain verrait s'il s'agissait d'un véritable labyrinthe et s'il verrait

03:53.340 --> 03:54.270
le labyrinthe de l'intérieur.

03:54.270 --> 03:56.480
Et si l'agent devrait pouvoir faire exactement la même chose.

03:56.700 --> 04:03.000
Donc, ce qu’il dit est fait passe dans un repaire de troubles, c’est un imbécile de tirer une

04:03.030 --> 04:10.140
jambe qui s’aplatit de nouveau. Vous pouvez en apprendre davantage sur ces différentes parties du réseau de neurones de convolution dans

04:10.140 --> 04:12.680
l’annexe, puis sur des officiers aplatis.

04:12.690 --> 04:19.950
Nous avons ensuite des entrées qui entrent dans le réseau de neurones, ce qui est plus

04:19.950 --> 04:29.010
réaliste car l’agent doit utiliser leurs sites et / ou traiter les images que l’environnement lui fournit, tout comme un

04:29.400 --> 04:31.590
humain traiterait des images.

04:31.590 --> 04:37.410
Et la beauté de ceci n’est pas seulement le fait qu’elle est plus réaliste, c’est un peu comme une teinte.

04:37.410 --> 04:43.280
L'âge est en réalité le plus humain, mais cela nous permet de traiter des environnements beaucoup plus complexes.

04:43.380 --> 04:49.050
Par exemple, voici comment nous pouvons jouer à Doom ou à d’autres jeux du même

04:49.050 --> 04:55.980
genre, car au lieu d’obtenir un vecteur d’informations que quelqu'un aurait créé pour nous dans cet environnement, nous pouvons simplement

04:56.080 --> 05:02.230
connecter l'intelligence artificielle à tout environnement qui, en tant qu'être humain, a une vision. de est et.

05:02.430 --> 05:08.280
En tant qu'être humain lorsque vous jouez à ce jeu, vous pouvez voir exactement cette image et c'est exactement

05:08.760 --> 05:12.450
ce que le réseau de neurones artificiels ou l'agent verrait maintenant.

05:12.540 --> 05:17.580
Ainsi, dans cette partie du cours, lorsque vous explorerez les tournelles pratiques, l'agent verra bien cette

05:17.580 --> 05:22.890
image, il verra les pixels, il obtiendra cette image exacte avec les pixels de cette personne avec

05:22.890 --> 05:28.410
qui nous sommes passés. avec ce visage avec ce pourcentage avec tout exactement ce que nous voyons ici,

05:28.410 --> 05:30.710
c'est exactement ce que l'agent verra.

05:30.870 --> 05:37.470
Ensuite, il faudra disséquer cela en tirant sur liff engraissement, puis il ira dans un réseau neuronal.

05:37.650 --> 05:42.150
Et inutile de dire que les réseaux de neurones sont en réalité beaucoup plus complexes que cela, alors remplaçons-les par quelque chose

05:42.150 --> 05:42.780
comme ça.

05:42.780 --> 05:44.480
Ce n'est pas beaucoup plus complexe.

05:44.520 --> 05:49.350
Cela semble un peu plus complexe, mais en réalité, les réseaux de neurones vont travailler avec

05:49.380 --> 05:54.140
et créer si vous voulez être assez intéressant et être beaucoup plus complexe que cela.

05:54.150 --> 05:59.910
Mais comme vous pouvez le constater déjà ici, même si vous n’avez que cinq entrées et que deux choses deviennent beaucoup

05:59.970 --> 06:04.380
plus complexes, vous pouvez voir que nous avons beaucoup plus d’actions que l’agent peut prendre.

06:04.380 --> 06:10.850
Donc, dans le jeu de doom, tournez à gauche et à droite, regardez vers le bas pour recharger le tournage de Ron.

06:10.890 --> 06:16.290
Ou vous savez toutes ces actions différentes qui sont possibles à la première personne devraient aimer faire.

06:16.290 --> 06:19.430
Et d'ailleurs, il n'est pas nécessaire que vous le puissiez.

06:19.430 --> 06:23.190
Vous pouvez toucher cet agent à un autre type de jeu.

06:23.190 --> 06:29.940
C’est la beauté de cela, puis il réalise qu’il peut désormais exploiter n’importe quel environnement auquel vous l’attachez, car

06:29.940 --> 06:34.260
tant qu’il existe une représentation visuelle de l’environnement de cet environnement,

06:34.680 --> 06:39.940
il dispose déjà de toute l’infrastructure que toute la structure est prête à traiter. cette.

06:39.960 --> 06:43.980
C'est donc en quoi consiste l'apprentissage CULE par convolution profonde.

06:43.980 --> 06:51.120
Nous en arrivons donc à l'étape suivante en ajoutant des convolutions à Lares ou en convolution dans le

06:51.120 --> 06:58.980
cerveau de nos agents et nous le rendons encore plus complexe. Nous pouvons donc nous ennuyer de pouvoir résoudre des

06:58.980 --> 07:01.260
problèmes encore plus complexes. défis.

07:01.410 --> 07:06.720
J'espère donc que vous êtes très enthousiasmé par le fait que cela va être dans une section épique et que nous allons

07:06.720 --> 07:10.460
créer des choses incroyables et j'ai hâte de vous voir lors de ce prochain tutoriel.

07:10.480 --> 07:12.130
Et jusque-là, profitez de l'IA.