WEBVTT

00:00.360 --> 00:03.080
Hallo en welkom terug bij de cursus over kunstmatige intelligentie.

00:03.090 --> 00:08.130
In de sectie van vandaag behandelen we het onderwerp van een diepgaande Q-learning.

00:08.130 --> 00:09.900
Dus laten we eens kijken, hoe gaan we dit aanvallen?

00:10.320 --> 00:15.030
In deze sectie zullen we een diepe leerintuïtie leren, de leerkant van dingen.

00:15.030 --> 00:20.250
Dus we gaan diep leren, de intuïtie erachter, opsplitsen in twee delen, het leren en het

00:20.250 --> 00:20.760
acteren.

00:20.760 --> 00:22.440
En daar gaan we tutorials over hebben.

00:22.620 --> 00:28.230
Begrijp dus allereerst hoe de neurale netwerken eigenlijk leren en hoe ze hun gewicht bijwerken op

00:28.230 --> 00:33.790
basis van wat we ze ingeven en hoe het hele concept van leren werkt.

00:33.820 --> 00:37.790
Dus hoe gaan we om met de concepten van temporele verschillen die we bespreken in eenvoudig leren?

00:37.800 --> 00:43.200
We gaan ze toepassen op deep learning, en dan gaan we praten over hoe

00:43.200 --> 00:48.630
deep learning-algoritmen daadwerkelijk beslissen welke actie moet worden ondernomen in welke toestanden ze zouden gaan praten.

00:48.630 --> 00:55.440
Ervaar replay een zeer belangrijke toevoeging bovenop deep learning, waardoor je daadwerkelijk leert goed te werken en je zult uit

00:55.440 --> 00:57.840
die tutorial zien waarom het belangrijk is.

00:58.200 --> 01:01.890
En dan gaan we het hebben over actieselectiebeleid.

01:02.410 --> 01:11.100
We gaan het hebben over hoe deep learning agents exploratie en exploitatie kunnen combineren.

01:11.110 --> 01:15.900
Dus als ze eenmaal iets een goede aanpak hebben gevonden, kunnen ze die aanpak gebruiken, maar ze moeten ook verkennen zodat ze

01:15.900 --> 01:18.030
niet vast komen te zitten in een lokaal maximum.

01:18.750 --> 01:24.600
En nog iets dat ik over de sectie wilde noemen, is dat het zeer nuttig is als

01:24.600 --> 01:27.980
je kijkt naar Anex, nummer één, kunstmatige neurale netwerken.

01:27.990 --> 01:33.510
Dus als je al die onderwerpen gaat verkennen, hebben we daar een aantal zeer krachtige intuïtie-tutorials voor je

01:33.510 --> 01:34.080
voorbereid.

01:34.620 --> 01:38.060
Als je natuurlijk niet hebt gedaan, als je de cursus diepgaand leren

01:38.070 --> 01:41.970
niet hebt gedaan, als je de discipline hebt gedaan, natuurlijk, en je weet al

01:41.970 --> 01:47.550
deze dingen al en je kunt doorgaan met sectie, maar als je wilt om die extra kennis over neurale netwerken te

01:47.550 --> 01:53.400
krijgen voordat je verder gaat met dit deel, is dit natuurlijk zeer aan te raden omdat het je zal helpen precies te

01:53.400 --> 01:58.160
begrijpen hoe neurale netwerken werken en waarom ze zo krachtig zijn, waarom we ze in dit diepe leeralgoritme.

01:58.170 --> 02:02.640
En als je eenmaal je kennis hebt opgefrist of die kennis hebt opgedaan over een neuraal netwerk van

02:02.640 --> 02:06.150
dat naar annexeren en hier terug komen, gaan we verder met het typische.

02:06.480 --> 02:10.110
Als je redelijk vertrouwd bent met neurale netwerken, laten we er dan meteen op ingaan.

02:10.110 --> 02:14.880
Laten we het hebben over diep leren, intuïtie, en ik kijk ernaar uit je te zien tijdens de eerste

02:14.880 --> 02:15.360
tutorial.

02:15.360 --> 02:16.950
Tot die tijd, geniet van I.