WEBVTT

00:00.390 --> 00:05.320
Hallo und herzlich willkommen, das Auge mit tiefem Faltungs-Training zu trainieren.

00:05.490 --> 00:06.240
Stimmt.

00:06.240 --> 00:11.550
Nun, da wir die KI mit der Architektur des neuronalen Netzwerks aufgebaut haben, ist der Körper so, wie die Aktionen

00:11.550 --> 00:12.830
gespielt werden und alles.

00:12.840 --> 00:17.040
Es ist Zeit zu trainieren, sage ich mit tiefem Convolutions-Cuellar.

00:17.220 --> 00:21.100
Von nun an implementieren wir Ihre Erfahrungswiedergabe.

00:21.210 --> 00:23.770
Mit den Werten arbeiten, mit Wörtern arbeiten.

00:24.000 --> 00:27.820
Und es wird sogar einen Bonus geben, der sich erheblich verbessert.

00:27.840 --> 00:33.870
Der Trainingsprozess, der als Berechtigungsspur für die Berechtigungsspur bezeichnet wird,

00:34.110 --> 00:41.880
ist eine mächtige Technik, bei der das Wort in mehreren Schritten akkumuliert wird. Die

00:41.880 --> 00:46.860
Cube-Werte werden bei dieser Akkumulation von Wörtern gelernt.

00:46.860 --> 00:52.800
Deshalb werden wir die Werte lernen, nachdem wir diesmal mehrere Wörter erhalten haben, anstatt

00:53.040 --> 00:54.480
nur ein Wort.

00:54.660 --> 01:00.530
Anstatt einen Übergang nach dem anderen zu haben, können Sie den Q-Wert jedes Mal aktualisieren.

01:00.660 --> 01:07.620
Nun, die q-Werte werden bei jedem Schritt aktualisiert, da die Berechtigungsspuren Radikale und Schritte verfolgen. Die Berechtigungsspuren und

01:07.710 --> 01:13.820
deren Ende ist diese Zahl, nach der die q-Werte aktualisiert werden, und in unserem Modell.

01:13.820 --> 01:15.600
Hier werden wir dann irgendwelche Anrufe haben.

01:15.630 --> 01:21.570
Das bedeutet also, dass es eine 10-Schritte-Ablaufverfolgung gibt. Daher werden wir die q-Werte alle 10 Schritte aktualisieren

01:21.840 --> 01:22.880
und lernen.

01:22.890 --> 01:26.820
Nachdem Sie die Wörter in diesen 10 Schritten gesammelt haben, ist dies ein Bonus.

01:26.820 --> 01:32.400
Das macht unser Modell noch leistungsfähiger und Sie werden sehen, dass wir am Ende hervorragende Ergebnisse

01:32.400 --> 01:33.180
erzielen werden.

01:33.180 --> 01:36.020
Ich war wirklich überrascht, als ich das Endergebnis sah.

01:36.030 --> 01:40.430
Ich habe an Merles gearbeitet, deren Ausführung viel Zeit in Anspruch genommen hat.

01:40.430 --> 01:45.780
Sie wissen, dass die KI viel Zeit zum Trainieren gebraucht hat, aber Sie werden dies mit diesem plus dem neuronalen Netzwerk sehen, das

01:45.780 --> 01:46.640
wir gemacht haben.

01:46.860 --> 01:49.390
Das ist unser Gehirn und unser Körper hier mit Sachen.

01:49.390 --> 01:55.740
Als Nächstes erhalten wir einen sehr mächtigen Mob und daher eine sehr mächtige KI, weil Sie sehen werden, dass dies wirklich Lügen

01:55.740 --> 01:56.600
heilen wird.

01:56.610 --> 01:59.090
Verstehst du, worüber ich spreche?

01:59.370 --> 02:05.440
Wie Sie in diesem zweiten Teil sehen können, beginnen wir damit, die Dume-Umgebung zu erhalten und die Codezeilen

02:05.440 --> 02:06.740
für Sie vorzubereiten.

02:06.780 --> 02:12.790
Wir verwenden nur die externe Bildvorverarbeitungsdatei aus einem Arbeitsverzeichnisordner.

02:12.930 --> 02:19.520
Im Grunde ist die Anordnung eher, zuerst diese Zeile des Codes zu nehmen, die es nicht vor Gericht schafft.

02:19.590 --> 02:24.450
0 0 ist der Name der Umgebung des Spiels, das wir spielen.

02:24.450 --> 02:30.930
Also importieren wir zuerst die Umgebung mit diesem Edelstein, den Sie auf der geöffneten Seite und den Tutorials

02:30.930 --> 02:31.970
finden können.

02:32.190 --> 02:40.230
Dann verwenden wir diese Preprocess-Image-Klasse, eine Klasse aus der Image-Vorverarbeitung, um die Bilder, die in die neuen Bilder einfließen werden,

02:40.290 --> 02:45.870
vorzuverarbeiten, und wir bereiten sie so vor, dass sie ein quadratisches Format mit den

02:45.870 --> 02:54.060
Dominierungen 80 und 80 haben Denken Sie daran, denn in unserem neuen, das gut funktioniert, haben wir unsere Eingabebilder so eingestellt,

02:54.360 --> 02:58.530
dass die Zeitmaschinen jeweils um 80 um 80 liegen.

02:58.560 --> 03:03.490
Denken Sie daran, dass es sich bei einem Kanal um die Anzahl der Kanäle handelt. Daher bedeutet einer, dass wir mit Schwarzweißbildern arbeiten.

03:03.660 --> 03:06.350
Das ist also die Graustufen hier.

03:06.900 --> 03:14.070
Und 80 zu 80 bedeutet, dass die Dominanz unserer Eingabebilder 80 zu 80 sein wird. Dies

03:14.070 --> 03:20.190
ist das, was wir im neuronalen Netzwerk festgelegt haben. Natürlich müssen wir dies

03:20.190 --> 03:23.150
beim Einfügen der Bilder angeben Bildklasse.

03:23.670 --> 03:29.610
Und nachdem wir die Umgebung mit dem richtigen Format der Eingabebilder importiert haben, während wir das gesamte Spiel mit

03:29.610 --> 03:34.920
den Videos mit dieser Codezeile importieren und uns daran erinnern, dass das Schlimmste daran ist, dass am

03:34.920 --> 03:40.350
Ende die Videos Doom spielen Wir werden also sehen, wie es die Monster töten wird, die versuchen,

03:40.350 --> 03:43.410
das Beste zu erreichen, und alles wird super aufregend.

03:43.440 --> 03:48.170
Denken Sie daran, dass diese Videos in diesen Videoordner verschoben werden.

03:48.630 --> 03:49.100
Gut.

03:49.230 --> 03:54.990
Und die letzte Zeile hier, aber ich möchte es Ihnen zeigen, denn das ist wichtig, was jetzt mehr mit der KI

03:55.200 --> 03:56.710
zusammenhängt, die wir gerade bauen.

03:56.910 --> 04:02.680
Denken Sie daran, dass unser neuronales Netzwerk die Anzahl der eingegebenen Aktionen übernimmt.

04:02.880 --> 04:07.950
Das ist, weil Sie wissen, dass wir eine AI-KI erstellen möchten, die wir problemlos in mehreren Umgebungen

04:07.950 --> 04:09.660
und mehreren Dume-Umgebungen testen können.

04:09.660 --> 04:15.100
Und da die verschiedenen Umgebungen unterschiedliche Anzahl von Aktionen haben, haben wir diese Anzahl

04:15.120 --> 04:19.070
von Aktionsvariablen als Eingabe des CNN des Gehirns angegeben.

04:19.380 --> 04:26.250
Deshalb erhalten wir nun diese Variablenanzahl in der Dumah-Umgebung, die wir gerade wichtig und

04:26.250 --> 04:29.340
in diese Variable eingefügt haben.

04:29.340 --> 04:34.860
Und später ist diese Zahl tatsächlich sehr gut, die wir schaffen werden, wird der Input des Gehirns sein.

04:34.890 --> 04:36.000
Also lass uns das tun.

04:36.000 --> 04:42.690
Ich führe diese reale Anzahl von Aktionen mit variablen Aktionen aus.

04:42.720 --> 04:47.870
Jetzt nehmen wir unsere Doom-Umgebung, die Variable, die wir erstellt haben.

04:48.150 --> 04:49.330
So tun meine

04:49.500 --> 04:56.250
Dann fügen wir hier das hinzu und dann, gut, wir nehmen den ersten Aktionsbereich, der die Menge Ihrer

04:56.250 --> 04:57.200
Aktionen ist.

04:57.230 --> 05:01.960
Ich möchte Sie dazu ermutigen, sich die Eröffnung bei Horrible's anzusehen, um zu sehen, wie es funktioniert.

05:02.010 --> 05:05.530
Sie wissen, wie Sie die Arbeit im Fitnessstudio öffnen.

05:05.670 --> 05:07.940
Aber im Grunde ist dies die Menge von Aktionen.

05:08.040 --> 05:14.070
Und aus dieser Reihe von Aktionen können wir auf die Anzahl der Aktionen in der Umgebung zugreifen und diese

05:14.120 --> 05:15.770
Daten hier und dann ausführen.

05:16.080 --> 05:25.050
Und das ist die Anzahl der Aktionen und daher werden der Untergang und der Aktionsraum 7 6:48 zurückkehren, weil es

05:25.050 --> 05:26.550
sieben Aktionen gibt.

05:26.760 --> 05:32.640
Ich weiß, dass wir auf der Startseite sechs Aktionen in den beiden Umgebungen sehen können, aber ich denke, dass wir auch

05:32.640 --> 05:33.400
ausführen können.

05:33.490 --> 05:39.000
Und so wissen Sie, dass wir uns vorwärts bewegen können, sich nach rechts bewegen, nach links drehen, nach rechts drehen und schießen.

05:39.000 --> 05:45.090
Abgesehen davon, dass wir ausführen können, sind sieben Aktionen in Ordnung, und um die Umgebung zu schaffen, müssen

05:45.330 --> 05:47.010
wir unsere Umgebung tun.

05:47.040 --> 05:52.640
Wir haben eine Reihe von Aktionen, also haben wir bisher alles, was wir für unser Gehirn brauchen.

05:52.800 --> 05:58.320
Wir erstellen dann einfach ein Objekt oder ein Gehirnobjekt, das wir als CNN-Minimalbuchstaben bezeichnen.

05:58.500 --> 06:04.500
Und da jede Funktion eine Reihe von Aktionen als Argument ausführt, werden wir die Anzahl der Aktionen in

06:04.900 --> 06:11.160
der Szene als Objekt definieren, das wir erstellen werden, und dann werden wir natürlich den Körper und schließlich die KI

06:11.160 --> 06:11.690
erstellen.

06:11.850 --> 06:18.090
Deswegen nenne ich es im nächsten Abschnitt, eine KI zu bauen, weil wir jetzt so viele Augen bauen können,

06:18.090 --> 06:19.170
wie wir wollen.

06:19.170 --> 06:22.070
Das ist das Tolle an der objektorientierten Programmierung.

06:22.110 --> 06:24.290
Wir können beliebige KI bauen, wie wir wollen.

06:24.320 --> 06:29.820
Und so bauen wir unsere KI mit dem ausgeklügelten Gehirn und genau das machen

06:29.970 --> 06:31.690
wir im nächsten Tutorial.

06:31.860 --> 06:33.430
Bis dahin genießen Sie die KI.