WEBVTT

00:00.390 --> 00:05.320
Witam i zapraszam do udziału w szkoleniu oka z głębokim splotowym kuningiem.

00:05.490 --> 00:06.240
Zgadza się.

00:06.240 --> 00:11.550
Teraz, kiedy zbudowaliśmy AI AI z architekturą sieci neuronowej, ciało jest tak samo

00:11.550 --> 00:12.830
odtwarzane i wszystko.

00:12.840 --> 00:17.040
Czas wytrenować, powiedzmy z głębokim splotowym Cuellarem.

00:17.220 --> 00:21.100
Tak więc od teraz, zaimplementujemy ciebie, znasz powtórkę doświadczenia.

00:21.210 --> 00:23.770
Praca z wartościami działającymi ze słowami.

00:24.000 --> 00:27.820
I nawet będzie bonus, który bardzo się poprawi.

00:27.840 --> 00:33.870
Proces szkoleniowy i to się nazywa ślad kwalifikowalności śladu kwalifikowalności jest potężną techniką, która

00:34.110 --> 00:41.880
polega na gromadzeniu słowa na kilku etapach, a wartości kostki są nauczane na tej akumulacji słów, w przeciwieństwie

00:41.880 --> 00:46.860
do wcześniej, gdzie wartości kostek zostały nauczone po każdym przejściu.

00:46.860 --> 00:52.800
Dlatego po otrzymaniu każdego słowa tym razem poznamy wartości po otrzymaniu kilku nagród

00:53.040 --> 00:54.480
zamiast jednego słowa.

00:54.660 --> 01:00.530
Zamiast jednego przejścia po drugim i za każdym razem aktualizujesz wartość Q.

01:00.660 --> 01:07.620
Cóż, wartości q będą uaktualniane co krok, ponieważ ślady kwalifikowalności radykalne i kroki śledzenia i

01:07.710 --> 01:13.820
zakończenia to ta liczba, po której wartości q zostaną zaktualizowane iw naszym modelu.

01:13.820 --> 01:15.600
Tutaj będziemy mieli wtedy wszelkie telefony.

01:15.630 --> 01:21.570
Oznacza to, że będzie to 10 kroków śledzenia kwalifikowalności i dlatego będziemy aktualizować i uczyć się wartości q

01:21.840 --> 01:22.880
co 10 kroków.

01:22.890 --> 01:26.820
Po zebraniu słów na tych 10 krokach, to jest premia.

01:26.820 --> 01:32.400
To sprawi, że nasz model będzie jeszcze mocniejszy, a przekonasz się, że ostatecznie osiągniemy znakomite

01:32.400 --> 01:33.180
wyniki.

01:33.180 --> 01:36.020
Byłem naprawdę zaskoczony, gdy zobaczyłem ostateczny wynik.

01:36.030 --> 01:40.430
Pracowałem nad Merle, które zajęło dużo czasu.

01:40.430 --> 01:45.780
Wiesz, że sztuczna inteligencja zajęła dużo czasu, aby ją trenować, ale zobaczysz to z tym plus siecią neuronową,

01:45.780 --> 01:46.640
którą stworzyliśmy.

01:46.860 --> 01:49.390
To jest nasz mózg i nasze ciało z takimi rzeczami.

01:49.390 --> 01:55.740
Następnie otrzymamy bardzo potężną masę, a zatem bardzo potężną sztuczną inteligencję, ponieważ przekonasz się, że naprawdę

01:55.740 --> 01:56.600
wyleczy kłamstwa.

01:56.610 --> 01:59.090
Czy rozumiesz, o czym mówię?

01:59.370 --> 02:05.440
Jak widać w tej części 2, zaczynamy od uzyskania środowiska Dume i faktycznie przygotowaliśmy linie

02:05.440 --> 02:06.740
kodu dla ciebie.

02:06.780 --> 02:12.790
Używamy tylko zewnętrznego pliku wstępnego przetwarzania obrazu z folderu roboczego.

02:12.930 --> 02:19.520
Zasadniczo więc kolejność polega raczej na tym, aby najpierw przyjąć ten wiersz kodu, co nie czyni go w sądzie.

02:19.590 --> 02:24.450
0 0 to nazwa środowiska gry, w którą gramy.

02:24.450 --> 02:30.930
Tak więc najpierw importujemy środowisko z tym klejnotem, który sprawia, że to jest to, co można znaleźć na otwartej

02:30.930 --> 02:31.970
stronie i tutoriali.

02:32.190 --> 02:40.230
Ale potem używamy tej wstępnie przetworzonej klasy obrazu, która jest klasą od wstępnego przetwarzania obrazu, aby wstępnie przetworzyć obrazy,

02:40.290 --> 02:45.870
które pojawią się w nowym, który działa i przygotowujemy je tak, aby miały

02:45.870 --> 02:54.060
format kwadratowy z dominacjami 80 na 80 i pamiętajmy, że w naszym nowym, który działa dobrze, ustawiamy nasze obrazy

02:54.360 --> 02:58.530
wejściowe, aby miały silniki czasu o 80 na 80.

02:58.560 --> 03:03.490
Pamiętaj, że jest to liczba kanałów, a więc jeden oznacza, że pracujemy z czarno-białymi obrazami.

03:03.660 --> 03:06.350
To jest tutaj szara skala.

03:06.900 --> 03:14.070
A 80 na 80 oznacza, że dominacja naszych obrazów wejściowych będzie wynosić 80 na 80 i to jest to, co

03:14.070 --> 03:20.190
ustawiamy w sieci neuronowej, ale oczywiście wtedy musimy to określić, umieszczając obrazy, co jest dokładnie tym, co

03:20.190 --> 03:23.150
robimy tutaj z tym preprocesiem klasa obrazu.

03:23.670 --> 03:29.610
A potem, po zaimportowaniu środowiska z odpowiednim formatem obrazów wejściowych, a my importujemy całą grę

03:29.610 --> 03:34.920
z filmami z tą linią kodu i pamiętamy, że fajne jest to, że

03:34.920 --> 03:40.350
w końcu zobaczymy, że wideo gra Zagłada Zobaczymy, jak zabije potwory, próbując dotrzeć

03:40.350 --> 03:43.410
do najlepszych i wszystko będzie super ekscytujące.

03:43.440 --> 03:48.170
I pamiętaj, że te filmy trafią do tych folderów wideo.

03:48.630 --> 03:49.100
W porządku.

03:49.230 --> 03:54.990
I ostatnia linijka tutaj, ale chcę ci ją pokazać, ponieważ jest to ważniejsze, co jest teraz bardziej związane z

03:55.200 --> 03:56.710
AI AI, którą budujemy.

03:56.910 --> 04:02.680
Pamiętajmy, że nasza sieć neuronowa przyjmuje jako akcje liczby wejściowej.

04:02.880 --> 04:07.950
To dlatego, że wiesz, że chcemy stworzyć AI AI, którą możemy łatwo przetestować w kilku

04:07.950 --> 04:09.660
środowiskach i kilku środowiskach Dume.

04:09.660 --> 04:15.100
A ponieważ różne środowiska mają różną liczbę akcji Cóż, określiliśmy tę zmienną

04:15.120 --> 04:19.070
liczby liczb jako wejście CNN do mózgu.

04:19.380 --> 04:26.250
I dlatego teraz, co zrobimy, otrzymamy zmienną liczbową z użyciem środowiska Dumah, które jest

04:26.250 --> 04:29.340
ważne i stworzone w tej zmiennej.

04:29.340 --> 04:34.860
A później ta liczba rzeczywiście jest bardzo dobrze, że jesteśmy gotowi stworzyć będzie wkład mózgu.

04:34.890 --> 04:36.000
Zróbmy to.

04:36.000 --> 04:42.690
Przedstawiam teraz te akcje akcji liczb rzeczywistych teraz zmienna liczba liczba równa.

04:42.720 --> 04:47.870
Teraz zajmiemy się naszym środowiskiem zagłady, które jest zmienną, którą stworzyliśmy.

04:48.150 --> 04:49.330
Tak samo jak ja.

04:49.500 --> 04:56.250
Następnie dodajemy tutaj, a następnie dobrze tu, bierzemy pierwszą tu przestrzeń akcji, która jest zbiorem

04:56.250 --> 04:57.200
twoich działań.

04:57.230 --> 05:01.960
Zachęcam do zapoznania się z otwarciem w Horrible's, aby zobaczyć, jak to działa.

05:02.010 --> 05:05.530
Wiesz, jak zrozumieć, jak otworzyć pracę w siłowni.

05:05.670 --> 05:07.940
Ale w zasadzie jest to zestaw działań.

05:08.040 --> 05:14.070
Z tego zestawu działań możemy uzyskać dostęp do liczby działań w środowisku i wykonać te

05:14.120 --> 05:15.770
dane tu i teraz.

05:16.080 --> 05:25.050
I to jest liczba akcji, a więc i zagłada, a przestrzeń akcji powróci 7 6:48, ponieważ jest

05:25.050 --> 05:26.550
siedem akcji.

05:26.760 --> 05:32.640
Wiem, że widzimy sześć akcji w dwóch środowiskach na stronie otwierającej, ale myślę, że możemy również

05:32.640 --> 05:33.400
uruchomić.

05:33.490 --> 05:39.000
A więc wiesz, że możemy iść do przodu, ruszać się w lewo, skręcić w prawo, skręcić w lewo, skręcić w prawo i strzelać.

05:39.000 --> 05:45.090
Poza tym możemy biegać, co sprawia, że siedem akcji jest w porządku, i to wszystko, aby uzyskać środowisko,

05:45.330 --> 05:47.010
w którym musimy działać.

05:47.040 --> 05:52.640
Mamy szereg działań, więc mamy do tej pory wszystko, czego potrzebujemy dla naszego mózgu.

05:52.800 --> 05:58.320
Następnie stworzymy obiekt lub obiekt mózgu, który nazwiemy minimalnymi literami CNN.

05:58.500 --> 06:04.500
A ponieważ jakakolwiek funkcja przyjmuje jako argument pewną liczbę działań, umieścimy liczbę

06:04.900 --> 06:11.160
akcji w scenie, obiekt, który stworzymy, a następnie oczywiście stworzymy ciało i ostatecznie sztuczną

06:11.160 --> 06:11.690
inteligencję.

06:11.850 --> 06:18.090
I dlatego w następnej sekcji mam zamiar nazywać to budowaniem sztucznej inteligencji, ponieważ teraz możemy zbudować tyle oczu,

06:18.090 --> 06:19.170
ile chcemy.

06:19.170 --> 06:22.070
To jest niesamowite w programowaniu obiektowym.

06:22.110 --> 06:24.290
Możemy zbudować dowolne AI, jak chcemy.

06:24.320 --> 06:29.820
W ten sposób zbudujemy naszą sztuczną inteligencję, która ma wyrafinowany mózg i dokładnie to

06:29.970 --> 06:31.690
zrobimy w następnym samouczku.

06:31.860 --> 06:33.430
Do tego czasu ciesz się AI.
