WEBVTT

00:00.630 --> 00:03.850
Cześć i witam z powrotem na kursie na temat sztucznej inteligencji.

00:03.990 --> 00:09.260
W dzisiejszym tutorialu zaczynamy od sekcji o głębokim splotowym, fajnym uczeniu się.

00:09.420 --> 00:11.010
Zobaczmy więc, o co w tym wszystkim chodzi.

00:11.010 --> 00:14.040
Wcześniej rozmawialiśmy o głębokiej, fajnej nauce.

00:14.040 --> 00:21.270
Tak więc mieliśmy środowisko, w którym agent i mieliśmy wektor opisujący to środowisko, które zostało wprowadzone do

00:21.270 --> 00:26.310
sieci neuronowej, a na końcu otrzymaliśmy wartości q jako nasze wyniki.

00:26.310 --> 00:29.970
A potem oczywiście dowiedzieliśmy się, jak powstrzymać część edukacyjną.

00:29.970 --> 00:34.650
Dowiedzieliśmy się, jak decyzje są podejmowane na podstawie tych wartości, które są częścią działania.

00:34.650 --> 00:42.380
Rozmawialiśmy o polityce selekcji działań i różnych rzeczach dotyczących tego, jak działa głęboka nauka.

00:42.420 --> 00:51.240
Ale tutaj kluczową koncepcją tego wszystkiego jest to, w jaki sposób uzyskujemy z niego rzeczywiste środowisko

00:51.240 --> 00:54.450
i stany do sieci neuronowej.

00:54.480 --> 00:56.190
Cóż, przejście jest tutaj.

00:56.220 --> 01:02.250
Wektory wejściowe więc wejście Lehre naszej sieci neuronowej i jest to wektor.

01:02.250 --> 01:06.570
A więc to, na co patrzymy, jest w porządku, więc w rzeczywistości wychodzimy na zakręt.

01:06.600 --> 01:08.830
To nie jest właściwe określenie, na które nie patrzymy.

01:08.940 --> 01:12.330
Agent zasadniczo ma te informacje.

01:12.330 --> 01:18.490
Tak więc środowisko przetwarza tę informację, mówiąc: OK, agent, w którym aktualnie znajdujesz się w tym stanie,

01:18.560 --> 01:26.160
jest opisany przez sektor w tym uproszczonym przykładzie, który jest opisany przez ten wektor X-1 1 x 2 z 2, więc twoje

01:26.160 --> 01:31.410
współrzędne wynoszą 1 2 i to jest twój cały stan w bardziej złożonym środowisku.

01:31.410 --> 01:37.920
Oświadczenie i wszystkie inne rzeczy, które agent może obserwować, ale chodzi tutaj o to, że jest on pospolity

01:37.920 --> 01:39.040
jako wektor.

01:39.240 --> 01:45.750
Chodzi o to, że w prawdziwym życiu tak się nie dzieje, z wyjątkiem systemów GPS i innych tego typu

01:45.780 --> 01:46.470
rzeczy.

01:46.530 --> 01:51.830
Ale w rzeczywistości, czego używamy przez większość czasu, kiedy używamy zmysłów, używamy naszych oczu nawet w GPS.

01:51.930 --> 01:53.670
To nie jest wbudowane w nasz mózg.

01:53.670 --> 01:56.420
Nie podaje nam współrzędnych przez nasz mózg.

01:56.430 --> 02:02.880
Więc wciąż używamy naszych oczu, aby spojrzeć na GPS i zrozumieć, co się tam dzieje.

02:02.910 --> 02:09.620
I to jest rodzaj oszustwa dla AI, aby uzyskać jak informacje o środowisku jako wektor.

02:09.620 --> 02:12.030
To zbyt proste, że tak nie działa w prawdziwym życiu.

02:12.030 --> 02:17.040
To nie jest sposób, w jaki działamy jako ludzie, i ostatecznie chcemy stworzyć sztuczną

02:17.340 --> 02:23.310
inteligencję, która może działać w podobny sposób jak człowiek, który może podjąć takie same wyzwania jak ludzie.

02:23.320 --> 02:28.740
Tak więc w ludzkim świecie nie mamy tego, czego nie mamy, nie mamy tych współrzędnych ani innych

02:28.740 --> 02:33.870
typów wektorów, które są nam przekazywane, które wyjaśniają stan, w jakim się znajdujemy w tym środowisku.

02:33.870 --> 02:37.350
Musimy więc usunąć to, aby było bardziej realistyczne.

02:37.410 --> 02:42.180
A co możemy zastąpić tym, co widzimy lub co robimy jako człowiek, aby uzyskać informacje.

02:42.180 --> 02:46.860
Przez większość czasu widzimy oczywiście wszystkie nasze zmysły, ale większość informacji, które

02:46.860 --> 02:51.300
dostajemy na temat otaczającego nas świata, pojawia się w naszych oczach.

02:51.510 --> 02:59.340
I dlatego zamierzamy zmienić tę małą strzałkę, którą mieliśmy w całą splotową sieć

02:59.340 --> 03:00.090
neuronową.

03:00.090 --> 03:02.700
To jest od naszych Onix.

03:02.700 --> 03:08.400
Po drugie, mamy drgawki Larry'ego i dlatego ważne jest, aby czuć się komfortowo z uwarunkowanymi ewolucyjnie

03:08.460 --> 03:13.290
sieciami neuronowymi i jak to działa, jeśli odbyłeś stosunek seksualny ODP i powinieneś

03:13.350 --> 03:14.910
być z tym zadowolony.

03:14.930 --> 03:20.490
Albo możesz po prostu rzucić okiem na następny numer dwa, mamy tam bardzo dobre tutoriale intuicyjne.

03:20.670 --> 03:26.160
Mamy tu więc splotową operację, tak więc będziemy patrzeć na to

03:26.160 --> 03:27.330
jako obraz.

03:27.330 --> 03:31.350
Oto obraz środowiska sieciowego.

03:31.350 --> 03:33.990
Tak więc agent faktycznie patrzy na środowisko.

03:33.990 --> 03:39.870
Więc w tym przypadku nie jest tak, że patrzy z zewnątrz, jakby wyglądał w ten sposób.

03:39.930 --> 03:44.710
Powiedzmy, że gra on na komputerze i widzi to środowisko i dlatego

03:44.760 --> 03:48.480
widzi, że ta liczba reprezentująca agenta faktycznie jest.

03:48.480 --> 03:53.340
Możesz zobaczyć jego całość w wirusie lub cokolwiek, co człowiek zobaczyłby, gdyby to był prawdziwy labirynt, a człowiek zobaczyłby

03:53.340 --> 03:54.270
labirynt od środka.

03:54.270 --> 03:56.480
Tak więc agent powinien być w stanie dokładnie to samo.

03:56.700 --> 04:03.000
Więc to, co mówi, odbywa się przez komornicze legowisko, w którym idziesz jak głupiec ciągnąc

04:03.030 --> 04:10.140
nogę tam, gdzie spłaszczasz, znowu możesz dowiedzieć się więcej o tych różnych częściach splotowej sieci neuronowej w

04:10.140 --> 04:12.680
aneksie, a potem oficerowie spłaszczeni.

04:12.690 --> 04:19.950
Następnie mamy dane wejściowe, które trafiają do sieci neuronowej i jest to bardziej realistyczne,

04:19.950 --> 04:29.010
ponieważ agent musi korzystać ze swoich witryn i lub musi przetwarzać obrazy, które środowisko dostarcza agentowi, tak jak

04:29.400 --> 04:31.590
człowiek przetwarzał obrazy.

04:31.590 --> 04:37.410
A piękno tego jest nie tylko tym, że jest bardziej realistyczne i jest bardziej jak barwa.

04:37.410 --> 04:43.280
Wiek jest tym bardziej, w jakim jest człowiek, ale pozwala nam przetwarzać znacznie bardziej złożone środowiska.

04:43.380 --> 04:49.050
Na przykład w ten sposób możemy grać w Doom lub inne gry tego typu,

04:49.050 --> 04:55.980
ponieważ zamiast po prostu uzyskać wektor informacji, który jak ktoś mógłby stworzyć dla nas w tym środowisku, możemy

04:56.080 --> 05:02.230
po prostu podłączyć sztuczną inteligencję do dowolnego środowiska, które jako człowiek ma wizję z jest i.

05:02.430 --> 05:08.280
Jako człowiek, kiedy grasz w tę grę, możesz zobaczyć dokładnie to zdjęcie i

05:08.760 --> 05:12.450
właśnie to zobaczy sztuczna sieć neuronowa lub agent.

05:12.540 --> 05:17.580
Więc w tej części kursu, kiedy masz zamiar zbadać praktyczne Tournelles,

05:17.580 --> 05:22.890
agent zobaczy dokładnie to zdjęcie, zobaczy, że piksele dostaną dokładnie ten obraz pełen

05:22.890 --> 05:28.410
pikseli tej osoby z tą twarzą z tym procentem ze wszystkim, co tu

05:28.410 --> 05:30.710
widzimy, dokładnie to zobaczy agent.

05:30.870 --> 05:37.470
Wtedy będzie musiał to rozdzielić, poprzez wyciągnięcie tuczu, a następnie przejdzie do sieci neuronowej.

05:37.650 --> 05:42.150
I nie trzeba dodawać, że sieci neuronowe są znacznie bardziej skomplikowane, więc zastąpmy je czymś

05:42.150 --> 05:42.780
takim.

05:42.780 --> 05:44.480
To nie jest bardziej skomplikowane.

05:44.520 --> 05:49.350
Wygląda to trochę bardziej skomplikowanie, ale w rzeczywistości sieci neuronowe będą pracować i

05:49.380 --> 05:54.140
tworzyć, jeśli zamierzasz być dość interesujący i będzie o wiele bardziej złożony.

05:54.150 --> 05:59.910
Ale jak widzisz już tutaj, nawet jeśli masz tylko pięć danych wejściowych i dwie rzeczy stają się znacznie bardziej

05:59.970 --> 06:04.380
złożone, a tutaj widzisz, że mamy dużo więcej akcji, które może podjąć agent.

06:04.380 --> 06:10.850
W grze zagłady skręć w lewo i w prawo, spójrz w dół, aby przeładować zdjęcie Rona.

06:10.890 --> 06:16.290
Lub wiesz, że wszystkie te różne czynności, które są możliwe w pierwszej osobie, powinny lubić.

06:16.290 --> 06:19.430
Co więcej nie musi tak być.

06:19.430 --> 06:23.190
Możesz dotknąć tego agenta do innego rodzaju gry.

06:23.190 --> 06:29.940
To jest piękno tego, że zdaje sobie sprawę, że może teraz obsługiwać dowolne środowisko, do którego się

06:29.940 --> 06:34.260
przyłącza, ponieważ tak długo, jak istnieje wizualna reprezentacja środowiska

06:34.680 --> 06:39.940
tego środowiska, ma już całą infrastrukturę, cała struktura jest gotowa do przetworzenia że.

06:39.960 --> 06:43.980
A więc na tym polega głęboka, splotowa nauka CULE.

06:43.980 --> 06:51.120
Tak więc zabieramy to nawet do następnego kroku, do którego dodajemy teraz skręty lub konwergentne Lares

06:51.120 --> 06:58.980
do mózgu naszych agentów, a my robimy to jeszcze bardziej złożonym i dlatego możemy znudzić się możliwością rozwiązania

06:58.980 --> 07:01.260
jeszcze bardziej złożonego wyzwania.

07:01.410 --> 07:06.720
Mam więc nadzieję, że jesteś bardzo podekscytowany tym, że znajdzie się w epickim odcinku, a my stworzymy niesamowite

07:06.720 --> 07:10.460
rzeczy i nie mogę się doczekać, aby zobaczyć cię w następnym samouczku.

07:10.480 --> 07:12.130
A do tego czasu ciesz się AI.