WEBVTT

00:00.630 --> 00:03.850
Ciao e bentornati al corso sull'intelligenza artificiale.

00:03.990 --> 00:09.260
Nel tutorial di oggi iniziamo la sezione sull'apprendimento cool convoluzionale profondo.

00:09.420 --> 00:11.010
Quindi diamo un'occhiata a cosa si tratta.

00:11.010 --> 00:14.040
In precedenza abbiamo parlato dell'apprendimento in profondità.

00:14.040 --> 00:21.270
Quindi avevamo un ambiente in cui un agente e avevamo un vettore che descriveva quell'ambiente che è stato inserito

00:21.270 --> 00:26.310
in una rete neurale e alla fine abbiamo ottenuto i valori q come output.

00:26.310 --> 00:29.970
E poi ovviamente abbiamo scoperto come frenare la parte di apprendimento.

00:29.970 --> 00:34.650
Abbiamo scoperto come vengono decise le azioni in base a quei valori che costituiscono una parte di azione.

00:34.650 --> 00:42.380
E abbiamo parlato delle politiche di selezione delle azioni e di diverse cose su come funziona l'apprendimento profondo.

00:42.420 --> 00:51.240
Ma qui il concetto chiave di tutto questo è come ottenere da questo dall'ambiente reale

00:51.240 --> 00:54.450
e dagli stati alla rete neurale.

00:54.480 --> 00:56.190
Bene, la transizione è finita qui.

00:56.220 --> 01:02.250
I vettori di input quindi l'input Lehre della nostra rete neurale ed è un vettore.

01:02.250 --> 01:06.570
Quindi, quello che stiamo guardando è OK, quindi stiamo veramente seguendo la curva.

01:06.600 --> 01:08.830
Non è il termine corretto, non stiamo guardando nulla.

01:08.940 --> 01:12.330
L'agente ha fondamentalmente questa informazione.

01:12.330 --> 01:18.490
Quindi l'ambiente sta analizzando questa informazione dicendo OK, l'agente che stai attualmente nel tuo stato è descritto

01:18.560 --> 01:26.160
dal settore in questo esempio semplificato è descritto da questo vettore X-1 di 1 x 2 di 2 quindi le tue coordinate

01:26.160 --> 01:31.410
sono 1 2 e questo è il tuo intero stato in un ambiente più complesso.

01:31.410 --> 01:37.920
L'affermazione e tutte le altre cose che l'agente può osservare, ma il punto qui è che è possed

01:37.920 --> 01:39.040
come un vettore.

01:39.240 --> 01:45.750
E il fatto è che ciò non accade nella vita reale nella vita reale tranne che per i sistemi GPS e altre cose

01:45.780 --> 01:46.470
del genere.

01:46.530 --> 01:51.830
Ma nella vita reale, cosa usiamo la maggior parte delle volte che usiamo i nostri sensi, usiamo i nostri occhi anche in GPS.

01:51.930 --> 01:53.670
Non è incorporato nel nostro cervello.

01:53.670 --> 01:56.420
Non ci sta dicendo le coordinate attraverso il nostro cervello.

01:56.430 --> 02:02.880
Quindi stiamo ancora usando i nostri occhi per guardare il GPS e capire cosa sta succedendo lì.

02:02.910 --> 02:09.310
E quindi questo è un modo di barare perché l'intelligenza artificiale sia in grado di ottenere informazioni sull'ambiente come un

02:09.310 --> 02:09.620
vettore.

02:09.620 --> 02:12.030
È troppo semplice non è come funziona nella vita reale.

02:12.030 --> 02:17.040
Questo non è il modo in cui noi umani operiamo e alla fine vogliamo creare un'intelligenza

02:17.340 --> 02:23.310
artificiale che possa operare in modo simile agli umani, in quanto può affrontare le stesse sfide degli umani.

02:23.320 --> 02:28.740
E così nel mondo umano non abbiamo che non abbiamo che non abbiamo queste coordinate o altri

02:28.740 --> 02:33.870
tipi di vettori che ci vengono trasmessi che spiegano lo stato in cui ci troviamo in quell'ambiente.

02:33.870 --> 02:37.350
Quindi dovremo rimuoverlo per renderlo più realistico.

02:37.410 --> 02:42.180
E poi cosa possiamo sostituirlo con ciò che vediamo o che cosa facciamo da umani per ottenere informazioni.

02:42.180 --> 02:46.860
Beh, la maggior parte delle volte vediamo naturalmente tutti i nostri sensi, ma la maggior parte

02:46.860 --> 02:51.300
delle informazioni che stiamo ricevendo sul mondo intorno a noi passa attraverso la nostra vista.

02:51.510 --> 02:59.340
Ed è per questo che cambieremo quella piccola freccia che avevamo in un'intera rete neurale

02:59.340 --> 03:00.090
convoluzionale.

03:00.090 --> 03:02.700
Quindi questo è dal nostro Onix.

03:02.700 --> 03:08.400
Al secondo posto abbiamo la convulsione Larry ed è per questo che è importante sentirsi a proprio agio

03:08.460 --> 03:13.290
con le reti neuronali condizionali dell'evoluzione e come funziona se hai fatto un rapporto ODP e

03:13.350 --> 03:14.910
dovresti sentirti a tuo agio.

03:14.930 --> 03:20.490
Oppure puoi dare un'occhiata al prossimo numero due che abbiamo alcuni tutorial di intuizione molto buoni lì.

03:20.670 --> 03:26.160
Quindi qui abbiamo l'operazione convoluzionale che accade, quindi in realtà la vedremo

03:26.160 --> 03:27.330
come un'immagine.

03:27.330 --> 03:31.350
Quindi questa è un'immagine di Net environment.

03:31.350 --> 03:33.990
E così l'agente sta effettivamente guardando l'ambiente.

03:33.990 --> 03:39.870
Quindi, in questo caso, non è che sia come guardare da lì, è come sembrare così.

03:39.930 --> 03:44.710
Diciamo che sta giocando a questo su un computer e può vedere questo ambiente e

03:44.760 --> 03:48.480
quindi può vedere come è effettivamente questa figura che rappresenta l'agente.

03:48.480 --> 03:53.340
Puoi vedere il suo intero in virale o qualunque cosa un umano vedrebbe se è un vero labirinto e l'umano

03:53.340 --> 03:54.270
vedrebbe il labirinto dall'interno.

03:54.270 --> 03:56.480
E così l'agente dovrebbe essere in grado di fare esattamente la stessa cosa.

03:56.700 --> 04:03.000
di più su queste diverse parti della rete neurale convoluzionale in allegato e poi gli ufficiali si appiattiscono.

04:03.030 --> 04:10.140
Quindi quello che dice che è fatto passa attraverso un tumulto di trambusto, una specie di pazzo che tira una gamba

04:10.140 --> 04:12.680
va lì appiattendosi di nuovo, puoi scoprire

04:12.690 --> 04:19.950
Quindi abbiamo input che entrano nella rete neurale e questo è un modo più realistico

04:19.950 --> 04:29.010
perché l'agente deve utilizzare i loro siti e deve elaborare le immagini che l'ambiente fornisce all'agente proprio come un

04:29.400 --> 04:31.590
essere umano elaborerebbe le immagini.

04:31.590 --> 04:37.410
E la bellezza di questo non è solo che è più realistico ed è un po 'come più come una tonalità.

04:37.410 --> 04:43.280
L'età è in realtà più come un essere umano, ma ci consente di elaborare ambienti molto più complessi.

04:43.380 --> 04:49.050
collegare l'intelligenza artificiale a qualsiasi ambiente che, come gli umani, ha una visione di è e.

04:49.050 --> 04:55.980
Ad esempio questo è il modo in cui possiamo giocare a Doom o altri giochi del genere perché invece di

04:56.080 --> 05:02.230
ottenere un vettore di informazioni che come qualcuno avrebbe creato per noi in questo ambiente, possiamo semplicemente

05:02.430 --> 05:08.280
Come umano quando stai giocando a questo gioco puoi vedere esattamente questa immagine e questo è esattamente

05:08.760 --> 05:12.450
ciò che la rete neurale artificiale o l'agente vedrebbero ora.

05:12.540 --> 05:17.580
Quindi, in questa parte del corso, quando si esploreranno le pratiche Tournelles, l'agente vedrà effettivamente

05:17.580 --> 05:22.890
questa immagine esatta vedrà i pixel otterrà questa immagine esatta piena di pixel di questa persona

05:22.890 --> 05:28.410
con questo siamo andati con questa faccia con questa percentuale con tutto esattamente ciò che vediamo

05:28.410 --> 05:30.710
qui è esattamente ciò che vedrà l'agente.

05:30.870 --> 05:37.470
Quindi dovrà dissezionarlo tirando l'ingrasso e poi andrà in una rete neurale.

05:37.650 --> 05:42.150
E inutile dire che le reti neurali in realtà sono molto più complesse di così sostituiamole con qualcosa

05:42.150 --> 05:42.780
di simile.

05:42.780 --> 05:44.480
Questo non è molto più complesso.

05:44.520 --> 05:49.350
Questo sembra un po 'più complesso, ma in realtà le reti neurali funzioneranno

05:49.380 --> 05:54.140
e creeranno se si sarà abbastanza interessanti e molto più complessi di così.

05:54.150 --> 05:59.910
Ma come puoi vedere già qui, anche se hai solo cinque input e una sorta di due cose diventano molto

05:59.970 --> 06:04.380
più complesse e qui puoi vedere che abbiamo molte più azioni che l'agente può intraprendere.

06:04.380 --> 06:10.850
Quindi, nel gioco del destino, gira a sinistra ea destra, guarda verso l'alto, lo scatto di Ron si ricarica.

06:10.890 --> 06:16.290
O sai che tutte quelle azioni diverse che sono possibili in prima persona dovrebbero essere come.

06:16.290 --> 06:19.430
E inoltre non deve essere quello che puoi.

06:19.430 --> 06:23.190
Puoi toccare questo agente per un altro tipo di gioco.

06:23.190 --> 06:29.940
Questa è la sua bellezza che poi si rende conto che ora può gestire qualsiasi tipo di ambiente

06:29.940 --> 06:34.260
a cui lo si collega perché finché c'è una rappresentazione visiva dell'ambiente

06:34.680 --> 06:39.940
di quell'ambiente è già presente l'intera infrastruttura l'intera struttura è pronta per l'elaborazione quella.

06:39.960 --> 06:43.980
Ecco, questo è il profondo apprendimento di CUOL convoluzionale.

06:43.980 --> 06:51.120
Quindi lo portiamo anche al prossimo passo in cui stiamo aggiungendo convoluzioni o Lares convoluzionali nel nostro

06:51.120 --> 06:58.980
cervello di agenti ora e lo stiamo rendendo ancora più complesso e quindi possiamo annoiarci di essere in grado

06:58.980 --> 07:01.260
di risolvere anche più complesse sfide.

07:01.410 --> 07:06.720
Quindi spero che tu sia molto eccitato per questo sarà in una sezione epica e creeremo

07:06.720 --> 07:10.460
cose incredibili e non vedo l'ora di vederti in quel prossimo tutorial.

07:10.480 --> 07:12.130
E fino ad allora goditi l'intelligenza artificiale.