WEBVTT

00:00.390 --> 00:03.060
Ciao e bentornati al corso di deep learning.

00:03.120 --> 00:06.010
Quindi abbiamo imparato molto in questa sezione del corso.

00:06.030 --> 00:08.390
Riassumiamo ciò di cui abbiamo parlato.

00:08.580 --> 00:09.920
Va bene, eccoci qui.

00:10.110 --> 00:16.230
Abbiamo iniziato con un'immagine di input a cui abbiamo applicato più rivelatori di caratteristiche diverse o chiamati

00:16.230 --> 00:19.100
anche filtri per creare queste mappe di funzioni.

00:19.140 --> 00:21.530
E questo comprende la nostra tana convoluzionale.

00:21.630 --> 00:28.910
applicato il reglue o l'unità lineare rettificata per rimuovere ogni chiarezza o aumentare la non-linearità nelle nostre immagini.

00:28.980 --> 00:32.050
Quindi, sopra a quella cruciale Lehre, abbiamo

00:32.060 --> 00:36.970
Quindi abbiamo applicato una tana di raggruppamento alla nostra tana convoluzionale.

00:36.990 --> 00:44.910
Quindi, da ogni singola mappa delle caratteristiche, abbiamo creato una mappa delle funzionalità e in pratica il tiro Lehre ha

00:44.910 --> 00:45.840
molti vantaggi.

00:45.840 --> 00:54.150
Lo scopo principale del Lair di tiro è assicurarsi di avere uno speciale invariante spaziale nelle nostre

00:54.330 --> 00:54.690
immagini.

00:54.690 --> 01:01.890
Quindi, in pratica, se qualcosa si inclina o si attorciglia o è un po 'diverso dallo scenario ideale, allora possiamo

01:01.890 --> 01:07.210
ancora cogliere quella caratteristica e tirare in modo significativo riduce la dimensione delle nostre immagini.

01:07.260 --> 01:15.360
Inoltre, il pooling aiuta ad evitare qualsiasi tipo di sovradattamento dei nostri dati o del modello generale ai dati perché semplicemente

01:15.360 --> 01:18.220
si libera di molti di quei dati.

01:18.450 --> 01:24.300
Ma allo stesso tempo, il pooling conserva le funzionalità principali che stiamo cercando solo perché il modo in cui sono state utilizzate le

01:24.330 --> 01:26.720
istruzioni e il pool è stato il pooling massimo.

01:26.970 --> 01:35.760
Quindi abbiamo appiattito tutte le immagini raggruppate in un lungo vettore o colonna di tutti questi valori e l'abbiamo inserita in

01:35.760 --> 01:40.140
una rete neurale artificiale e questo è stato un appiattimento graduale.

01:40.140 --> 01:46.770
quindi abbiamo questo ultimo livello completamente connesso Lehre finale che esegue il voto verso le classi che

01:46.920 --> 01:53.700
seguiamo e poi tutto questo è addestrato attraverso una propagazione in avanti e un processo di propagazione posteriore.

01:53.910 --> 02:00.630
E la Fase 4 è una rete neurale artificiale completamente connessa in cui tutte queste caratteristiche sono

02:00.720 --> 02:02.550
elaborate attraverso una rete e

02:02.580 --> 02:09.730
Molte iterazioni e ai parchi e alla fine abbiamo una rete neurale ben definita.

02:09.920 --> 02:10.470
E.

02:10.730 --> 02:14.850
Un'altra cosa importante è che non solo i pesi sono addestrati nella parte del

02:15.180 --> 02:22.590
lavoro dei neuroni artificiali, ma anche i rilevatori di caratteristiche sono addestrati e regolati nello stesso processo decente degli ingredienti e che ci permettono di elaborare

02:22.590 --> 02:23.930
le migliori mappe di caratteristiche.

02:23.940 --> 02:31.110
alla fine otteniamo una rete neurale convoluzionale completamente addestrata in grado di riconoscere le immagini e classificarle.

02:31.110 --> 02:31.700
E

02:31.770 --> 02:32.360
Quindi eccoci.

02:32.370 --> 02:35.480
È così che funzionano le reti neuronali convoluzionali.

02:35.730 --> 02:42.220
E ora dovresti essere totalmente a tuo agio con questo concetto e pronto a passare alle applicazioni pratiche.

02:42.330 --> 02:51.370
Se desideri fare qualche lettura aggiuntiva, c'è un grande blog di L. D. per sciogliere dal 2016.

02:51.450 --> 02:53.400
Puoi vedere il link lassù in fondo.

02:53.400 --> 02:58.360
Quindi il blog si chiama The Nine deep learning papers che devi sapere sulla comprensione della terza

02:58.440 --> 02:59.180
parte della CNN.

02:59.310 --> 03:04.860
E questo blog ti offre in effetti una breve panoramica di nove diverse CNN

03:04.860 --> 03:10.590
create da persone come te, licken e altri che puoi quindi proseguire e studiare ulteriormente.

03:10.590 --> 03:18.000
Quindi ci saranno un sacco di novità che saranno totalmente nuove per te e che dovrai capire, ma tieni a mente

03:18.000 --> 03:23.880
questo blog sono questi nove documenti in mente e anche se non sei pronto per passare

03:23.880 --> 03:29.220
adesso forse dopo i tutorial pratici forse dopo aver fatto un po 'di formazione aggiuntiva

03:29.490 --> 03:36.180
nello spazio dell'apprendimento profondo, puoi quindi fare riferimento a questi lavori e idealmente penso che otterrai molto valore attraverso

03:36.180 --> 03:41.360
la ricerca attraverso le reti neurali di altre persone e come hanno strutturato .

03:41.550 --> 03:46.620
architettura delle reti neurali perché le reti neurali e le reti neurali convoluzionali non fanno eccezione.

03:46.620 --> 03:51.870
Possono esserci reti illusorie e questo ti aiuterà a capire quali sono le migliori pratiche e

03:51.870 --> 03:57.900
perché le persone hanno fatto certe cose in un certo modo e questo ti aiuterà con la tua

03:58.020 --> 04:05.670
Sono come una sfida di architettura, devi escogitare un'idea e poi strutturarla, quindi modificarla e modificarla

04:05.670 --> 04:11.780
per ottenere il miglior design possibile e le migliori prestazioni possibili e ottimali.

04:11.790 --> 04:12.490
Quindi eccoci.

04:12.510 --> 04:13.430
Siamo noi per oggi.

04:13.420 --> 04:17.720
Spero vi sia piaciuto il tutorial di oggi e tutta questa sezione e non vedo l'ora di vederti la prossima volta.

04:17.730 --> 04:19.440
Fino ad allora godere di un apprendimento profondo.
