WEBVTT

00:00.640 --> 00:02.940
Olá e bem-vindo de volta ao curso sobre aprendizagem profunda.

00:02.970 --> 00:09.120
Hoje estamos falando sobre uma pista que é corrigida em suas unidades e este é um passo

00:09.120 --> 00:12.180
adicional em cima do nosso passo de convolução.

00:12.180 --> 00:16.140
Portanto, não é um grande passo separado, é um pequeno passo no primeiro passo, basicamente.

00:16.290 --> 00:18.230
E o que está acontecendo aqui.

00:18.240 --> 00:24.090
Bem, nós temos a nossa imagem de entrada que temos todos convolucionários lá que discutimos e, em

00:24.090 --> 00:26.080
seguida, além disso, vamos nos candidatar.

00:26.400 --> 00:27.190
Espere por isso.

00:27.240 --> 00:36.720
Nossa função de retificador favorita e você está familiarizado com a função de retificador da seção anterior sobre

00:36.750 --> 00:47.400
redes neurais artificiais e, em nossos Sozais, autores ou instrutores separam a convolução e o fogo direto como duas etapas

00:47.430 --> 00:54.030
separadas em nossos exemplos, que os considerará apenas um grande passo para a

00:54.030 --> 00:57.060
segunda evolução, em seguida, o retificador.

00:57.270 --> 01:03.750
E a razão pela qual estamos aplicando o retificador é porque você quer aumentar a não linearidade

01:03.780 --> 01:13.410
em nossa imagem ou em nossa rede e nossa rede neural comercial e nosso fogo atua como esse filtro ou acessa essa função que se rompe

01:13.440 --> 01:19.200
e você é o arity e o pelo que queremos aumentar a não-linearidade em nossa

01:19.440 --> 01:25.950
rede é porque as imagens em si são altamente não-lineares, especialmente se você estiver reconhecendo diferentes objetos

01:26.010 --> 01:32.790
próximos uns dos outros ou apenas em segundo plano e coisas assim, como a imagem, terá muitos elementos

01:33.180 --> 01:38.050
não-lineares e a transição entre pixéis pixels adjacentes é muitas vezes seria não-linear.

01:38.040 --> 01:41.280
Isso é o que você conhece porque as suas fronteiras são diferentes, as cores são diferentes.

01:41.460 --> 01:46.020
Existem elementos diferentes em suas imagens e, ao mesmo tempo em que

01:46.020 --> 01:52.410
estamos aplicando uma operação matemática, como a convolução, você conhece e executa essa detecção de recursos

01:52.710 --> 01:59.710
para criar nossos mapas de recursos, arriscamos que possamos criar algo linear e, portanto, precisamos dividir a narrativa.

01:59.970 --> 02:05.960
Então, vamos dar uma olhada em um exemplo aqui é uma imagem e imagem original.

02:05.970 --> 02:13.220
Agora, quando aplicamos um detector de detecção de recursos a esta imagem, recebemos algo assim.

02:13.290 --> 02:16.230
Então, você pode ver aqui que o preto é branco negativo também é um valor positivo.

02:16.230 --> 02:22.980
Quando você aplica um detector de recursos a uma imagem adequada que não tem apenas zeros e outros, mas tem muitos

02:22.980 --> 02:28.890
valores diferentes e você se aplica, como vimos anteriormente, o Texas pode ter valores negativos em si mesmo,

02:29.070 --> 02:30.920
às vezes você obterá valores negativos.

02:31.080 --> 02:34.670
E aqui estão os negros negativos, os brancos são positivos.

02:34.800 --> 02:45.240
E o que uma função de unidade linear rectificada faz é que remove todos os direitos negros em qualquer coisa abaixo de zero, ele se

02:45.240 --> 02:46.490
transforma em zero.

02:46.560 --> 02:49.160
E por isso, isso se transforma neste direito.

02:49.290 --> 02:57.990
E é por isso que é muito difícil ver qual é exatamente o benefício em termos de rompimento

02:58.050 --> 02:58.910
da linearidade.

02:59.400 --> 03:01.050
Vou tentar explicar.

03:01.080 --> 03:07.740
Vou tentar mostrar um exemplo sobre esta imagem, mas no final do dia, isso é um conceito muito matemático

03:07.740 --> 03:12.480
e teria que entrar em muitas matemáticas para realmente explicar o que está acontecendo.

03:12.480 --> 03:13.800
Mas vamos tentar vamos dar uma olhada.

03:13.800 --> 03:16.800
Então, por exemplo, vamos ver isso.

03:16.860 --> 03:17.580
Este edifício aqui.

03:17.580 --> 03:18.070
Certo.

03:18.090 --> 03:20.150
Então este é um prédio por conta própria.

03:20.730 --> 03:22.400
Então você pode ver essa sombra.

03:22.440 --> 03:29.010
Esta parte negra desta sombra aqui também, você vê que é branco o reflexo da luz e então é um

03:29.010 --> 03:33.160
cinza e então fica mais escuro e então fica mais escuro novamente.

03:33.240 --> 03:35.860
Então, e quando nós tiramos, tiramos esse ponto negro.

03:35.860 --> 03:38.220
Então pense nisso em termos de linearidade.

03:38.250 --> 03:43.700
Então, parece que quando você passa de branco para cinza, o próximo passo seria preto.

03:43.740 --> 03:50.970
Certo, o próximo será preto, é uma progressão linear de brilhante para escuro e, portanto, isso

03:50.970 --> 03:53.490
é como uma situação linear.

03:53.490 --> 03:56.560
Quando você tira o preto, você rompe a linearidade.

03:56.670 --> 03:57.800
Vamos tentar outro.

03:58.050 --> 03:59.110
Vamos dar uma olhada aqui.

03:59.220 --> 04:01.980
E ao mesmo tempo ainda é o mesmo edifício certo.

04:01.980 --> 04:08.320
Não é como você ou o seu, não é como se você estivesse misturando dois edifícios um no outro,

04:08.550 --> 04:09.810
mas isso é secundário.

04:09.810 --> 04:11.940
O ponto principal é dividir a linearidade.

04:12.210 --> 04:13.590
Então vamos dar uma olhada na mesma coisa.

04:13.590 --> 04:19.480
Então você vê cinza branco cinza preto e branco.

04:19.590 --> 04:22.520
E quando você derrubar você não tem mais isso certo.

04:22.530 --> 04:29.600
Você não tem essa progressão da progressão gradual que você apenas tem como uma mudança abrupta.

04:29.730 --> 04:33.540
E isso ajuda a introduzir a não-linearidade em sua imagem.

04:33.540 --> 04:42.540
Então, é uma explicação muito áspera, muito tipo de sobre ou sobre a explicação dos dedos, em vez de técnica, mas espero que o

04:42.690 --> 04:47.370
tipo de ajuda a entender um pouco melhor do que estamos falando aqui.

04:47.370 --> 04:54.870
Então, aqui novamente, você pode ver o cinza branco é um exemplo melhor até mais brilhante e mais escuro, mais escuro e

04:54.980 --> 04:55.680
mais escuro.

04:55.680 --> 05:04.460
Então, essa parte parece ser mais fina do que você quebrar novamente assim, então esta é uma explicação muito áspera.

05:04.480 --> 05:08.570
Não é absolutamente perfeito, mas pelo menos dá uma ideia do que está acontecendo.

05:08.800 --> 05:14.120
Mas se você quiser saber mais, há um bom papel, como sempre, sempre há um papel.

05:14.200 --> 05:20.370
Este é do corpo CCJ da Universidade da Califórnia e é chamado de redes neuronais de

05:20.380 --> 05:22.980
compreensão compreensiva que têm um modelo matemático.

05:23.200 --> 05:28.840
E basicamente eles são Ele responde a perguntas e você precisa apenas olhar para o primeiro.

05:28.840 --> 05:33.820
E a questão é por que não é uma função de ativação não-linear é essencial na

05:33.820 --> 05:36.130
saída do filtro de todas as camadas intermediárias.

05:36.220 --> 05:44.280
Então, esse tipo de explica isso em um pouco mais de detalhes tanto em termos de intuição quanto principalmente em termos de matemática.

05:44.320 --> 05:47.970
Então, esse é um documento interessante onde você pode obter mais informações adicionais sobre este tópico.

05:48.100 --> 05:53.360
E se você realmente quiser entrar e explorar algumas coisas legais aqui.

05:53.360 --> 05:55.690
Depois, há outro artigo sobre o qual você pode estar interessado.

05:55.690 --> 06:01.720
É chamado de aprofundar o retificador superando o desempenho do nível de nível humano na imagem

06:01.720 --> 06:02.830
e essa classificação.

06:02.920 --> 06:09.190
E aqui o autor está penteando o cabelo e outros da Microsoft Research.

06:09.400 --> 06:17.630
Eles propõem um tipo diferente de função de unidade rectificada rectificada.

06:17.650 --> 06:21.830
Eles propõem a função paramétrica corrigida que você vê aqui à direita.

06:22.030 --> 06:26.740
E eles argumentam que oferece melhores resultados sem sacrificar o desempenho.

06:26.740 --> 06:30.200
Tão interessante ler se você gostaria de obter um pouco mais sobre este tópico.

06:30.490 --> 06:32.020
E isso é tudo para hoje.

06:32.280 --> 06:38.380
Realmente você camada é bastante simples, então, para ajustar apenas aplicando a função de retificador e espero vê-lo

06:38.380 --> 06:39.230
na próxima vez.

06:39.250 --> 06:40.770
Até então, aproveite a aprendizagem.
