WEBVTT

00:00.490 --> 00:02.550
Olá e bem vindo a este tutorial.

00:02.560 --> 00:07.550
Tudo bem, então vamos começar com o primeiro companheiro de nossa galinha moral e a mais importante

00:07.630 --> 00:08.410
que está confusa.

00:08.440 --> 00:09.020
Por quê.

00:09.180 --> 00:14.590
E este é neste arquivo que implementaremos o cérebro do homo, você conhece o cérebro no coração

00:14.650 --> 00:20.290
do Simmo 8: 3 que está neste arquivo que tornará a rede neural que, naturalmente, conviverá alguma

00:20.290 --> 00:25.030
vontade convolucional saberá quando isso funciona Por certo, ainda estamos fazendo alguma aprendizagem de reforço

00:25.030 --> 00:25.570
profundo.

00:25.690 --> 00:31.690
Assim, são capazes de ter olhos e dentro desta rede neural integrará tudo o que está

00:31.870 --> 00:34.600
relacionado ao Craigmile ativo e há um bônus.

00:34.630 --> 00:39.550
Como eu lhe disse que estamos implementando uma das mais poderosas Morais A-3 e o que a

00:39.550 --> 00:45.910
torna poderoso é que ela conterá um registro de uma nova rede e, mais precisamente, na memória LCN a longo prazo para

00:45.910 --> 00:48.660
que possamos aprender as propriedades temporais do que é indo.

00:48.670 --> 00:54.710
Mais uma vez, essas são as propriedades temporais da entrada para que as previsões possam ser ainda melhores.

00:55.270 --> 00:56.050
Então vamos lá.

00:56.050 --> 01:01.330
modelo muito poderoso que combina basicamente todas as redes neurais que vimos no curso de aprofundamento.

01:01.420 --> 01:02.590
Estamos implementando um

01:02.680 --> 01:08.070
Essa é uma rede neural artificial, uma rede neural convolutiva e uma nova rede recorde.

01:08.260 --> 01:13.240
E, no coração de todas essas redes, há, naturalmente, o modelo A-380 que tornará o AI

01:13.240 --> 01:14.040
AI muito poderoso.

01:14.410 --> 01:18.300
Então, vamos fazer isso, vamos atacar esse modelo e implementado.

01:18.430 --> 01:21.760
Então vamos começar fazendo duas funções.

01:21.850 --> 01:26.410
ter pesos e queremos fazer essas duas funções para nós, para que já temos uma

01:26.410 --> 01:30.460
ferramenta para integrar muito facilmente dentro da casa para que a rede neural.

01:30.460 --> 01:36.740
Existem apenas algumas funções que cuidarão de como podemos inicializar os pesos porque você sabe que vamos ter algumas novas

01:36.750 --> 01:38.090
redes e, portanto, vamos

01:38.290 --> 01:41.600
Então, essas duas funções serão colunas normalizadas.

01:41.600 --> 01:48.730
Inicializador que é basicamente uma função que não pode apenas inicializar alguns pesos, mas define uma variância

01:48.730 --> 01:50.370
específica de pesos tensores.

01:50.380 --> 01:52.770
Então é exatamente isso que estamos prestes a implementar agora.

01:53.020 --> 01:57.700
E então, implementaremos a segunda função, que será o peso dessa função e,

01:57.700 --> 02:01.840
basicamente, inicializará os pesos em tempo suficiente como forma de aprender.

02:01.840 --> 02:02.330
Tudo bem.

02:02.350 --> 02:08.070
E então, uma vez que terminamos com essas duas funções, começaremos a implementar a rede neural.

02:08.330 --> 02:14.770
Então, vamos fazer isso, vamos rapidamente fazer essas duas funções, então estou começando

02:14.770 --> 02:24.420
com uma def aqui, então vou dar o nome dessa função que é normalizada e essas colunas baseçam no inicializador.

02:24.720 --> 02:25.550
Aqui vamos nós.

02:25.650 --> 02:28.780
E esta função vai ter apenas duas entradas.

02:29.010 --> 02:35.790
Primeiro, serão os pesos que queremos inicializar e o desvio padrão porque, como acabei de dizer,

02:35.790 --> 02:40.200
queremos definir uma variância específica para o nosso tensor de pesos.

02:40.230 --> 02:45.300
E se você quiser entender por que temos que fazer isso, é porque você sabe quando fazemos a

02:45.620 --> 02:50.490
rede neural que será o ator e o crítico de acordo com o amanha e faremos duas

02:50.490 --> 02:53.670
camadas separadas totalmente conectadas para o ator e um para o crítico.

02:53.880 --> 02:59.970
E estas duas camadas totalmente conectadas terão pesos e definiremos um desvio padrão para cada um

02:59.970 --> 03:01.810
desses dois grupos de pesos.

03:01.860 --> 03:05.650
E então, o que faremos é que vamos definir um pequeno desvio padrão para o ator.

03:05.700 --> 03:12.570
Será em torno de 0. 01 e um grande desvio padrão para a crítica que será em torno de 1, eu acho.

03:12.750 --> 03:18.690
possamos definir facilmente o desvio padrão para os pesos que inicializaremos mais tarde para o ator e o craic.

03:18.690 --> 03:21.900
Então, é por isso que estamos fazendo essa função para que

03:21.930 --> 03:23.560
É por isso que estamos fazendo isso.

03:23.560 --> 03:28.860
Então, agora vamos definir um valor padrão, mas isso mudará depois quando inicializarmos

03:28.860 --> 03:29.500
os pesos.

03:29.520 --> 03:32.100
Então, vamos usar isso para 1. 0.

03:32.240 --> 03:32.920
Tudo bem.

03:33.000 --> 03:37.340
E agora estamos prontos para definir o que está dentro desta função.

03:37.410 --> 03:41.960
Então, o que primeiro preparará é a saída que vamos chamar.

03:42.000 --> 03:46.310
Então, isso é tudo o que será retornado por esta função.

03:46.380 --> 03:50.210
E então, no início, o que vamos fazer é isso.

03:50.330 --> 03:56.750
Então, como você entendeu, essa saída será um tensor de pesos que terá um desvio padrão específico.

03:56.850 --> 04:01.970
Mas antes de cuidar da configuração do desvio padrão, queremos inicializá-lo e, em seguida, vamos definir

04:02.010 --> 04:06.550
o desvio padrão aqui, que é o argumento que é a entrada dessa função.

04:06.870 --> 04:10.670
Então, para inicializar os pesos do tensor, você pode saber como fazê-lo.

04:10.680 --> 04:12.150
Nós já fizemos isso.

04:12.180 --> 04:20.250
tomar a rodada e a função que irá inicializar a resposta torched com pesos aleatórios que seguem uma distribuição normal.

04:21.180 --> 04:27.540
Nós vamos usar nossa biblioteca de torche e, a partir desta biblioteca de torche, vamos

04:27.540 --> 04:29.630
Então é por isso que se chama rant.

04:29.820 --> 04:31.100
E quanto ao normal.

04:31.230 --> 04:36.380
E agora, o que simplesmente precisamos inserir é o número de elementos que a distensão irá conter.

04:36.510 --> 04:41.510
E este número de elementos é, naturalmente, o número de pesos porque estávamos realmente inicializando um

04:41.500 --> 04:43.140
tensor para esses pesos aqui.

04:43.350 --> 04:53.410
E para obter esse número de elementos, podemos simplesmente pegar nossos pesos e adicionar pontos para obter tamanho com parênteses.

04:53.410 --> 05:00.280
do mesmo número de elementos de nossos pesos e será inicializado com pesos aleatórios após uma distribuição normal.

05:00.280 --> 05:05.320
E isso dará o número de elementos e pesos para que ele crie

05:05.320 --> 05:06.860
o tensor da tocha

05:06.860 --> 05:07.330
Tudo bem.

05:07.360 --> 05:13.390
E agora é hora de definir o desvio padrão que queremos ter, que é o desvio padrão aqui.

05:13.510 --> 05:16.960
Então, vamos fazer agora é uma simples normalização.

05:16.960 --> 05:21.400
Temos um sentimento torturado de pesos e agora queremos normalizá-lo.

05:21.600 --> 05:25.810
E então, para normalizar, simplesmente escreverá a computação explícita.

05:25.840 --> 05:34.960
saída e atualizá-la, multiplicando-a pelo desvio padrão que queremos dividir pela soma que acabei de mencionar.

05:34.960 --> 05:41.140
E então, o que simplesmente precisamos fazer aqui é levar nossa

05:41.140 --> 05:44.960
E assim, para obter a soma, vamos usar a função de raiz quadrada pela tocha.

05:45.010 --> 05:48.700
E então, quando é levado aqui torche que s q r t.

05:48.820 --> 05:50.710
Essa é a função de raiz quadrada.

05:50.830 --> 05:55.980
E dentro, vamos entrar no quadrado alguns dos pesos de um vetor.

05:56.160 --> 05:58.000
E assim nós levamos nossas saídas.

05:58.210 --> 06:06.040
Então, usamos a função de poder à qual inseremos porque queremos pegar o quadrado da

06:06.040 --> 06:08.950
soma e depois tomamos o sol.

06:09.000 --> 06:15.300
E dentro, vamos especificar o índice do cone que contém o peso.

06:15.310 --> 06:23.990
Quer alguns e, em seguida, obter esses pesos separadamente, porque você quer resumi-los bem, geralmente

06:24.490 --> 06:29.440
expandimos a escola como uma função de nossa saída.

06:29.470 --> 06:29.820
Tudo bem.

06:29.820 --> 06:37.280
Então, isso levará os pesos que até agora foram inicializados como um tipo de pesos de Torchin que obtém

06:37.340 --> 06:38.320
todos esses pesos.

06:38.330 --> 06:43.850
Tomamos a soma do quadrado e depois tomamos a raiz quadrada para aplicar a normalização.

06:44.030 --> 06:50.230
o fato de ter esse desvio padrão no numerador, teremos certeza de que podemos escrevê-lo aqui.

06:50.230 --> 06:50.900
E com

06:51.960 --> 06:58.890
As variantes serão iguais ao quadrado do desvio padrão.

06:58.890 --> 07:05.940
Esta fórmula aqui irá garantir que esse tensor de pesos que inicializamos terá uma variação que

07:06.030 --> 07:10.860
será igual ao quadrado do desvio padrão que colocamos como argumentos.

07:11.190 --> 07:17.940
E é assim que podemos definir um desvio padrão específico para o futuro e o crítico que fará

07:17.940 --> 07:24.150
em breve e escolheremos um pequeno desvio padrão para o ator e um maior para o crítico

07:24.340 --> 07:27.780
e faremos isso com muita facilidade desde essa função.

07:27.780 --> 07:28.150
Tudo bem.

07:28.170 --> 07:31.120
E agora, temos apenas uma coisa a fazer à esquerda.

07:31.200 --> 07:38.940
É claro que retorna a saída que agora está normalizada com este desvio padrão específico.

07:38.940 --> 07:40.340
Tudo bem, tão perfeito.

07:40.350 --> 07:42.680
Essa é a primeira função que devemos fazer.

07:42.870 --> 07:46.220
Essa é a primeira ferramenta com a qual faremos muito prazer em usar esta noite.

07:46.250 --> 07:47.290
H-3 cérebro do mar.

07:47.370 --> 07:49.250
Temos mais uma função a fazer agora.

07:49.350 --> 07:51.130
Vai ser a função de peso.

07:51.360 --> 07:57.160
E essa é apenas uma função que lembrará inicializar os pesos para tornar a aprendizagem ideal.

07:57.570 --> 08:01.110
Então vamos fazer isso no próximo tutorial e até então eu.