WEBVTT

00:00.270 --> 00:02.640
Hallo und willkommen zurück zu dem Kurs zum tiefen Lernen.

00:02.730 --> 00:05.140
Heute sprechen wir von der Aktivierungsfunktion.

00:05.190 --> 00:07.010
Kommen wir gleich rein.

00:07.020 --> 00:11.910
Deshalb haben wir hier aufgehört, bevor wir über die Struktur eines Neurons gesprochen haben.

00:12.030 --> 00:16.770
Da es in der Mitte ist, wissen wir, dass es einige Eingangswerte gibt, die eingehen.

00:17.130 --> 00:23.370
Es hat einige Gewichte. Dann wird die Art und Weise berechnet, wie einige dieser Eingänge berechnet werden, und die Aktivierungsfunktion wird

00:23.370 --> 00:24.690
in Schritt 3 angewendet.

00:24.750 --> 00:30.090
Es gibt das Signal für das nächste Jahr weiter, und darüber reden wir heute. Wir

00:30.090 --> 00:32.850
sprechen über den Wert, der weitergegeben wird.

00:32.850 --> 00:35.970
Wir sprechen also über die Aktivierungsfunktion, die angewendet wird.

00:36.390 --> 00:39.270
Welche Optionen haben wir also für die Aktivierungsfunktion?

00:39.270 --> 00:43.400
Nun, wir werden vier verschiedene Arten von Aktivierungsfunktionen betrachten, aus denen Sie wählen können.

00:43.410 --> 00:47.400
Natürlich gibt es verschiedene Arten von Aktivierungsfunktionen, aber diese sind die vorherrschenden, von denen Sie

00:47.400 --> 00:50.390
hören werden und die wir in diesem Kurs verwenden werden.

00:50.400 --> 00:53.060
Hier ist also die Schwellwertfunktion.

00:53.070 --> 00:54.300
So sieht es aus.

00:54.300 --> 00:59.600
Auf der X-Achse haben Sie also einige Eingaben auf der Y-Achse gewichtet.

00:59.610 --> 01:07.320
Sie kennen nur die Werte von 0 bis 1 und im Grunde sind die Schwellwertfunktionen sehr

01:07.330 --> 01:14.700
einfach eine Funktion, bei der der Wert kleiner als Null ist, dann die freie.

01:14.730 --> 01:16.680
Dank Ssion geht Null weiter.

01:16.890 --> 01:22.940
Wenn der Wert größer als Null oder gleich Null ist, wird die Schwellenwertfunktion auf eine 1 gesetzt.

01:22.940 --> 01:26.910
Es ist also im Grunde eine Art Ja-Nein-Funktion.

01:26.940 --> 01:29.130
Sehr sehr unkompliziert.

01:29.130 --> 01:33.500
Sehr ähnlich wie eine starre Funktion, entweder Ja oder Nein.

01:33.540 --> 01:35.000
Keine anderen Optionen

01:35.040 --> 01:35.510
Hier bitteschön.

01:35.510 --> 01:36.210
So funktioniert das.

01:36.210 --> 01:37.440
Sehr einfache Funktion.

01:37.440 --> 01:40.020
Lass uns zu etwas komplexerem gehen.

01:40.020 --> 01:48.420
Nun, diese Sigmoid-Funktion ist eine sehr interessante Formel, die wir hier haben. Sie sehen gerade, dass es eine Division durch eins

01:48.420 --> 01:49.940
plus plus gibt.

01:49.950 --> 01:58.450
Die Potenz von minus X, während in diesem Fall natürlich X der Wert der Summen der Art und Weise ist, die summiert werden.

01:58.590 --> 02:00.540
Und so ja.

02:00.570 --> 02:02.600
So sieht also das Sigmoid aus.

02:02.610 --> 02:06.510
Es ist eine Funktion, die in der logistischen Regression verwendet wird.

02:06.510 --> 02:09.470
Wenn Sie sich an den maschinellen Lernkurs erinnern.

02:09.540 --> 02:12.000
Das Gute an dieser Funktion ist, dass sie glatt ist.

02:12.060 --> 02:14.880
Im Gegensatz zur virtuellen Funktion.

02:14.970 --> 02:21.720
Dieser hat diese Knicke nicht in der Kurve und daher ist es ein schöner und sanfter schrittweiser Fortschritt.

02:21.720 --> 02:26.340
Alles unter 0 ist also wie ein Abfall über Null.

02:26.340 --> 02:35.590
Es wirkt annähernd auf eins und diese Sigmoid-Funktion ist sehr nützlich in der endgültigen Lehren der Ausgabeschicht.

02:35.610 --> 02:38.900
Besonders wenn Sie versuchen, Wahrscheinlichkeiten vorherzusagen.

02:38.910 --> 02:40.820
Und das werden wir während des gesamten Kurses sehen.

02:41.190 --> 02:47.370
Und dann haben wir die Gleichrichter-Funktion Gleichrichter-Funktion, auch wenn sie einen Knick hat, eine

02:47.370 --> 02:55.090
der beliebtesten Funktionen für künstliche neuronale Netze ist, also geht sie den ganzen Weg auf Null, es ist Null.

02:55.110 --> 03:02.460
Von da an geht es allmählich voran, da der Eingabewert ebenfalls ansteigt und wir werden sehen, dass wir dies während

03:02.460 --> 03:07.140
des gesamten Kurses in anderen Intuitionstutorials sehen werden und wie wir diese Funktion

03:07.140 --> 03:13.020
in der praktischen Seite des Kurses verwenden Ich werde das in einigen Folien noch etwas näher

03:13.020 --> 03:13.590
erläutern.

03:13.590 --> 03:18.970
Denken Sie daran, dass die Direktfeuerfunktion eine der am häufigsten verwendeten Funktionen in künstlichen neuronalen Netzwerken ist.

03:19.020 --> 03:22.770
Und schließlich haben wir noch eine weitere Funktion, von der Sie wahrscheinlich hören werden.

03:22.830 --> 03:25.220
Es ist die hyperbolische Tangensfunktion.

03:25.260 --> 03:32.760
Sie ist der Sigmoidfunktion sehr ähnlich, aber hier geht die hyperbolische Tangensfunktion unter Null, sodass die Werte von 0 nach

03:32.760 --> 03:39.510
1 oder ungefähr 2 1 gehen und auf der anderen Seite von Null auf Minus 1 gehen.

03:39.750 --> 03:42.360
Und das kann in manchen Anwendungen nützlich sein.

03:42.390 --> 03:48.060
Wir werden uns daher nicht mit jeder dieser Funktionen eingehend beschäftigen. Ich wollte Sie nur mit ihnen vertraut

03:48.060 --> 03:51.680
machen, damit Sie wissen, wie sie aussehen und wie sie heißen.

03:51.780 --> 03:59.690
Wenn Sie zusätzliche Informationen erhalten möchten, lesen Sie dieses Papier nach einem 75-jährigen Los.

03:59.820 --> 04:05.630
Haben Sie eine Menge genannt Deep sparse korrigiert neuronale Netze 2000 Papier.

04:05.790 --> 04:14.700
Und dort erfahren Sie genau, warum die Gleichrichterfunktion eine so wertvolle Funktion ist, warum sie so

04:14.970 --> 04:16.300
beliebt ist.

04:16.350 --> 04:20.640
Aber trotzdem müssen wir all diese Dinge erst noch nicht wirklich wissen.

04:20.650 --> 04:24.240
Fürs Erste werden wir sie erst anwenden, was Sie immer mehr und mehr einsetzen.

04:24.270 --> 04:31.290
Wenn Sie sich also mit der praktischen Seite der Dinge wohl fühlen, können Sie sich auf dieses Dokument beziehen und dann werden

04:31.290 --> 04:37.140
Sie in der Lage sein, dieses Wissen viel schneller einzufangen und es wird viel mehr Sinn ergeben.

04:37.370 --> 04:42.000
Denken Sie jedoch daran, dass Sie, wenn Sie bereit sind, wenn Sie das Gefühl haben, dass Sie bereit

04:42.120 --> 04:45.060
sind, nach Papier suchen und wertvolles Wissen von ihnen erhalten können.

04:45.540 --> 04:53.070
Um nur kurz zu rekapitulieren, haben wir die Schwellenaktivierungsfunktion, die so geht, die Sigmoidaktivierungsfunktion,

04:53.100 --> 04:55.360
die so aussieht.

04:55.680 --> 05:01.770
Wir haben die Gleichrichter-Funktion und wir haben die hyperbolische Tangens-Funktion und jetzt, um dieses Tutorial abzuschließen.

05:01.770 --> 05:09.150
Lassen Sie uns schnell ein paar Übungen machen, also machen Sie einfach zwei schnelle Übungen, um dieses Wissen zu unterstützen.

05:09.150 --> 05:15.140
Zunächst einmal haben wir hier ein Beispiel für ein neuronales Netzwerk mit nur einem Neuron und das sofort

05:15.160 --> 05:16.030
die Ausgangsschicht.

05:16.140 --> 05:22.620
Und die Frage ist, dass Ihre abhängige Variable binär ist. Es ist also entweder 0 oder 1, welche Schwellenwertfunktion

05:22.620 --> 05:23.780
Sie verwenden würden.

05:23.790 --> 05:31.980
Von denjenigen, die wir besprochen haben, haben wir eine Schwellenwertfunktion, die Sigmoidfunktion, die

05:31.980 --> 05:39.480
Gleichrichterfunktion, und wir haben die hyperbolische Tangensfunktion in ihren Roll-Formen, die Sie

05:39.480 --> 05:43.450
für eine binäre Variable verwenden könnten.

05:43.950 --> 05:44.410
OK.

05:44.490 --> 05:49.360
Die Antworten hier sind also zwei Optionen, mit denen wir das angehen können.

05:49.380 --> 05:55.790
Eine davon ist die Schwellenaktivierungsfunktion, weil wir wissen, dass sie zwischen 0 und 1 liegt und uns

05:55.800 --> 06:00.090
0 Anderson-Regenschirme gibt. Andernfalls gibt es nur einmal zwei Werte.

06:00.090 --> 06:10.020
Es passt perfekt zu dieser Anforderung und daher können Sie sagen, dass Sie die Schwellwertfunktion

06:10.020 --> 06:13.770
Ihres Einflusses mit einigem gleichsetzen.

06:14.010 --> 06:18.450
Im zweiten Fall können Sie die Sigmoid-Aktivierungsfunktion verwenden.

06:18.450 --> 06:21.710
Es ist eigentlich auch zwischen 0 und 1 genau das, was wir brauchen.

06:21.750 --> 06:29.940
Aber gleichzeitig wollen Sie nur ein Recht, also sind Sie nicht genau das, was wir brauchen, aber in

06:29.940 --> 06:37.530
diesem Fall könnten Sie es verwenden, da die Wahrscheinlichkeit besteht, dass Y Ja oder Nein ist.

06:37.530 --> 06:46.170
Wir möchten also, dass Y 0 1 ist, aber stattdessen sagen wir, dass die Aktivierungsfunktion der Sigmoid-Funktion

06:46.170 --> 06:51.860
Simoun uns sagt, ob die Wahrscheinlichkeit von Y gleich 1 wäre.

06:51.870 --> 06:59.130
Je näher Sie an die Spitze kommen, desto wahrscheinlicher ist es, dass dies tatsächlich eine Eins oder ein Ja ist und

06:59.160 --> 07:00.300
nicht ein Nein.

07:00.750 --> 07:04.700
Und das ist dem logistischen Regressionsansatz sehr ähnlich.

07:04.920 --> 07:07.570
Und das sind nur zwei Beispiele.

07:07.650 --> 07:09.610
Wenn Sie eine binäre Variable haben.

07:10.120 --> 07:12.810
Schauen wir uns jetzt eine andere praktische Anwendung an.

07:12.810 --> 07:17.190
Lassen Sie uns einen Blick darauf werfen, wie sich das alles auswirken würde, wenn wir so ganz natürlich wären.

07:17.430 --> 07:20.960
In der ersten Schicht haben wir also einige Eingaben.

07:20.980 --> 07:26.060
Sie werden an unsere erste verborgene Schicht gesendet und dann wird eine Aktivierungsfunktion angewendet.

07:26.070 --> 07:31.380
Normalerweise wird das, was Sie hier anwenden würden und was Sie im gesamten Scorsese sehen werden, eine

07:31.410 --> 07:34.510
Gleichrichter-Aktivierungsfunktion anwenden, so dass es in etwa so aussieht.

07:34.530 --> 07:40.980
Wir wenden die Gleichrichter-Aktivierungsfunktion an und dann würden die Signale an die Ausgabeschicht weitergeleitet,

07:40.980 --> 07:46.820
wo die Sigmoid-Aktivierungsfunktion angewendet würde, und das wäre unsere endgültige Ausgabe.

07:46.830 --> 07:51.270
Dies könnte beispielsweise eine Wahrscheinlichkeit vorhersagen, so dass diese Kombination

07:51.600 --> 07:58.640
recht häufig ist, wenn in den verborgenen Schichten die Gleichrichterfunktion angewendet wird und dann die Sigmoidfunktion ausgegeben wird.

07:58.890 --> 07:59.850
Also los geht's.

07:59.850 --> 08:05.040
Ich hoffe, dass Ihnen dieses Tutorial gefallen hat. Nun kennen Sie sich

08:05.040 --> 08:11.130
mit vier verschiedenen Arten von Aktivierungsfunktionen aus. Sie werden einige praktische Erfahrungen mit ihnen

08:11.220 --> 08:16.310
in diesem Kurs sammeln und Sie sollten sich recht wohl fühlen.

08:16.530 --> 08:22.230
Im Moment ist dies jedoch das Wissen, dass Sie Fortschritte erzielen und verstehen müssen, was in diesem

08:22.250 --> 08:23.600
Kurs weiter unten passiert.

08:23.940 --> 08:26.940
In diesem Sinne freue ich mich darauf, Sie das nächste Mal zu sehen.

08:26.940 --> 08:28.560
Bis dahin viel Spaß beim Lernen.
