WEBVTT

00:00.640 --> 00:02.940
Hallo und willkommen zurück zu dem Kurs zum tiefen Lernen.

00:02.970 --> 00:09.120
Heute sprechen wir über einen Hinweis, der in Ihren Einheiten korrigiert wird. Dies ist ein

00:09.120 --> 00:12.180
zusätzlicher Schritt zusätzlich zu unserem Faltungsschritt.

00:12.180 --> 00:16.140
Es ist also kein separater großer Schritt, es ist im Grunde ein kleiner Schritt.

00:16.290 --> 00:18.230
Und was ist hier los.

00:18.240 --> 00:24.090
Nun, wir haben unser Eingabebild, das wir alle konvolutiv haben, worüber wir diskutiert haben, und dann

00:24.090 --> 00:26.080
werden wir es auch anwenden.

00:26.400 --> 00:27.190
Warte darauf.

00:27.240 --> 00:36.720
Unsere bevorzugte Gleichrichterfunktion und Sie kennen die Gleichrichterfunktion bereits im vorherigen Abschnitt über künstliche neuronale Netze und

00:36.750 --> 00:47.400
in unseren Autoren. Manchmal trennen Autoren oder Ausbilder die Faltung und den direkten Brand in zwei separaten Schritten in

00:47.430 --> 00:54.030
unseren Beispielen, was sie für gerecht hält Ein großer Schritt für die

00:54.030 --> 00:57.060
zweite Entwicklung, dann der Gleichrichter.

00:57.270 --> 01:03.750
Und der Grund, warum wir den Gleichrichter einsetzen, ist, weil Sie die Nichtlinearität in unserem Image

01:03.780 --> 01:13.410
oder in unserem Netzwerk und in unserem kommerziellen neuronalen Netzwerk und unserem Feuer als Filter oder Zugriff auf diese Funktion ausbauen möchten, die die Funktion

01:13.440 --> 01:19.200
auflöst und Sie mit der Arität und dem Zusammenbruch konfrontiert sind Der Grund, warum wir

01:19.440 --> 01:25.950
die Nichtlinearität in unserem Netzwerk erhöhen möchten, besteht darin, dass Bilder selbst in hohem Maße nichtlinear sind,

01:26.010 --> 01:32.790
insbesondere wenn Sie verschiedene Objekte nebeneinander oder nur im Hintergrund erkennen und ähnliches wie das Bild mit vielen

01:33.180 --> 01:38.050
nichtlinearen Elementen und der Übergang zwischen benachbarten Pixeln ist oft nichtlinear.

01:38.040 --> 01:41.280
Das ist, wissen Sie, weil seine Grenzen verschiedene Farben sind.

01:41.460 --> 01:46.020
Es gibt verschiedene Elemente in Ihren Bildern. Wenn Sie jedoch eine

01:46.020 --> 01:52.410
mathematische Operation wie die Faltung, die Sie kennen, und diese Feature-Erkennung ausführen, um unsere Feature-Maps zu

01:52.710 --> 01:59.710
erstellen, riskieren wir gleichzeitig, dass wir etwas Lineares erstellen können und daher eine Trennung erforderlich ist die Erzählung.

01:59.970 --> 02:05.960
Schauen wir uns ein Beispiel an. Hier sind ein Bild und ein Originalbild.

02:05.970 --> 02:13.220
Wenn wir nun einen Merkmalsdetektor auf dieses Bild anwenden, erhalten wir so etwas.

02:13.290 --> 02:16.230
Sie sehen also, dass Schwarz negativ ist. Weiß ist auch positiver Wert.

02:16.230 --> 02:22.980
Wenn Sie einen Merkmalsdetektor auf ein ähnliches Bild anwenden, das nicht nur aus Nullen und Einsen besteht, sondern viele

02:22.980 --> 02:28.890
verschiedene Werte hat und Sie anwenden, wie Sie es zuvor in Texas gesehen haben, können Sie

02:29.070 --> 02:30.920
negative Werte in sich haben.

02:31.080 --> 02:34.670
Und hier sind die Schwarzen negativ. Weiße sind positiv.

02:34.800 --> 02:45.240
Und was eine gleichgerichtete lineare Einheitsfunktion bewirkt, ist, dass alle schwarzen Rechte in einem Bereich unter null entfernt werden, aus dem sie zu

02:45.240 --> 02:46.490
Null wird.

02:46.560 --> 02:49.160
Und so wird es zu diesem Recht.

02:49.290 --> 02:57.990
Daher ist es ziemlich schwer zu erkennen, was genau der Vorteil in Bezug auf die Auflösung der Linearität

02:58.050 --> 02:58.910
ist.

02:59.400 --> 03:01.050
Ich versuche es zu erklären.

03:01.080 --> 03:07.740
Ich versuche, ein Beispiel für dieses Bild zu zeigen, aber am Ende des Tages handelt es sich hierbei um ein sehr

03:07.740 --> 03:12.480
mathematisches Konzept, das viel Mathematik erfordern würde, um wirklich zu erklären, was los ist.

03:12.480 --> 03:13.800
Aber lass uns versuchen, lass uns einen Blick darauf werfen.

03:13.800 --> 03:16.800
Schauen wir uns das zum Beispiel an.

03:16.860 --> 03:17.580
Dieses Gebäude hier.

03:17.580 --> 03:18.070
Recht.

03:18.090 --> 03:20.150
Dies ist also ein Gebäude für sich.

03:20.730 --> 03:22.400
Dann kannst du diesen Schatten sehen.

03:22.440 --> 03:29.010
Bei diesem schwarzen Teil dieses Schattens ist deutlich zu erkennen, dass die Reflexion des Lichts weiß ist und

03:29.010 --> 03:33.160
dann ein Grau und dann dunkler und dann wieder dunkler wird.

03:33.240 --> 03:35.860
Wenn wir es rausnehmen, entfernen wir diesen schwarzen Fleck.

03:35.860 --> 03:38.220
Denken Sie also an Linearität.

03:38.250 --> 03:43.700
So wie es aussieht, wenn Sie von Weiß zu Grau wechseln, wäre der nächste Schritt Schwarz.

03:43.740 --> 03:50.970
Das nächste Bild wäre schwarz, es ist ein linearer Verlauf von hell nach dunkel und daher ist

03:50.970 --> 03:53.490
dies eine Art lineare Situation.

03:53.490 --> 03:56.560
Wenn Sie das Schwarze herausnehmen, brechen Sie die Linearität auf.

03:56.670 --> 03:57.800
Lass uns noch einen versuchen.

03:58.050 --> 03:59.110
Lass uns hier einen Blick darauf werfen.

03:59.220 --> 04:01.980
Und gleichzeitig ist es immer noch das gleiche Gebäude.

04:01.980 --> 04:08.320
Es ist nicht so, dass Sie oder Sie nicht zwei Gebäude ineinander mischen, aber das

04:08.550 --> 04:09.810
ist zweitrangig.

04:09.810 --> 04:11.940
Der Hauptpunkt ist das Aufbrechen der Linearität.

04:12.210 --> 04:13.590
Schauen wir uns hier also dasselbe an.

04:13.590 --> 04:19.480
Sie sehen also weiß grau schwarz grau weiß.

04:19.590 --> 04:22.520
Und wenn Sie es trennen, haben Sie das nicht mehr richtig.

04:22.530 --> 04:29.600
Sie haben diesen Fortschritt nicht den graduellen Fortschritt, den Sie gerade wie eine abrupte Änderung haben.

04:29.730 --> 04:33.540
Dies trägt dazu bei, dass Ihr Bild nichtlinear ist.

04:33.540 --> 04:42.540
Es handelt sich also um eine sehr grobe Erklärung, die eher auf oder an den Fingern als auf eine technische Erklärung basiert, und hoffentlich

04:42.690 --> 04:47.370
hilft es Ihnen, ein bisschen besser zu verstehen, worüber wir hier sprechen.

04:47.370 --> 04:54.870
So kann man hier wieder sehen, dass Weißgrau ein besseres Beispiel ist, auch um dunkler dunkler dunkler und dunkler

04:54.980 --> 04:55.680
dunkler.

04:55.680 --> 05:04.460
Dieser Teil sieht also so aus, als wäre er dünner, als wenn Sie ihn wieder auflösen würden. Dies ist eine sehr grobe Erklärung.

05:04.480 --> 05:08.570
Es ist nicht absolut perfekt, aber zumindest gibt es eine Vorstellung davon, was los ist.

05:08.800 --> 05:14.120
Aber wenn Sie mehr erfahren möchten, gibt es wie immer eine gute Arbeit, immer eine Arbeit.

05:14.200 --> 05:20.370
Dieses ist von CCJ Corps von der University of California und heißt Verstehen von Faltungsneuralnetzwerken,

05:20.380 --> 05:22.980
die ein mathematisches Modell haben.

05:23.200 --> 05:28.840
Im Grunde sind sie Antworten auf Fragen und Sie müssen sich nur die erste Frage ansehen.

05:28.840 --> 05:33.820
Und die Frage ist, warum am Filterausgang aller Zwischenschichten keine

05:33.820 --> 05:36.130
nichtlineare Aktivierungsfunktion wichtig ist.

05:36.220 --> 05:44.280
Diese Art erklärt es also ein bisschen ausführlicher, sowohl in Bezug auf die Intuition als auch hauptsächlich in Bezug auf die Mathematik.

05:44.320 --> 05:47.970
Dies ist ein interessantes Dokument, in dem Sie zusätzliche Informationen zu diesem Thema erhalten können.

05:48.100 --> 05:53.360
Und wenn Sie wirklich ein paar coole Sachen hier erforschen wollen.

05:53.360 --> 05:55.690
Dann gibt es noch eine andere Arbeit, die Sie interessieren könnte.

05:55.690 --> 06:01.720
Es heißt, tiefer in den Gleichrichter einzutauchen und die Bildqualität auf menschlicher Ebene

06:01.720 --> 06:02.830
zu übertreffen.

06:02.920 --> 06:09.190
Und hier kämmt der Autor Haare und andere von Microsoft Research.

06:09.400 --> 06:17.630
Sie schlagen eine andere Art der gleichgerichteten schlanken Einheitenfunktion vor.

06:17.650 --> 06:21.830
Sie schlagen die parametrisch korrigierte Funktion vor, die Sie hier rechts sehen.

06:22.030 --> 06:26.740
Sie argumentieren, dass es bessere Ergebnisse liefert, ohne die Leistung zu beeinträchtigen.

06:26.740 --> 06:30.200
Also interessant lesen, wenn Sie sich näher mit diesem Thema beschäftigen möchten.

06:30.490 --> 06:32.020
Und das ist alles für heute.

06:32.280 --> 06:38.380
Wirklich ist Ihre Schicht ziemlich einfach, also für das Anpassen der Gleichrichter-Funktion und ich freue mich auf das

06:38.380 --> 06:39.230
nächste Mal.

06:39.250 --> 06:40.770
Bis dahin viel Spaß beim Lernen.