WEBVTT

00:00.270 --> 00:06.230
Merhaba, bu boruya ve Torro'ya hoş geldiniz, şimdi bu fonksiyonun üç sarmal

00:06.240 --> 00:09.560
ve zamansal bağlantıları olan beş değişkenini tanımlamalıyız.

00:09.810 --> 00:11.100
Öyleyse ilki ile başlayalım.

00:11.250 --> 00:18.690
Kıvrımsal olan giriş görüntülerine konvolüsyon uygular, böylece orijinal görüntüler olur ve şimdi her şeyin bu kıvrımın

00:18.690 --> 00:22.710
yaratılması için nasıl bu kadar basit hale geleceğini göreceksiniz.

00:22.770 --> 00:29.070
Aslında yapmamız gereken aslında belirli bir sınıfa ait bir nesne

00:29.070 --> 00:38.800
oluşturmak ve bu sınıftan alınmak ve daha sonra da dersler için gelmek çünkü 2B resimlerle çalışıyoruz

00:38.800 --> 00:40.930
ve şimdi birkaç argümanlar.

00:40.930 --> 00:43.140
Birincisi kanallarda.

00:43.190 --> 00:45.910
Kanallara koyalım.

00:45.970 --> 00:49.210
İkincisi kanallardan.

00:49.330 --> 00:57.070
Üçüncüsü Kerno boyutu ve geri kalanı ise genişleme gruplarını ve önyargılarını dolduruyor.

00:57.130 --> 00:59.120
Ve bunların hepsinde farklı değerlerimiz var.

00:59.260 --> 01:02.290
Öyleyse biz gitmeyeceğiz, ancak varsayılan değerleri saklayacağız.

01:02.470 --> 01:08.500
Ancak önemli olan kanallardaki ve kanallardaki ve çekirdek boyutundaki bu üç argümandan ibarettir ve dolayısıyla neyin karşılık

01:08.500 --> 01:09.740
geldiğini tahmin ediyorum.

01:09.880 --> 01:15.730
Genel olarak çok basitçe konvolüsyonun girdisine karşılık gelir ve tüm kanallar

01:15.730 --> 01:17.900
sonucun çıktısına karşılık gelir.

01:17.920 --> 01:19.940
Öyleyse ne olacak.

01:20.110 --> 01:24.460
Çok basit bir şekilde bu bizim görüntülerimizdeki kanalların sayısı olacak.

01:24.610 --> 01:30.460
Ve aslında biz siyah beyaz görüntülerle çalışacağız çünkü temelde canavarları tanımak için

01:30.460 --> 01:31.360
renklerimiz yok.

01:31.450 --> 01:35.310
AI canavarları tamamen siyah beyaz olarak algılama yeteneğine sahiptir.

01:35.440 --> 01:39.200
Dolayısıyla renklerin yalnızca şekillerine göre olduğunu görmüyoruz.

01:39.250 --> 01:44.380
Dolayısıyla bir kanalı kullanacağız, böylece bir kanal siyah beyaz görüntüler yaşarken,

01:44.380 --> 01:46.820
üç kanal görüntü aramış oluyorsunuz.

01:46.930 --> 01:51.320
Ve bu nedenle, kanallardaki siyah beyaz görüntülerle

01:51.340 --> 01:59.730
çalıştıkğımızdan, kanallarımıza eşit olacak, böylece kanallarımız bu anayasanın çıktısı olan konvolümantasyonda sahip olmak

01:59.730 --> 02:02.970
istediğiniz görüntülerle eşit olacak. bir.

02:02.970 --> 02:08.820
Temelde bu, özgün resimlerinizdeki metne istediğiniz özellik sayısına eşittir, çünkü temelde işe

02:09.240 --> 02:15.040
yaradığını bildiğiniz için algılamak istediğiniz özellik başına kim bir resim oluşturur.

02:15.120 --> 02:21.390
detektörü uyguladık ve bu nedenle buradaki çıktı görüntülerinin sayısı tespit etmek istediğiniz özelliklerin sayısıdır.

02:21.390 --> 02:26.450
Giriş görüntüsünde belirli bir özelliği algılamak için giriş görüntüsüne bir özellik

02:26.460 --> 02:30.110
Şimdi ne kadar çok özellik tespit etmek istiyoruz sorusu.

02:30.240 --> 02:38.730
İyi bir ortak uygulama 32 öznitelik detektörüyle başlamaktır ve bu yüzden bu ilk konvolasyon katmanında%

02:38.820 --> 02:46.170
32 imaja neden olacağız, böylece giriş bir siyah beyaz resim gerçek bir görüntü

02:46.170 --> 02:53.010
ve ilk katlamalı çıktıda 32 işleme görüntü var ve elbette ki sonuç,

02:53.380 --> 02:59.750
tespit edilen özelliklere sahip 32 yeni görüntü elde etmek için giriş imgesine uygulanmıştır.

03:00.240 --> 03:06.990
Ve sonra, orijinal görüntüye gidecek karenin boyutlarından başka bir şey olmayan

03:07.080 --> 03:09.450
bir çekirdek boyutu belirtmeliyiz.

03:09.600 --> 03:15.350
Ve genel uygulamada iki ya da üç geniş üç ya da beş beş tane satın almak için kullanıyoruz.

03:15.660 --> 03:22.170
Ve birincisi beş beş tane 10 motora sahip bir özellik dedektörü olan

03:22.170 --> 03:24.580
beş beş özellik dedektörü kullanacağız.

03:24.810 --> 03:29.290
Ve sonra bu çekirdeğin boyutunu bir sonraki konvolüyonel katmanlar için azaltacağız.

03:29.340 --> 03:32.320
Ve şimdi bunu tam olarak ne yapacağımızı konuşuyoruz.

03:32.390 --> 03:40.860
Bunu ikinci konvolüsyonu tanımlamak için kopyalayacağız ve bundan dolayı burada kuruyorum ve şimdi çok komik ve

03:40.890 --> 03:43.370
çok kolay bir domino gibi.

03:43.500 --> 03:49.260
konvolusyon katmanının giriş kanalı, buradaki ilk konvolusyonun çıkış kanalıdır.

03:49.260 --> 03:49.810
İkinci

03:49.950 --> 03:55.300
Yani bu sayı çıktısı 32 Burada aynı girdi sayısı 32'dir.

03:55.420 --> 04:01.290
Bunun nedeni, ikinci konvolüsyonun giriş konvolusyon katmanında 32 görüntüümüz olmasıdır.

04:01.440 --> 04:09.830
Ve böylece ikinci bir konvolüsyon, bu ikinci konvolüasyon katmanına uygulanır ve üçüncü bir konvolüasyon katmanı

04:09.830 --> 04:10.340
döndürülür.

04:10.530 --> 04:13.280
Ve şimdi soru, kaç tane yeni resim istiyoruz.

04:13.410 --> 04:19.820
Aynı şey 32 yeni resim oluşturur 32 Birçoğunda 32 bulacağınız mimarilere bakarsanız, 32

04:19.830 --> 04:23.710
evrensel sinir ağlarında gerçekten çok yaygın bir sayıdır.

04:24.030 --> 04:29.910
Ve daha sonra çekirdek boyutu için Özellik dedektörümüzün boyutları olan çekirdek boyutunu azaltmamız

04:29.910 --> 04:30.610
gerekir.

04:30.780 --> 04:37.680
Ve şimdi beş ila dört ya da üçümüze gideceğiz ve sonra daha da küçülecek.

04:37.920 --> 04:40.790
Pekâlâ, ikinci konvolümüz hazır.

04:40.830 --> 04:43.830
Giriş olarak 32 işlem görüntüsü alır.

04:43.890 --> 04:51.130
Her biri orijinal giriş resminin ilk özelliğinde ve 32 yeni görüntü oluşturuyor.

04:51.270 --> 04:54.990
Özellik dedektörünün bu azaltılmış boyutları sayesinde.

04:55.120 --> 04:57.250
Şimdi bunu daha da ileri götürelim.

04:57.300 --> 05:05.450
Bu yüzden bunu kopyalayıp bazı özellikleri saptamak için üçüncü bir konvolüsyon oluşturmak için buraya yapıştırıyorum.

05:05.470 --> 05:08.010
Ve şimdi giriş kanalları aynı.

05:08.010 --> 05:13.800
Burada dekonvolüsyon bağlantısının solundaki girdi görüntülerinin sayısı ve önceki kıvrım

05:13.800 --> 05:17.740
bağlantılarının sağına çıkan ön görüntü görüntülerinin sayısıdır.

05:17.740 --> 05:18.710
32 yaşında.

05:18.750 --> 05:20.030
Bu nedenle duyduğumuz için özür dileriz.

05:20.030 --> 05:20.990
Bu mükemmel.

05:21.220 --> 05:25.220
Ve şimdi soru kaç yeni görüntü tespit etmek istiyor.

05:25.310 --> 05:31.130
Şimdi 64 ve dolayısıyla 64 çıkış öncel görüntüleri alacağız.

05:31.260 --> 05:36.800
Ve elbette şimdi daha küçük bir çekirdek boyutu alıyoruz ve iki tane alacağız.

05:36.800 --> 05:42.660
Ve böylece konvolüsyonun çok klasik bir mimarisi budur ve görüntülerin içinde yüksek

05:42.660 --> 05:45.840
düzeyde bir özellik algılaması çok etkilidir.

05:46.200 --> 05:53.010
Pekâlâ, burada üç kıvırcıklığımızı üç kıvrım bağlantımıza

05:53.010 --> 05:53.510
bağladık.

05:53.640 --> 05:59.970
kez tekrar 32 görüntü düzleştirdikten sonra elde ettiğimiz bu büyük vektörü alacağız, böylece bu

05:59.970 --> 06:07.710
görüntülerin tüm piksellerini düzleştirdik ve yeni bir tamamen bağlı sinir ağı girişi olacak bir büyük vektör olabilir.

06:08.160 --> 06:13.920
Şimdi, diş hekimliği bağlantılarımızı toplamanın tam zamanı geldiğini hatırlatmak gerekir ki, tüm bu

06:14.190 --> 06:16.590
kıvrımlardan aldığımız 64 kez 32

06:16.860 --> 06:22.230
Ve öyleyse, bu bağlantıları ilk önce bu büyük vektör ve gizli bir katman arasında,

06:22.470 --> 06:27.710
ardından da gizli katman ve çıkış nöronlarından oluşan çıktı arasındaki ikinci bir tam bağlantı

06:27.730 --> 06:28.270
oluşturmamız gerekir.

06:28.320 --> 06:31.940
Her biri olası eylemlerin küp değerine karşılık gelir.

06:31.980 --> 06:33.960
Bu iki bağlantıyı yapalım.

06:33.960 --> 06:35.220
Bunu nasıl yapacağını biliyorsun.

06:35.220 --> 06:37.550
Kendinden tahrikli araba için yaptığımız tam da buydu.

06:37.560 --> 06:38.800
O halde tekrar yapalım.

06:39.000 --> 06:46.890
İlk önce Maggio'yu alıyoruz, o zaman Lynnie'yi sınıfımıza götürüyoruz, çünkü yine bağlantı oluşturduğumuz

06:46.920 --> 06:49.060
egemen sınıfın bir nesnesidir.

06:49.260 --> 06:50.550
Ve sonra parantez içinde.

06:50.670 --> 06:58.620
Aynı şey, girdi özelliklerini, sonra çıktı özelliklerini sayısına koymak için de aynı şey.

06:58.850 --> 07:03.110
Ve giriş özellikleri ilk tam bağlantı için ne olacak.

07:03.340 --> 07:10.300
düzleştirdikten sonra bu büyük vektör değişikliğinde bulunan piksel sayısına eşit olacak.

07:10.480 --> 07:13.830
Üç kıvrımdan sonra tüm işlem görüntülerini

07:13.830 --> 07:15.110
Peki bu numara ne yapar.

07:15.220 --> 07:17.350
Aslında burada bir numara var.

07:17.380 --> 07:19.620
Bu sayı almak gerçekten zor.

07:19.660 --> 07:22.770
Aslında bu sayıyı hesaplamak için bir işlev yapmamız gerekiyor.

07:22.960 --> 07:25.570
Bize bu numarayı alacak bir değişkenimiz yok.

07:25.570 --> 07:29.040
Onu ve dolayısıyla şimdi ne yapacağımızı hesaplamalıyız.

07:29.150 --> 07:34.780
çünkü ilk kez söyleyeceğiniz şey, Bu sayıdaki nöronları Yassılaştır vektörüne sahip ol.

07:35.200 --> 07:40.930
Ve şimdi, olması gereken programlamanın zihniyetini anlamak ve bu engelin üstesinden gelmek

07:41.110 --> 07:45.690
için şu anda ne düşündüğünüz zihniyet getirmeye çalışmak çok önemlidir,

07:45.730 --> 07:46.650
Ne yapmalıyım.

07:46.660 --> 07:47.600
Burada sıkıştım.

07:47.800 --> 07:55.720
Aslında hayır, çünkü şimdi ne yapabildiğiniz, buradaki sayıları nöron sayısına göre nöronların sayısını temsil

07:55.720 --> 08:01.690
edecek herhangi bir adı girdikten sonra, basitçe geri dönecek ve bu

08:01.690 --> 08:05.130
sayıdaki nöron değişkenli bir işlev yapacağız.

08:05.180 --> 08:07.100
Aradığımız bu piksel sayısı.

08:07.330 --> 08:12.760
Bu yüzden, tamamen bunu yapabiliriz, çünkü bu çok vokal elbette ki bir uyarı

08:12.760 --> 08:17.090
alacak, ancak henüz mevcut değil, daha sonra bir fonksiyon ile yaratacağız.

08:17.350 --> 08:21.140
Ve daha sonra işlevi gelse bile buna izin verilir.

08:21.170 --> 08:25.970
Bu tür bir engeli bulduğunuzda sahip olmanız gereken tipik bir programlama düşüncesi budur.

08:26.020 --> 08:29.710
Eh, kaçırdığınız şeyi elde etmek için bir işleve sahip olabilirsiniz.

08:29.740 --> 08:32.640
Tamam, sonra özelliklerimiz ve geleceğimiz.

08:32.650 --> 08:37.830
Gizli katmandaki nöronların sayısı bu sefer size kalmış.

08:37.870 --> 08:41.230
Bu, oluşturmak istediğiniz yeni ağın mimarisine bağlıdır.

08:41.230 --> 08:44.230
Ve bu yüzden iyi bir sayı küçük sayı olmazdı.

08:44.230 --> 08:46.960
Örneğin 40 nöron iyi olabilir.

08:46.960 --> 08:48.660
Bunu arttırmaya çalışabiliriz.

08:48.790 --> 08:51.280
Eğitim çok yavaş değilse, bunu arttırmayı deneyebilirsiniz.

08:51.340 --> 08:56.750
Belki öngörüleri iyileştirecektir, ancak 40 ile başlayalım belki daha sonra bunu artıracağız.

08:57.130 --> 09:04.690
Tamamen ilk tam bağlantı için bu kadar sonra gizli katman ve çıktı katmanı arasındaki

09:04.710 --> 09:09.300
bağlantı olan ikinci tam bağlantı için buradaki yapıştırmayı kopyalayacağız.

09:09.370 --> 09:15.720
Ve böylece özellikler bir önceki katmanın özelliklerine dönüşür ve bu 40 olur.

09:15.790 --> 09:18.020
Yani burada 40'ım kaldırabiliriz.

09:18.190 --> 09:20.500
Tabii ki bir katmandaki nöronların sayısı.

09:20.860 --> 09:27.280
Ve geleceğimiz hiçbir sinir ağı olmaması gereken çıkış nöronlarının sayısına eşit olacak.

09:27.340 --> 09:33.360
Ve her çıktı nöronu, bir yeni değere ve bir Cuvee'ye tekabül ettiğinden ve

09:33.370 --> 09:38.440
bir çıktıya neuronların sayısı burada tabii ki eylem sayısına karşılık geldiğinden,

09:38.740 --> 09:47.320
bunun için bir sayı değişkeni var, bu sayı eylemleri ve bu nedenle sayı eylemleri ve Orada tebrikler.

09:47.390 --> 09:53.850
Sinir ağımızın mimarisini buldık, sinir ağımız üç konvolüyonel katman ve bir

09:53.850 --> 09:55.960
gizli katmandan oluşuyor.

09:56.130 --> 10:03.020
Tüm bunlar büyük bir CNN'de gerçekleşir ve bu CNN oyundaki özellikleri tespit eder, böylece AI nereye gitmek

10:03.020 --> 10:06.550
zorunda olduğunu ve nereye ateş etmesi gerektiğini bilir.

10:06.900 --> 10:08.240
Öyleyse bu adımı atalım.

10:08.340 --> 10:10.720
Yapılan ilk önemli adım bu.

10:10.720 --> 10:16.020
Şimdi, hala eksik olan bu sayıda nöronun elde edilmesi için bir sonraki

10:16.020 --> 10:17.010
adıma geçeceğiz.

10:17.010 --> 10:21.930
Aslında neden burada uyarı var ve telefon numarası nöronları ama endişelenmeyin.

10:21.960 --> 10:26.970
işlev yapacağız ve bu sayıyı bir dizi nöron çağrısı yapan bir değişkene koyacağız.

10:26.970 --> 10:30.210
Şimdi bu büyük vektörde nöron sayısını döndürecek bir

10:30.270 --> 10:32.070
Bu işi sonraki öğreticide yapalım.

10:32.070 --> 10:33.130
İşte sonraki adımımız.

10:33.180 --> 10:34.790
Ve o zamana kadar AI zevk.