WEBVTT

00:00.540 --> 00:05.090
Merhaba ve bu hikayeyi bu modülün neredeyse unvanını aldıysanız hoş geldiniz.

00:05.100 --> 00:10.260
Sadece heyecan verici sonuçlar almadan ve videoları izlemeden önce her şeyi gerçekleştirecek

00:10.290 --> 00:11.930
olan ana kodu açıklayacağım.

00:12.090 --> 00:15.920
Bu ana kod bu ve görebileceğiniz gibi bu oldukça kısa.

00:15.930 --> 00:21.120
Kitaplıkları ve modülleri, ayrıca model dosyamızdan Altıkriti gibi yaptığımız farklı

00:21.120 --> 00:24.270
sınıfları ve işlevleri içe aktararak başlıyoruz.

00:24.390 --> 00:30.210
Tren dosyasındaki tren işlevi ve test dosyasındaki test işlevi ve elbette

00:30.270 --> 00:31.930
eniyileştiricimizi içe aktarırız.

00:31.950 --> 00:37.350
Sonra tüm parametreleri bir sınıfa girdiğimiz ilk bölümle başlıyoruz.

00:37.500 --> 00:39.660
Ve belki de budur.

00:39.720 --> 00:44.040
Unutma, bu haram sınıfından yarattığımız BRAM nesnesidir.

00:44.040 --> 00:48.900
Her seferinde öğrenme hızı gibi bir parametre aldık, olmadığı gibi.

00:49.200 --> 00:50.870
Bu yüzden onları hızla geçelim.

00:50.880 --> 00:54.380
Bu ilk veya burada öğrenme oranları.

00:54.480 --> 00:59.140
Gördüğünüz gibi küçük bir değer seçiyoruz ve siz ikinci oranı seçiyoruz parametresi.

00:59.160 --> 01:09.810
Yine bunu 0 olarak alıyoruz. parametresini 1 16 işlem 20 adım ve maksimum 10000 uzunluğunda alıyoruz.

01:09.900 --> 01:10.850
39 OneTel

01:10.850 --> 01:17.580
Ve biz bunun, aracın ortamın süresiz olarak sıkışıp kalmamasını sağlamak için ayarladığımız parametre olduğunu

01:17.730 --> 01:20.910
ve bu nedenle oyunu durduracağından bahsettik.

01:21.060 --> 01:28.800
Bölüm uzunluğu bu maksimum uzunluğun üzerine çıkarsa ve tabii ki çevremizin adını elde

01:28.800 --> 01:29.690
ederiz.

01:29.790 --> 01:30.890
Ayrılma sıfırdır.

01:30.990 --> 01:37.770
Ve bu arada burada sadece çevre adını değiştirerek başka ortamlarda

01:37.770 --> 01:38.410
oynayabilirsiniz.

01:38.430 --> 01:44.760
Dolayısıyla, diğer bazı koparma sürümlerini veya başka Atari oyunlarını oynamak isterseniz buradaki

01:45.030 --> 01:48.580
sıfır kırılmasını burada başka oyunlarla değiştirebilirsiniz.

01:48.750 --> 01:53.730
Ama şunu söyleyebilirim ki koparma videosu zaten çok zorlayıcıdır.

01:53.730 --> 01:56.030
Pekala bütün parametreler burada.

01:56.160 --> 01:59.330
Ve ana çalıştırmanın ana kodu var.

01:59.550 --> 02:02.850
Ve işte, bu ilk satırda ne yaptığımızı görelim.

02:02.850 --> 02:05.270
Çekirdek başına bir iplik koyduk.

02:05.430 --> 02:11.880
olan Paramjit sınıfının yeni bir nesnesinin oluşturulduğunu bilerek, tüm işleyicileri ele alacağız.

02:12.150 --> 02:18.810
Ardından, ikinci çizgide, tüm BRAM nesnesine bağlı değişkenler bulunduğundan, tüm bu parametreleri burada

02:18.810 --> 02:19.490
başlatacak

02:19.560 --> 02:20.840
Sonra tohumu ayarladık.

02:20.970 --> 02:28.830
Sonra ortamımızı Oluştur ağacını kullanarak ve çevremizin adıyla sıfırdan farklı bir şekilde işler

02:28.830 --> 02:30.040
hale getiririz.

02:30.040 --> 02:35.410
Adı geçen hücreleri gördünüz ve bu nedenle parametre ve ad sıfırdır.

02:35.430 --> 02:37.660
Bu bize patlama ortamı sağlayacak.

02:37.890 --> 02:42.870
olağan yolu değil, tüm süreci iyileştirmeyi ve performansı artırmayı biliyorsunuz.

02:42.870 --> 02:45.540
Ve bu arada bir ortam yaratmanın

02:45.690 --> 02:52.470
Aslında bunu en iyi duruma getirilmiş bir ortam oluşturmak için kullanırız ve bu, evren

02:52.630 --> 02:57.730
evreninin açık motorda yüklediğiniz tüm paketlerle birlikte gelen bir pakettir.

02:57.870 --> 03:01.490
Evrene teşekkürler, optimize edilmiş bir ortam elde ediyoruz.

03:01.590 --> 03:03.320
Her şey burada.

03:04.050 --> 03:09.240
Sonra paylaştığımız modeli, aktif eleştiri sınıfının bir nesnesi oluşturarak elde ederiz.

03:09.240 --> 03:14.430
Ve burada, burada paylaşılan bu modelin farklı ajanlar tarafından paylaşılan bir model olduğunu

03:14.430 --> 03:15.030
anlamak önemlidir.

03:15.180 --> 03:17.880
Dolayısıyla farklı derste farklı ipliklere sahibiz.

03:18.210 --> 03:25.410
Ve bir sonraki satırdaki tehditlerden bahsederken, paylaştığımız şeyi hafızalı model paylaşım modelinde paylaşıyoruz, böylece

03:25.500 --> 03:31.260
modeli bilgisayarın paylaşılan hafızasında saklıyoruz, böylece tüm iş parçacıkları farklı yolda

03:31.260 --> 03:32.960
olsa bile ona erişebiliyorlar.

03:33.000 --> 03:34.510
İşte burada yaptıklarımız.

03:34.530 --> 03:42.410
Bu, bunu etkinleştirmek için optimize ediciyi paylaşılan modelimizin parametreleriyle ve bir puan veya bir

03:42.410 --> 03:45.780
öğrenme hızı ile bağlantılı hale getiririz.

03:45.930 --> 03:51.030
söyleyecektir; böylece tüm temsilciler optimize etmek için ona erişebilirler model.

03:51.030 --> 03:57.720
Ayrıca, optimize edicinin paylaşıldığını anlamak önemlidir çünkü paylaşılan model üzerinde hareket edecek ve

03:57.780 --> 04:02.530
sonraki paylaşım hattını iyileştirerek optimize ediciyi paylaşım belleğine depoladığımızı

04:02.910 --> 04:10.260
Sonra süreçlerimizi başlatırız, böylece test işlemi paylaşılan modeli güncellemez, ancak yalnızca bir parçayı denemek

04:10.260 --> 04:14.710
ve skoru basmak ve videoları kaydetmek için kullanır.

04:14.820 --> 04:17.920
İşte burada, Hedef eşdeğer testi ile tam burada ne yapılır.

04:17.940 --> 04:24.330
İşte bu test süreci ve bu süreç burada çoklu ön-işkence işkencesinden kesiliyor.

04:24.450 --> 04:31.600
Yani burada ve yaptığı şey temelde bağımsız bir iş parçacığında bir işleve sahip olmasıdır.

04:31.860 --> 04:38.050
Bu yüzden, yeniden başlattığımızda, başlangıç ​​olan yeni bir süreci başlıyoruz Bu yıl geçen yıl.

04:38.370 --> 04:45.030
Sonra P'yi eklemek için bu işlemi kullanarak süreci süreçler listesine ekledik.

04:45.270 --> 04:52.170
Ve son olarak, bu döngüde, paylaşılan modeli güncelleyerek eğitilecek tüm diğer işlemleri yürütmek için

04:52.380 --> 04:54.320
sadece bir döngü gerçekleştiriyoruz.

04:54.780 --> 04:58.030
Ve temelde burada son kod satırlarında ne olur.

04:58.380 --> 05:03.870
Dolayısıyla, ayrıntıları öğrenmek istemiyorsanız, anlamak için önemli olan şey, süreçleri en uygun

05:03.870 --> 05:09.420
şekilde yürütmek ve bu nedenle bu kodu yürütmek ve eğitilmiş bir model

05:09.420 --> 05:12.670
oluşturmak ve sonunda izlemek iyi olacak olmasıdır sonuçlar.

05:12.840 --> 05:14.150
Bu yüzden bunu yapmak için sabırsızlanıyorum.

05:14.160 --> 05:16.110
Bu oldukça heyecan verici olacak.

05:16.110 --> 05:19.240
Şimdi hepimizi birlikte izleyebilmemiz için insanlar bulmaya çalışacağım.

05:19.350 --> 05:21.440
Ve bir dahaki sefere kadar.
