WEBVTT

00:01.110 --> 00:04.770
Halo selamat datang kembali ke kursus kecerdasan buatan.

00:04.770 --> 00:09.420
Hari ini kita akan membahas rencana serangan untuk bagian yang sedang kita bicarakan membunuh belajar.

00:09.450 --> 00:15.000
Dan kami memiliki beberapa tutorial, jadi saya pikir itu adalah ide yang baik

00:15.000 --> 00:20.580
bagi kita untuk dengan cepat melewati mereka untuk memahami apa yang diharapkan di video mendatang.

00:20.580 --> 00:21.650
Jadi di sini kita mulai.

00:22.140 --> 00:22.560
Baiklah.

00:22.560 --> 00:25.230
Apa yang akan kita pelajari di bagian ini.

00:25.230 --> 00:31.650
Hal pertama yang pertama kita akan berbicara tentang apa sebenarnya pembelajaran penguatan dan apa filosofis di

00:31.690 --> 00:37.890
balik pembelajaran penguatan dan bagaimana pembelajaran penguatan sebenarnya dapat dilihat dalam kehidupan nyata dan bagaimana

00:37.890 --> 00:44.540
hubungannya dengan hal-hal yang kita amati dalam kehidupan nyata sebenarnya adalah hal-hal yang kita lakukan sendiri .

00:44.790 --> 00:51.630
Mereka tidak berbicara tentang persamaan bellmen konsep yang sangat mendasar yang mendasari segala sesuatu atau banyak hal

00:51.630 --> 00:56.580
yang terjadi dan untuk pembelajaran penguatan terutama dalam ruang pembelajaran CULE dan

00:56.940 --> 01:01.700
apa yang akan kita diskusikan di bagian kursus dan bagian berikut.

01:01.800 --> 01:09.280
Kemudian kita akan berbicara tentang rencana dan rencana itu serta kecerdasan buatan besi mentah muncul untuk

01:09.300 --> 01:15.990
menavigasi dalam lingkungan kita akan melihat apa yang bagaimana yang datang bersama-sama sangat cepat tetapi

01:15.990 --> 01:17.270
cukup menarik.

01:17.720 --> 01:22.890
Di sana kita akan berbicara tentang pasar proses keputusan dan konsep

01:22.890 --> 01:31.620
Anda, kami akan memperkenalkan konsep yang sangat baru yang perlahan-lahan bahkan akan menambah lapisan kecanggihan pada persamaan Belman kami untuk seluruh

01:31.800 --> 01:37.070
pembelajaran penguatan kami untuk konsep pembelajaran CULE kami dan itulah cara bagian

01:37.290 --> 01:43.080
ini disusun bahwa kami memperkenalkan persamaan Bollmann bentuk yang sangat sederhana dan kemudian perlahan-lahan

01:43.260 --> 01:48.550
sepanjang tutorial kami menambahkan lapisan kecanggihan ke dalamnya untuk sampai ke versi final.

01:48.690 --> 01:53.880
Itu adalah tujuan kami yang ditentukan dalam hal Hillary tetapi kami akan sampai di sana perlahan-lahan.

01:54.000 --> 01:58.830
Agar kami memiliki cukup waktu untuk memproses semua informasi itu dan membiarkannya menetap.

01:58.890 --> 02:05.400
Dan tanda proses pembangkangan adalah lapisan tambahan kecanggihan di atas apa yang telah kita diskusikan atau apa yang

02:05.400 --> 02:11.220
akan kita miliki atau yang dibahas pada saat itu akan ada pembicaraan tentang kebijakan versus rencana.

02:11.220 --> 02:13.830
Tauriel lain yang menarik, mereka semua menarik.

02:13.830 --> 02:19.590
Hanya tutorial singkat tentang perbedaan kebijakan dari rencana dan perbedaan apa yang ada dan

02:19.590 --> 02:25.980
ini adalah istilah yang mungkin akan Anda dengar atau baca dalam literatur jika Anda akan menggali

02:25.980 --> 02:29.980
ke dalamnya untuk mendapatkan informasi tambahan tentang pembelajaran penguatan.

02:29.980 --> 02:34.590
Mereka semua berbicara tentang menambahkan hukuman hidup ke lingkungan kita.

02:34.770 --> 02:41.850
Dan itu semacam cara lain untuk menambah kompleksitas ke lingkungan tempat agen kami

02:41.850 --> 02:43.340
akan beroperasi.

02:43.370 --> 02:48.780
Mereka semua berbicara tentang intuisi di balik terus belajar sampai tutorial kita

02:48.780 --> 02:50.690
akan berbicara nilai-nilai negara.

02:50.790 --> 02:57.300
Dan akhirnya kita akan beralih ke berbicara tentang nilai atau tindakan atau nilai kubus dan kemudian

02:57.300 --> 02:59.880
kita akan memperkenalkan perbedaan temporal.

02:59.910 --> 03:06.690
Ini adalah tutorial di mana segala sesuatu yang telah kita pelajari akan datang bersama untuk

03:06.690 --> 03:13.930
menjelaskan bagaimana tepatnya agen atau buatan melakukan kecerdasan buatan belajar bagaimana cara memperbarui nilai-nilainya melalui semua

03:14.090 --> 03:16.420
proses berulang yang terjadi.

03:16.830 --> 03:23.100
Dan akhirnya kita akan melihat lambang pembelajaran yang terlihat sehingga kita akan mengambil semua yang

03:23.100 --> 03:29.550
kita pelajari dan kita akan melihatnya terjadi di depan mata kita dan menyaksikan kecerdasan buatan benar-benar

03:29.730 --> 03:35.870
melakukan pembelajaran CULE dan melakukan semua hal yang akan kita diskusikan pada tingkat intuitif akan

03:35.880 --> 03:42.600
benar-benar dilakukan dalam praktik dan yang akan membantu kita semakin memahami bahwa pengetahuan yang akan kita bahas

03:42.810 --> 03:44.530
di bagian ini.

03:44.550 --> 03:47.460
Jadi semoga Anda sangat senang dengan tutorial mendatang ini.

03:47.460 --> 03:48.800
Saya pasti.

03:48.810 --> 03:55.380
Dan ada beberapa slide yang sangat menarik yang muncul dan konsep yang lebih penting itu sendiri

03:55.380 --> 03:59.540
sangat sangat menarik dan saya yakin Anda akan sangat menikmatinya.

03:59.760 --> 04:01.410
Dan saya berharap dapat melihat Anda lain kali.

04:01.410 --> 04:03.080
Sampai kemudian menikmati AI.