WEBVTT

00:00.180 --> 00:04.420
大家好, 欢迎来到自动驾驶汽车挑战赛的最后一关｡ 

00:04.440 --> 00:11.220
所以这一次我的目标是打败自动驾驶汽车, 而不是第四级,

00:11.220 --> 00:19.940
因为我想挑战你们改进代码, 改进人工智能, 或者改进策略, 这样你们就可以自己打败这个挑战｡

00:19.950 --> 00:27.750
所以我打算做一条非常复杂的路, 它仍然是从机场到市中心, 但可能太复杂了,

00:27.750 --> 00:30.990
汽车找不到路｡

00:31.020 --> 00:36.060
所以这就是我的挑战, 所以我希望你们能从这份具有挑战性的作业中得到乐趣｡ 

00:36.270 --> 00:37.530
所以我们开始吧｡ 

00:37.530 --> 00:40.970
让我们进入第四关｡ 

00:40.980 --> 00:46.200
所以我们先选择所有的东西, 然后加载大脑｡ 

00:46.200 --> 00:47.340
好了

00:47.340 --> 00:52.980
现在它在机场和市中心之间往返, 所以需要一些时间｡ 

00:52.980 --> 00:55.200
所以我要放点音乐｡ 

00:55.200 --> 00:57.090
现在我们来看看路｡ 

01:32.220 --> 01:33.260
好了

01:33.270 --> 01:34.350
这里是大路｡ 

01:34.350 --> 01:37.940
而且如你所见, 这辆车似乎有很大的毛病｡ 

01:37.950 --> 01:39.840
这正是我想要的｡ 

01:39.870 --> 01:45.380
它, 你知道, 在同一段路上做这些小的往返｡ 

01:45.540 --> 01:46.590
所以这是个问题｡ 

01:46.590 --> 01:50.160
它现在找不到去市中心的路｡ 

01:50.280 --> 01:52.200
那我们该怎么解决这个问题？

01:52.200 --> 01:54.600
我们是否需要改变策略？

01:54.600 --> 02:01.530
我们需要改变神经网络的参数吗？神经网络已经改变了汽车大脑中的突触｡

02:01.800 --> 02:05.130
我们需要对奖励做些什么吗？

02:05.130 --> 02:12.480
你知道, 也许得到一个更糟糕的奖励时, 它没有找到目标, 因为它是现在的情况？

02:12.480 --> 02:13.560
是这样｡ 

02:14.440 --> 02:15.370
所以我也不知道｡ 

02:15.370 --> 02:17.410
你自己去查吧｡ 

02:17.440 --> 02:23.950
正如你所看到的, 当它没有找到目标时, 奖励并不是很严重, 你知道, 它没有接近目标,

02:23.950 --> 02:28.900
奖励只是负0｡ 2.

02:28.900 --> 02:31.660
所以这不是一个严重的咬奖励｡ 

02:31.690 --> 02:39.250
你可以试着减少奖励, 就像将奖励设置为负0一样｡  5.

02:39.280 --> 02:40.520
也许这会有用｡ 

02:40.540 --> 02:43.420
我只是给你一些建议｡ 

02:43.660 --> 02:47.020
这就是你可以通过奖励策略做出的改变｡ 

02:47.030 --> 02:48.910
当然, 你也可以做一些｡ 

02:50.760 --> 02:53.700
纽韦尔网络的其他变更｡ 

02:53.700 --> 02:58.590
因此, 在本节中, 我们创建纽韦尔网络的架构｡ 

02:58.590 --> 03:02.820
我们选择在一个隐藏层中有30个隐藏神经元｡ 

03:02.910 --> 03:09.960
也许你可以尝试改变架构, 尝试更多的层或更多的隐藏神经元｡ 

03:09.960 --> 03:10.680
我不知道我不知道

03:10.950 --> 03:13.560
这是另一个改进建议｡ 

03:13.560 --> 03:20.220
然后你也可以尝试改变深度学习算法中的一些东西, 或者你可以直接进入课程,

03:20.220 --> 03:24.030
了解其他算法｡

03:24.030 --> 03:28.380
也许还有另一个能处理这种情况｡ 

03:28.620 --> 03:29.880
祝你好运｡ 

03:29.880 --> 03:32.310
我期待看到您的解决方案｡ 

03:32.310 --> 03:34.260
试着画出同样的路｡ 

03:34.260 --> 03:35.010
太完美了

03:35.010 --> 03:37.410
这真的很令人兴奋｡ 

03:37.410 --> 03:38.040
谜｡ 

03:38.040 --> 03:46.980
如果你想让我给予你一个提示或者你想让我快速解释问题所在, 好吧, 你可以在这里看到｡

03:46.980 --> 03:49.350
当它到达那一点时, 它会往回走｡ 

03:49.500 --> 03:55.620
这是因为当它到达那个点的时候, 它离目标越来越远, 现在的目标是市中心｡

03:55.620 --> 04:02.340
你知道, 当它到达那个点的时候, 如果它走得更远, 嗯, 它会离目标更远｡

04:02.340 --> 04:04.500
这就是为什么它要回到这里｡ 

04:04.650 --> 04:14.580
所以你必须改变代码中的一些东西, 改变策略中的一些东西, 当它离目标越来越远的时候, 也许可以减少惩罚｡

04:14.610 --> 04:15.930
也许这是个解决办法｡ 

04:15.930 --> 04:17.850
我只是提些建议｡ 

04:17.850 --> 04:22.920
我不想太快给予你们答案,

04:22.920 --> 04:28.380
但这将是一个很好的练习, 这是工程师在制造自动驾驶汽车时经常遇到的问题｡

04:28.380 --> 04:32.880
但无论如何, 我认为这是一个相当酷的谜, 所以我希望你会有乐趣｡ 

04:32.880 --> 04:41.220
而在解决这个家庭作业之前, 也许你可以做另一个非常有效的家庭作业, 那就是简单地尝试实现这一切｡

04:41.220 --> 04:44.100
我再次, 你知道, 只是实现完全相同的一个｡ 

04:44.100 --> 04:48.630
这将是很好的练习, 因为到目前为止, 你只是听了我的解释｡ 

04:48.630 --> 04:54.090
但是, 听别人说和自己去做是有很大区别的｡ 

04:54.120 --> 04:55.370
噢, 噢, 噢｡ 

04:55.380 --> 04:56.550
你看到发生了什么吗？

04:56.580 --> 04:57.900
它自己找到了路｡ 

04:57.900 --> 04:58.890
这是惊人的｡ 

04:59.190 --> 05:06.450
它是如何摆脱它的有趣, 但我相信有一个更好的策略, 更有效地摆脱它｡ 

05:06.660 --> 05:08.190
而现在看起来还不错｡ 

05:08.190 --> 05:10.290
也许我说得太快了｡ 

05:10.290 --> 05:11.640
也许这能解决问题｡ 

05:11.640 --> 05:12.570
不, 我们开始吧｡ 

05:12.570 --> 05:14.040
它又卡在这里了｡ 

05:14.040 --> 05:16.140
这对车来说很有挑战性, 对吧？

05:16.230 --> 05:18.270
但我相信这个问题可以解决｡ 

05:18.570 --> 05:19.680
这就是你的目标｡ 

05:19.680 --> 05:20.700
祝你好运｡ 

05:20.700 --> 05:23.400
请让我知道你的解决方案｡ 

05:23.700 --> 05:24.990
在那之前, 好好享受吧｡ 

05:24.990 --> 05:25.620
一､ 
