WEBVTT

00:00.450 --> 00:01.610
艾莉森应该知道的事｡ 

00:01.620 --> 00:03.450
什么是互联网？

00:04.320 --> 00:07.770
Internet是一个庞大计算机网络｡ 

00:07.890 --> 00:10.230
现在变得很大的那个｡ 

00:10.800 --> 00:11.550
你什么意思, 那是｡ 

00:11.940 --> 00:12.320
怎么一个｡ 

00:12.780 --> 00:13.590
你给它写什么？

00:13.590 --> 00:14.280
像邮件？

00:14.310 --> 00:14.550
不, 不, 不

00:14.550 --> 00:16.170
很多人都用它来交流｡ 

00:16.320 --> 00:18.820
我猜他们可以和NBC的编剧和制片人交流｡ 

00:18.840 --> 00:21.270
艾莉森, 你能解释一下什么是互联网吗？

00:29.010 --> 00:30.430
这是多么令人惊奇啊？

00:30.450 --> 00:34.260
就在20多年前, 人们甚至不知道互联网是什么｡ 

00:34.260 --> 00:36.990
今天, 我们甚至无法想象没有它的生活｡ 

00:37.020 --> 00:39.410
欢迎来到深度学习课程A to Z｡ 

00:39.420 --> 00:43.190
我的名字是基拉·拉姆科和合作教练沿着, 挤在庞蒂米斯特｡ 

00:43.200 --> 00:48.060
我们非常高兴您能加入我们的行列, 今天我们将为给予简要介绍什么是深度学习,

00:48.060 --> 00:52.050
以及为什么它现在正在兴起｡

00:52.050 --> 00:53.520
那么我们开始吧｡ 

00:53.520 --> 00:55.290
我们为什么要看那段视频

00:55.290 --> 00:57.540
这张照片是什么？

00:57.540 --> 01:00.120
那是1994年的视频

01:00.150 --> 01:02.910
这是一张1980年的电脑照片｡ 

01:02.910 --> 01:09.450
我们之所以要深入研究历史,

01:09.450 --> 01:16.530
是因为神经网络和深度学习已经存在了相当长的一段时间, 它们现在才开始起步并影响世界｡

01:16.530 --> 01:20.850
但如果你回头看八十年代,

01:20.850 --> 01:27.540
你会发现, 尽管它们是在六七十年代发明的, 但它们确实在八十年代赶上了一种潮流或刮起了风｡

01:27.540 --> 01:30.330
所以人们开始谈论他们很多｡ 

01:30.600 --> 01:35.820
在这个领域有很多研究, 每个人都认为深度学习或神经网络是一种新事物,

01:35.820 --> 01:42.930
它将影响世界, 将改变一切, 它将解决所有世界问题｡

01:42.930 --> 01:45.960
然后在接下来的十年里慢慢消失了｡ 

01:46.140 --> 01:46.890
那后来呢？

01:46.890 --> 01:50.790
为什么为什么神经网络没有存活下来, 没有改变世界？

01:50.850 --> 01:56.790
这就是原因, 它们不够好, 它们不擅长预测事物,

01:56.790 --> 02:02.250
也不擅长建模, 基本上不是一个好的发明.

02:02.250 --> 02:03.360
还是另有原因？

02:03.360 --> 02:08.340
事实上,

02:08.340 --> 02:13.500
之所以会出现在我们面前, 是因为当时的技术还没有达到促进神经网络发展的标准｡

02:13.500 --> 02:17.790
为了让神经网络和深度学习正常工作, 你需要两样东西｡ 

02:17.790 --> 02:21.540
你需要数据, 你需要大量的数据, 你需要处理能力｡ 

02:21.540 --> 02:25.770
你需要强大的计算机来处理这些数据, 并促进神经网络｡ 

02:25.770 --> 02:28.260
让我们来看看是如何做到的｡ 

02:29.060 --> 02:34.530
数据或数据存储经过多年的发展, 然后我们将看看技术是如何发展的｡ 

02:34.540 --> 02:38.830
这里我们有三年时间, 1956年, 1980年, 2017年｡ 

02:39.760 --> 02:43.090
1956年的存储是什么样子的？

02:43.090 --> 02:49.720
嗯, 有一个硬盘驱动器, 而那个硬盘驱动器只是一个五等一兆字节的硬盘驱动器｡ 

02:49.720 --> 02:55.210
这是5兆字节的叉车上的一个小房间的大小｡ 

02:55.210 --> 03:01.000
这是一个硬盘驱动器被运送到另一个位置的飞机｡ 

03:01.000 --> 03:07.930
这就是1956年的存储情况,

03:07.930 --> 03:15.430
你必须支付一家公司当时的2500美元来租用硬盘, 而不是购买硬盘来租用一个月｡

03:16.150 --> 03:18.700
1980年, 情况稍有好转｡ 

03:18.700 --> 03:25.090
所以这里我们有一个10MB的硬盘, 35000美元仍然很贵, 而且只有10MB｡

03:25.090 --> 03:26.860
这就像是这些天的一张照片｡ 

03:26.980 --> 03:36.790
而在2017年的今天, 我们以150美元的价格推出了一张256 GB的SD卡, 它可以戴在你的手指上｡ 

03:36.790 --> 03:43.480
如果你在一年后或者2019年或2025年看这段视频, 你可能会暗自发笑,

03:43.480 --> 03:47.170
因为到那时你的存储容量甚至更大了｡

03:47.170 --> 03:49.020
但不管怎么说, 这一点是成立的｡ 

03:49.020 --> 03:53.860
因此, 如果我们全面比较这些产品, 并且我们已经将价格和规模考虑在内,

03:53.860 --> 03:58.300
那么当时的趋势就是容量｡

03:58.300 --> 04:08.860
所以从1956年到1980年, 容量增加了大约一倍, 然后又增加了大约25,600倍｡ 

04:08.980 --> 04:13.150
时间的长短, 也没什么不同｡ 

04:13.150 --> 04:18.700
所以从1956年到1982年24年, 从1980年到2017年37年｡ 

04:18.700 --> 04:24.610
所以不是时间的增加, 而是技术进步的巨大飞跃｡ 

04:24.610 --> 04:28.120
这表明, 这不是一个线性趋势｡ 

04:28.120 --> 04:30.550
这是技术的指数级增长｡ 

04:30.550 --> 04:36.640
如果我们把价格和尺寸考虑进去, 它将增加数百万美元｡ 

04:37.060 --> 04:40.420
这是一个对数刻度的图表｡ 

04:40.420 --> 04:46.180
如果我们绘制每GB的硬盘成本, 您会看到类似这样的结果｡ 

04:46.180 --> 04:50.200
我们现在正迅速接近零｡ 

04:50.200 --> 04:55.090
你可以在Dropbox和Google Drive上获得存储空间, 这不需要你花任何钱, 云存储,

04:55.390 --> 04:57.160
这将继续下去｡

04:57.160 --> 05:01.150
事实上, 在过去的几年里, 这将进一步发展｡ 

05:01.150 --> 05:05.800
现在, 科学家们正在研究利用DNA进行存储｡ 

05:05.800 --> 05:07.660
而且现在它相当昂贵｡ 

05:07.660 --> 05:15.100
合成两兆字节的数据需要花费7,000美元, 然后再花2000美元来读取它｡ 

05:15.100 --> 05:19.930
但这提醒了你硬盘和飞机的整个情况, 这将很快得到缓解, 从现在起10到10年后,

05:19.930 --> 05:24.670
20年后, 每个人都将使用DNA存储,

05:24.670 --> 05:28.420
如果我们沿着这个方向发展｡

05:28.420 --> 05:29.890
这里有一些数据｡ 

05:29.890 --> 05:35.320
所以你可以进一步探索它, 如果你想读更多关于这个的内容, 可以暂停这个, 暂停视频｡

05:35.320 --> 05:36.760
这是自然网发来的｡ 

05:36.760 --> 05:44.440
基本上, 你可以在一公斤的DNA存储器中存储世界上所有的数据,

05:44.590 --> 05:49.300
或者你可以在一克的DNA存储器中存储大约10亿TB的数据｡

05:49.300 --> 05:56.080
所以这只是一些东西来显示我们的进步有多快, 这就是为什么深度学习正在加快,

05:56.080 --> 06:04.060
现在我们终于到了一个阶段, 我们有足够的数据来训练超级酷, 超级复杂的模型｡

06:04.060 --> 06:08.200
回到八十年代, 当它最初被发明的时候, 情况并非如此｡ 

06:08.470 --> 06:12.700
我们讨论的第二件事是处理能力｡ 

06:12.700 --> 06:17.770
这里我们又得到了一个对数尺度的指数曲线｡ 

06:17.800 --> 06:24.340
这里的描述并不理想, 但在右边你可以看到它是一个对数刻度, 这就是计算机的发展过程｡

06:24.340 --> 06:26.290
请再次暂停这张幻灯片｡ 

06:26.290 --> 06:27.340
这就是摩尔定律｡ 

06:27.370 --> 06:34.090
你可能听说过计算机的处理能力发展得有多快｡ 

06:34.210 --> 06:39.940
现在, 我们在这里的某个地方,

06:39.940 --> 06:47.560
一台普通的计算机可以花1000美元买下, 以老鼠大脑的速度思考, 25之间将是人类或23岁的孩子的速度｡

06:47.560 --> 06:54.640
然后到2050年或2045年, 它将超过所有人类的总和｡ 

06:54.640 --> 07:01.540
所以基本上我们正在进入一个电脑的时代, 它是非常强大的,

07:01.540 --> 07:05.590
它可以处理事情的速度比我们想象的要快得多｡

07:05.590 --> 07:08.410
而这正是促进深度学习的原因｡ 

07:08.410 --> 07:11.890
所以所有这些都让我们想到了一个问题：什么是深度学习？

07:11.890 --> 07:15.340
这整个神经网络是怎么回事？

07:15.340 --> 07:16.750
这到底是怎么回事？

07:16.750 --> 07:18.130
我们到底在说什么？

07:18.130 --> 07:21.490
你们可能看过一张照片, 类似这样的, 让我们深入了解一下｡ 

07:21.490 --> 07:22.570
什么是深度学习？

07:23.320 --> 07:28.150
这位先生, 杰弗里·欣顿顿, 被称为深渊教父｡ 

07:28.290 --> 07:33.390
他在八十年代做过深度学习方面的研究｡ 

07:33.390 --> 07:41.010
他做了很多很多的工作, 他在深度学习上发表了很多研究论文｡ 

07:41.010 --> 07:42.810
现在他在谷歌工作｡ 

07:42.810 --> 07:48.180
所以我们将要讨论的很多东西实际上都来自杰弗里·欣顿顿, 你可以看到很多｡

07:48.210 --> 07:49.770
他在YouTube上有很多视频｡ 

07:49.770 --> 07:51.270
他把事情解释得很好｡ 

07:51.270 --> 07:53.900
所以我强烈建议你去看看｡ 

07:53.910 --> 08:03.240
所以深度学习背后的想法是观察人类的大脑, 这将是一个相当多的神经科学即将到来, 在这些教程｡

08:03.240 --> 08:09.240
我们在这里要做的是模仿人脑的运作方式｡ 

08:09.240 --> 08:10.920
而我们知道的也不多｡ 

08:10.920 --> 08:14.940
你并不了解人类大脑的一切, 但我们所知道的那一点点, 我们想模仿它,

08:14.940 --> 08:16.650
再创造它｡

08:16.650 --> 08:17.160
为什么呢？

08:17.160 --> 08:22.050
因为人类的大脑似乎是这个星球上最强大的学习工具之一, 用来学习, 适应技能,

08:22.050 --> 08:25.020
然后应用它们｡

08:25.020 --> 08:32.910
如果计算机可以复制, 那么我们就可以利用自然选择已经为我们决定的东西｡

08:32.910 --> 08:36.750
所有这些算法, 它已经决定是最好的｡ 

08:36.750 --> 08:37.770
我们只是要利用这一点｡ 

08:37.770 --> 08:39.210
为什么要重新发明自行车？

08:39.210 --> 08:39.590
好吧, 我知道了

08:39.630 --> 08:41.880
让我们来看看它是如何工作的｡ 

08:41.880 --> 08:44.490
我们有一些神经元｡ 

08:44.490 --> 08:52.020
这些神经元被涂在玻璃上, 然后在一个有颜色的显微镜下观察｡

08:52.020 --> 08:54.210
你可以看到它们的样子｡ 

08:54.210 --> 08:58.470
它们有身体, 有树枝, 还有尾巴等等.

08:58.470 --> 08:59.520
这样你就能看到他们了｡ 

08:59.520 --> 09:01.620
它们中间有一个细胞核｡ 

09:01.620 --> 09:06.840
这基本上就是人脑中神经元的样子｡ 

09:06.840 --> 09:10.500
总共大约有1000亿个神经元｡ 

09:10.500 --> 09:11.700
这些是独立的神经元｡ 

09:11.700 --> 09:15.240
这些实际上是运动神经元因为它们更大, 更容易看到.

09:15.240 --> 09:23.880
然而, 人类大脑中有1000亿个神经元, 每个神经元都与多达1000个相邻神经元相连｡

09:23.880 --> 09:26.520
给予你们一张图片, 这是它的样子｡ 

09:26.520 --> 09:31.890
这是人脑的一个真实部分｡ 

09:31.890 --> 09:38.880
这是小脑, 也就是你大脑后部的一部分｡ 

09:38.880 --> 09:47.610
它负责像矩阵和保持你的平衡和一些语言能力之类的东西｡

09:47.610 --> 09:54.870
所以这只是为了展示有多少个神经元｡ 

09:54.900 --> 09:58.720
它们就像是数十亿的神经元在你的大脑中连接在一起｡ 

09:58.720 --> 10:02.520
所以我们说的不是五个､ 五百个､ 一千个或一百万个｡ 

10:02.520 --> 10:04.230
这里面有数十亿个神经元｡ 

10:04.560 --> 10:08.250
是的, 所以这就是我们要尝试重现的｡ 

10:08.250 --> 10:11.640
那么我们如何在计算机中重现这个呢？

10:11.640 --> 10:20.310
我们创建了一个人工结构, 叫做人工神经网络, 这里有节点或者神经元,

10:20.310 --> 10:23.400
我们还有一些神经元用来输入值.

10:23.400 --> 10:27.270
所以这些是你在特定情况下所知道的价值观｡ 

10:27.270 --> 10:31.170
比如说, 你在建模, 你想预测,

10:31.170 --> 10:34.950
你总是会有一些输入, 一些开始你的预测的东西｡

10:35.130 --> 10:37.890
这就是所谓的输入层, 然后是输出层｡ 

10:37.890 --> 10:43.230
这就是你要预测的价值, 或者是意外, 或者是某人要离开银行还是留在银行,

10:43.230 --> 10:47.850
这是一笔欺诈交易吗？

10:47.850 --> 10:49.410
这是真实的交易吗？

10:49.410 --> 10:50.280
如此等等｡ 

10:50.700 --> 10:52.350
这将是输出层｡ 

10:52.350 --> 10:55.260
在中间我们会有一个隐藏层｡ 

10:55.260 --> 10:59.670
所以你可以在你的大脑中看到, 你有这么多的神经元｡ 

10:59.670 --> 11:03.240
所以一些信息通过你的眼睛､ 耳朵､ 鼻子进入｡ 

11:03.300 --> 11:04.860
所以你基本上是你的感官｡ 

11:04.860 --> 11:09.180
然后, 它不仅仅是直接输出｡ 

11:09.180 --> 11:14.460
结果是在到达输出端之前, 经过了数十亿个神经元｡

11:14.460 --> 11:16.980
这就是我们要对大脑建模的整个概念｡ 

11:16.980 --> 11:20.520
所以我们需要这些隐藏的层在输出之前｡ 

11:20.520 --> 11:26.490
输入层的神经元连接到隐藏层的神经元, 隐藏层的神经元连接到输出值｡

11:26.640 --> 11:29.220
所以这是这是相当酷｡ 

11:29.220 --> 11:30.480
但这到底是怎么回事？

11:30.480 --> 11:32.040
这里的深度学习在哪里？

11:32.040 --> 11:32.820
为什么叫深度学习？

11:32.820 --> 11:33.900
这里面没什么东西｡ 

11:33.900 --> 11:39.390
这就像是一种可以被称为浅层次学习的选择｡ 

11:39.690 --> 11:41.670
实际上没什么进展｡ 

11:41.670 --> 11:43.380
但为什么叫深度学习呢？

11:43.380 --> 11:45.960
好吧, 因为这样我们就能更进一步｡ 

11:45.960 --> 11:48.180
我们把它分离得更远｡ 

11:48.180 --> 11:50.730
而且我们并不是只有一个隐藏层｡ 

11:50.730 --> 11:57.720
我们有很多很多隐藏的层, 然后我们把所有的东西都连接起来｡ 

11:57.720 --> 12:01.830
就像在人类的大脑里一样, 我们把一切都联系起来, 把一切都联系起来｡ 

12:01.830 --> 12:08.550
这就是输入值如何通过所有这些隐藏的层进行处理, 就像在人脑中一样｡

12:08.550 --> 12:12.300
然后我们有了一个输出值, 现在我们谈论深度学习｡ 

12:12.300 --> 12:15.780
这就是深度学习在一个非常抽象的层面上的意义｡ 

12:15.780 --> 12:21.120
在后续的教程中, 我们将深入剖析深度学习, 在教程结束时,

12:21.120 --> 12:26.460
您将了解深度学习是什么, 以及如何将其应用到您的项目中｡

12:26.460 --> 12:27.930
对这个可汗超级兴奋｡ 

12:28.040 --> 12:31.790
等待开始, 我期待着看到你在下一个教程｡ 

12:31.820 --> 12:33.830
在此之前, 请尽情享受深度学习｡