任何足够先进的技术初看都与魔法无异。
自动驾驶汽车已经在很多国家上路,网飞的算法能主动预测你喜欢的电影,DeepMind的计算机程序通关了雅达利游戏,AlphaGo在古老的围棋领域攻克了人类智能的防线。
这一切是如何发生的?智能机器究竟如何思考?
在这本书中,作者用几乎人人都能读懂的语言展示了人工智能领域的前沿成果,深入解读了感知算法、强化学习、智能体、卷积神经网络、深度语音识别、图片识别等科技巨头纷纷拥抱的概念,正是它们让当今的机器如此智能。
DARPA和ImageNet的挑战赛给未来播撒了怎样的种子?
网飞的电影推荐为什么如此准确?
人工智能怎么打DOTA?
AlphaGo除了下围棋还会做别的吗?
神经网络如何做到能听、能说、能记忆?
我们为什么要不断制造能复制人类智力和行为的机器?
这本书将为你打开机器学习与神经网络的黑匣子,让你看懂魔法背后的机制。关于自动驾驶汽车、网飞算法、会玩游戏的人工智能以及AlphaGo,这本书几乎囊括了你想知道的一切。
1. 这是一本技术小白和技术大咖都爱读的机器学习指南。谷歌前工程专家、机器学习极客肖恩格里什的重磅作品。
2. 深度神经网络是新一波人工智能热潮的推动引擎。围绕这一前沿工具展开的对话,推动着自动驾驶汽车、网飞的推荐算法、AlphaGo,甚至会打DOTA游戏的人工智能的发展,任何想要参与这一时代对话的人都应该读读这本书。
3. 作者用通俗的类比和鼓舞人心的故事,厘清了许多神秘而前卫的新概念:感知算法、强化学习、卷积神经网络、深度语音识别、图片识别等。掌握这些概念,你才能更好地判断,哪些关于人工智能的言论值得相信,哪些说得天花乱坠的谬论应该被抛弃,这本书将助力你的AI创业与投资之路。
4. 微软CTO凯文斯科特亲笔作序、谷歌工程总监雷库兹韦尔、美国人工智能协会院士佩德罗多明戈斯、谷歌研究科学家凯文墨菲、微软亚洲研究院副院长潘天佑、驭势科技CEO吴甘沙鼎力推荐!
推荐序
10多年前,我遇见了肖恩。当时我在谷歌领导团队,负责开发为谷歌的搜索广告业务提供支持的许多大型机器学习系统。肖恩是我们小组里最顶尖的工程师之一,当时他正在研究机器学习前沿领域的一系列具有挑战性的问题。我们一起工作以来,体现在统计机器学习技术中的各类人工智能已经从相对难以触及的神秘技术、研究人员和高科技公司的专属领域,发展成为日益平易近人的、卓有成效的工具和技术,值得每一位软件开发人员使用。
目前机器学习领域取得的快速进展,在一定程度上是由以下因素推动的:数据爆炸,高性能计算机体系结构的复兴,云提供商竞相为开发人员和研究人员构建可扩展的人工智能平台,人们将实时智能嵌入移动设备、汽车、其他消费电子产品和日益普遍的连接到云端的计算设备的热潮。这种快速进步中包括一些惊世骇俗的成就,机器在许多狭窄的领域已经接近于或超过了人类的能力,例如在图像中标记物体、识别语音、玩策略游戏以及翻译语言,但我们仍处于这些技术发展的初期,摆在我们面前的是长达几十年的创新和发现之旅。
对开发人员和研究人员而言,理解机器学习的工作原理是一个明智的职业选择。目前,全球的科技巨头公司对这些技术的专业知识都有很高的需求。微软、亚马逊、谷歌、苹果、百度等许多公司都提供应用程序接口、工具包和云计算基础设施,将机器学习的开发工作交给全世界数以千万计的开发人员。未来几年,随着越来越多的应用程序包含智能功能,大多数开发人员都需要掌握一些机器学习技术。这正是这本书的宝贵价值所在。
这本书诞生自肖恩对了解现代机器学习成功之路的渴望。在用清晰易懂的方式描述这些系统的本质时,肖恩利用10多年的行业和学术经验解决了机器学习带来的一些最棘手的问题。鉴于机器学习系统能够复制某些方面的人类智能,等到某个突破点临近,原本由人类特有的创造诗意词句的能力或许也会被机器复制。肖恩对这些技术严谨实用的描述反映了他在科研战壕中的岁月,不时令人感到痛苦的反复试验让战壕中的人们了解到,机器学习并不是魔法。如果你知道如何应用它,了解它的局限所在,它就是强有力的前沿工具;如果你不知道,它就几乎一文不值。
肖恩通过列举现实世界的例子,回避不必要的术语,使现代机器学习的概念变得通俗易懂。这本书假设读者在机器学习或计算机科学领域的知识相对较少,因此对更广泛的受众而言非常友好。鉴于当前围绕机器学习和人工智能的对话颇为活跃,并且这些技术可能对我们的未来产生影响,任何想要参与这场对话的人都应该尽可能地学习。由于市场上缺乏对机器学习通俗易懂的专业介绍,这本书将成为引导你理解底层技术的理想方法,它可以帮助你更好地判断哪些言论值得相信,哪些说得天花乱坠的谬论应该被抛弃。
微软CTO(首席技术官)
凯文斯科特(Kevin Scott)
肖恩格里什(Sean Gerrish)
谷歌前工程专家,普林斯顿大学的机器学习博士,机器学习极客。
曾在高频交易机构泰莎科技担任工程师,并在谷歌担任机器学习和数据科学团队的工程专家。
推荐序 IX
前言 XIII
1 自动机的秘密
长笛演奏者 003
今天的自动机 005
钟摆的摆动007
这本书中的自动机 008
2 自动驾驶汽车:挑战不可能
沙漠中的百万美元竞赛 015
如何打造自动驾驶汽车 017
规划路径 021
路径搜索 022
导航025
无人车挑战赛的获胜者 028
一场失败的比赛 031
3 保持在车道内行驶:自动驾驶汽车的感知
第二次无人车挑战赛 035
自动驾驶汽车中的机器学习 037
斯坦利的架构 038
避开障碍物 040
寻找道路的边缘 043
开眼看路 045
路径规划 047
斯坦利大脑的各个部分如何相互交流 049
4 在十字路口避让:自动驾驶汽车的大脑
城市挑战赛 055
感知抽象 057
比赛 059
老板的高层次推理层 061
攻克交通堵塞 068
三层架构 071
对自动驾驶汽车看到的物体进行分类 076
自动驾驶汽车是复杂的系统 077
自动驾驶汽车的轨迹 078
5 网飞和推荐引擎的挑战
百万美元大奖 083
竞争者 084
如何训练分类器 085
比赛的目标 089
庞大的评分矩阵 091
矩阵分解 096
第一年结束 102
6 团队融合:网飞奖的赢家
缩小竞争者之间的差距 107
第一年末 108
随时间变化的预测 111
过度拟合 114
模型混合 115
第二年 119
最后一年 120
赛后 124
7 用奖励教导计算机
DeepMind玩雅达利游戏 129
强化学习 132
教导智能体 134
为智能体编写程序 36
智能体如何观察环境 140
经验金块 141
用强化学习玩雅达利游戏 148
8 如何用神经网络攻克雅达利游戏
神经信息处理系统 153
近似,而非完美 153
用作数学函数的神经网络 155
雅达利游戏神经网络的结构 161
深入研究神经网络 170
9 人工神经网络的世界观
人工智能的奥秘 175
国际象棋自动机土耳其人 177
神经网络中的误导 179
识别图像中的物体 180
过度拟合 183
ImageNet 185
卷积神经网络 188
为什么是深度网络? 194
数据瓶颈 197
10 深入了解深度神经网络的内部秘密
计算机生成图片 203
压缩函数 204
ReLU激活函数 207
机器人之梦 211
11 能听、能说、能记忆的神经网络
对机器而言,理解意味着什么? 221
深度语音识别 222
循环神经网络 223
为图像生成字幕 230
长短时记忆网络 233
对抗数据 235
12 理解自然语言
宣传噱头还是人工智能研究的福音? 239
IBM的沃森 240
攻克《危险边缘》所遇到的挑战 241
浩如烟海的知识 242
《危险边缘》挑战赛的诞生 245
DeepQA 247
问题分析 249
沃森如何解读句子 252
13 挖掘《危险边缘》的最佳答案
地下室基准 261
生成候选答案 263
查找答案 266
轻量级过滤器 269
证据检索 270
评分 274
汇总和排名 277
调整沃森 281
重新审视DeepQA 282
沃森有智能吗? 283
14 用蛮力搜索找到好策略
通过搜索玩游戏 289
数独 290
树的大小 294
分支因子 297
游戏中的不确定性 297
克劳德香农与信息论 302
评价函数 303
深蓝 308
加入IBM 310
搜索与神经网络 311
西洋双陆棋程序 313
搜索的局限 315
15 职业水平的围棋
计算机围棋 319
围棋 321
通过抽样走子来建立直觉 324
神之一手 330
蒙特卡洛树搜索 333
单臂老虎机 337
AlphaGo是否需要如此复杂 339
AlphaGo的局限 341
16 实时人工智能与《星际争霸》
构建更好的游戏机器人 345
《星际争霸》与人工智能 346
简化游戏 348
实用《星际争霸》机器人 351
OpenAI与《DOTA 2》 354
《星际争霸》机器人的未来 357
17 50年后或更遥远的未来
人工智能起起伏伏的发展过程 363
如何复制这本书中的成功 364
数据的普遍使用 368
下一步去向何方 369
致谢 373
注释 375