2017年5月,在中国乌镇围棋峰会上,AlphaGo与排名世界第一的世界围棋冠军柯洁对战,再次轻松获胜。至此,围棋界公认AlphaGo的棋力已经超过人类职业围棋顶尖水平。与柯洁一战之后,AlphaGo团队宣布其将不再参加围棋比赛。
2017年10月18日,DeepMind团队公布了代号为AlphaGo Zero的最强版阿尔法围棋。哈萨比斯一直以来都想创造一个能够像人类一样“学习”如何玩游戏并达到高水平的AI,在他看来,AlphaGo并非人们认为的“机器”,“就好像和人类一起探索宇宙的哈勃望远镜一样,AlphaGo是和我们一起探索围棋的哈勃”。
他一直极其坚定地相信AI能够帮助人类以更快速度取得更大突破。像哈萨比斯这类“谢耳朵”型男生通常都做事专注认真但木讷、不善沟通,但哈萨比斯的难能可贵之处就在于他在带领团队的过程中还培养了在多种环境下工作的能力并逐渐成长为善于表达的沟通者。
他经常以深入浅出的方式向大众介绍自己复杂的工作以及这些工作有何重要意义。他娓娓道来地去分解描述DeepMind是如何把传统AI技术和新技术进行结合的,比如在围棋上,DeepMind结合了传统“树搜索”的方法和模拟大脑神经元的“深度神经网络”,并巧妙地融合了多种不同的AI技术。
他曾在做客BBC时讲到,在AI领域深度学习和强化学习是最让他兴奋的两件事,前者用于识别,后者用于决策,AlphaGo就是两者结合的产物。DeepMind将采用处理长期规划的更深层次的强化学习技术引入AlphaGo中,而不是简单地采用预编程系统按既定步骤下棋。
依靠增强学习系统,AlphaGo可以汲取人类棋手比赛的营养,然后开创自己的打法。未来DeepMind还将整合记忆等其他功能,“将所有这些不同领域整合在一起是关键。因为我们感兴趣的算法能够将针对某一领域的学习经验应用至新的领域”。
新技术的引进使得AlphaGo Zero能力卓越,与同类程序对弈胜率高达99.8%。能够达成这样的结果除了新技术的原因,还源于哈萨比斯对“智力(Mind)”的认知,“AlphaGo以人类的方式去下棋。它也是按照人类的方式去学习的,像你和我一样,在不断练习中技能得以提高”。
曾经击败国际象棋冠军的深蓝,需要国际象棋大师和程序员组成团队来教它下棋的技巧。不断进化的AlphaGo Zero,就像一个初生的婴儿,在围棋世界里面对既定规则和要赢的目标,先学习走路,在无数次自我对抗中完善自我理解与认知,产生了直觉。慢慢地,它不仅能掌握人类大师下棋的技能,还会自己发展出一些新的技能,并用这些技能摧毁人类智慧的壁垒。
随着AlphaGo变得声名卓著,哈萨比斯也获得了许多荣誉,包括“亚洲奖”年度科技最佳贡献奖、英国皇家学会颁发的“穆拉德奖”(Mullard Award)、Nature杂志评选的“年度十大人物”、《时代》提名的全球最具影响力100人等等。
坚持探索通用AI
哈萨比斯给自己设定的终极目标是理解时间、黑洞以及人类在整个宇宙中的真正地位,通用AI是他到达这一星辰大海的途径。读博时,哈萨比斯就开始寻求在人类大脑中寻找新的AI算法的灵感了。
2007年,他发现5位失忆症患者因为海马体受损而很难想象未来,这证明了大脑中以往被认为只与过去有关的部分对于规划未来也至关重要。这些年,在AlphaGo获得了不起的成功的同时,哈萨比斯坚持对通用AI的探索,带领DeepMind做了很多大事:
2016年底,DeepMind开源了其核心深度学习平台之一“DeepMind Lab”供研究人员和开发者使用。这是一套为玩游戏的智能机器人打造的娱乐学习游戏平台。开源之后,全世界的研究人员和开发者都可以在上面发挥才智,为AI发展群策群力。
同一时间,DeepMind还公布了一台“可微分神经计算机”(DNC),简单理解就是这台机器既能像人类一样思考,又能像计算机一样进行高速运算和记忆数据,使得“机器”向“人”更迈进了一步。
为了让“机器”更像“人”,DeepMind在图像生成和语音生成领域也有超前研究,其2016年公布的语音生成系统WaveNet据称将计算机输出音频与人类自然语音差距缩小了50%。
医疗是哈萨比斯强调的AI需要落地的领域。DeepMind Health是智能医疗系统,其根据与英国全国医疗系统合作获取的数据打造基于AI的诊疗和症状判断帮助;Alpha Fold能根据基因序列来预测蛋白质的3D结构,在有“蛋白质结构预测奥运会”之称的CASP比赛中力压其他97个参赛者夺冠,为医疗领域变革、新药物研发奠定了理论基础。
DeepMind还运用AI系统优化了冷却系统的用电效率,据说一次性帮谷歌节省了上亿美金的开销。2018年底,Alpha Zero只用一个算法就在围棋、国际象棋和将棋三个领域奠定了霸主地位,并因此登上了《科学》封面,被评价“能够解决多个复杂问题的单一算法是创建通用机器学习系统,解决实际问题的重要一步”。
打造通用AI并不容易,DeepMind另辟蹊径,从现实生活中获得灵感,把解决方案提炼总结为“在许多不同的可能组合中选择正确的路径”。他认为,在可以预见的将来,AI会像科学家一样工作,提出假设并设计实验来验证假设,然后“取得可能获得诺贝尔奖的重大突破”。
为了推进通用AI发展进程,哈萨比斯甚至还非常少见地亲手写下长篇文章,发表在神经医学界的顶级刊物《神经》中,提出“假如我们的目标是开发出接近或同等于人类智慧的智能技术,那么就绝不能放弃对人脑的研究和理解,因为人脑是唯一能够证明这种智慧存在的证据”的鲜明观点。
目前DeepMind主要专注于两方面的研究,一个是对前面提到的强化学习的深度探索,可能会与机器决策、物理世界处理等AI领域的技术相结合;另一个是AI可解释性,既用心理学和神经科学来破解AI黑箱,同时也希望用强化学习等“AI原理”帮助探秘人类大脑。
这些研究的重要意义不在于得到了什么具体成果,而在于给跨学科研究做出了扎实的示范,证明了神经学补全AI的可行性,其非常关键的机器心智理论可能会成为主流研究方向。
而且,哈萨比斯认为,不仅AI需要向神经科学学习,对人类大脑与神经的研究今天也需要向AI学习。用强化学习机制来解释人脑的运作模式被实验证明解释是正确的,那么对人类大脑机制的研究与模仿应该也可以加强对强化学习技术的理解和升级。
未来与记忆相关的AI技术或将成为DeepMind的研究重点,情景记忆、工作记忆、长期学习等技术很有可能成为突破方向。哈萨比斯的畅想是:通过AI来了解人类智慧,让AI与人类大脑形成比对,或许可能“对人类心灵中一些最深刻和最持久的奥秘如创造力、梦想等产生深刻的见解,甚至能触及意识的本质”。
天才领导者和生活里的普通人
作为企业家的哈萨比斯领导着Deepmind一个包括400名博士的共700名员工的团队。被谷歌收购后,热爱自己家乡的哈萨比斯不愿搬迁,“我在北伦敦出生并长大,非常喜欢这座城市。伦敦没有任何理由无法容纳一家世界级的AI研究机构。我很骄傲我们能留在这里。”
DeepMind办公楼的所有房间都以人类史上的天才来命名:特斯拉、拉马努詹、柏拉图、费曼、亚里士多德、居里夫人等。办公环境是最有利于人们发挥创造力的设计,大楼的一楼有咖啡厅、有带冰箱的会客室、桌上有足球游戏机。楼顶是一个可以看到伦敦美好风景的露天平台,每周五晚上员工们在那里举办聚会。
公司汇聚了全世界最优秀的人才,类似波兰物理奥赛的冠军或者法国顶级的数学博士等,他们都看起来健康、愉快、酷,空气中彷佛都弥漫着知识的味道。哈萨比斯花很多时间思考“DeepMind作为一种算法的效率”,他坚信自己能把事情做得更出色,因为公司融合了最优秀的学术氛围和最令人兴奋的创业文化。
这样的环境和氛围使得即使在谷歌最大的竞争对手大举挖人之时,DeepMind的员工离职率也为0。作为公认的天才的哈萨比斯,并非电影里那种疯狂地企图做出一件轰动人类大事的科学家,或者生活中常见的表面木讷、内心狂野的“极客”,他很接地气。
和绝大多数普通人一样,他在该结婚的年龄成了家,妻子是一名意大利的分子生物学家,专注于阿兹海默症的研究。他们育有两个儿子,分别擅长科学和创造性活动。与绝大多数人的不同之处在于,哈萨比斯一天之内有两个工作日。
他上午十点左右到办公室协调、沟通、决策,引导公司保持世界领先地位。然后在晚上7点半搭乘地铁准时回到距离他儿时生活地点不远的家中,陪伴家人进餐,与孩子们一同游戏、读书或是帮他们完成家庭作业。在把两个孩子哄睡之后,他重新开始工作至凌晨一点,之后用几个小时来进行深度思考,直至凌晨四点入眠。
那些震惊世人的想法都是来自深夜的思考。“完全是个超人”的哈萨比斯认为工作和生活“是同一块画布的不同部分”,他阅读、看电影、听音乐,但最终还是会回到工作上,变成他思考问题的引子。“在我醒来的每个时刻,工作都是我思考的问题,或许在梦里也是如此,这也是我最有热情的一件事。”
哈萨比斯谈到工作时的样子能够让你相信工作真的是一件最有趣的事,“我感觉非常幸运,每个时刻我都在做自己真正坚信的事。否则,生命那么短暂,为何要去做这些?”所谓天才,其实很大的部分来自于专注。