加入收藏 | 设为首页 | 会员中心 | 我要投稿 财气旺网 - 海宁网 (https://www.hainingwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 访谈 > 正文

我是黄士杰,AlphaGo人肉臂

发布时间:2017-06-14 08:28:43 所属栏目:访谈 来源:量子位 ID:QbitAI) 他面无表情,他冷静镇定,他会出
导读:副标题#e# 文/舒石 (来源:量子位 ID:QbitAI) 他面无表情,他冷静镇定,他会出现在对手的梦里,他是AlphaGo人肉臂。他热情幽默,多才多艺。他很少登台演讲。他不被允许接受采访。他是AlphaGo真正的创造者。他是Aja,黄士杰。 许峰雄绰号“CB”。 1980 年,
副标题[/!--empirenews.page--]

我是黄士杰,AlphaGo人肉臂

 文/舒石 (来源:量子位 ID:QbitAI)

他面无表情,他冷静镇定,他会出现在对手的梦里,他是AlphaGo人肉臂。他热情幽默,多才多艺。他很少登台演讲。他不被允许接受采访。他是AlphaGo真正的创造者。他是Aja,黄士杰。

许峰雄绰号“CB”。

1980 年,许峰雄(Feng-Hsiung Hsu)从台湾大学本科毕业, 1985 年考入卡内基梅隆大学。 1988 年,CB制造出国际象棋程序Deep Thought(深思),后来经过学弟李开复介绍, 1989 年加盟IBM继续展开研究。

1997 年

这一年 5 月 11 日,卡斯帕罗夫与Deep Blue(深蓝)的第二次国际象棋人机大战落幕,最终人类棋王以2-3的总比分,不敌IBM的超级电脑。

这是载入人类历史的一战。

Deep Blue,就是CB许峰雄在IBM开发出的新一代国际象棋电脑程序,棋力数百倍于早先的Deep Thought。

我是黄士杰,AlphaGo人肉臂

△ 卡斯帕罗夫与深蓝的国际象棋人机大战

同年 7 月,台北成功高中的黄士杰参加联考。当年国文试题第 15 题,B选项是:现代电脑的优点多得「罄竹难书」令人不得不叹服 。

黄士杰最终考入台湾交通大学,四年后获得计算机与信息科学学士。 2001 年,黄士杰考入台湾师范大学攻读研究生学位。

2003 年,黄士杰硕士毕业。毕业论文:《电脑围棋打劫的策略》。在学校当了一年的研究助理后, 2004 年,黄士杰再次考入师大资讯工程研究所博士班。

2007 年

这年 2 月 28 日,台湾师范大学的学生组织了一次围棋同好聚会。随后这个定期的聚会,发展为师大围棋社,黄士杰是其中年纪最大的学长,并担任首届社长。 3 月,黄士杰拟定了首次对战分组表,比赛地点在男生宿舍地下餐厅。

我是黄士杰,AlphaGo人肉臂

△ 左一是师大就读期间的黄士杰

同年 5 月,黄士杰带领师大围棋社参加台湾大专杯围棋赛。曾经有台湾媒体报道称黄士杰曾经带领师大围棋社在这项比赛中夺冠。不过量子位仔细查找后发现,师范大学仅在 2009 年获得过第五名,其他年份均榜上无名。

同一赛事 15 个级别的个人战中,前八名也没有看到黄士杰的名字。2004- 2011 年间,黄士杰一直博士在读,而他的棋力水平是业余六段。

虽然没能在人类的围棋赛中获得瞩目成绩,但黄士杰在另一条路上继续进发。他的一个主要战场是国际计算机游戏协会(ICGA)组织的电脑棋类程序竞赛。顾名思义,来自全世界的电脑高手,在象棋、围棋等领域展开斗法。

在这个比赛中,黄士杰的名字写作:Shih-Chieh Huang。

2006 年,黄士杰独自开发的第一款围棋程序AjaGo,获得围棋大赛第 11 名;他参与的中国象棋程序Elephant(大象),获得大赛的铜牌。此后几年,黄士杰开发的围棋程序参赛成绩一直没有亮眼的成绩。

2010 年

这一年 9 月,哈萨比斯(Demis Hassabis)等三人在英国伦敦合伙成立了一家新公司,名字叫做DeepMind。

我是黄士杰,AlphaGo人肉臂

△2010 年黄士杰开发的Erica击败Zen获得冠军

同一个 9 月,黄士杰在Rémi Coulom的指导下,开发出围棋程序Erica,并在围棋比赛中击败日本的Zen,获得当年的冠军。这在当时可算了不起的成就。Rémi Coulom是另一个围棋程序Crazy Stone的作者。

因为Erica的夺冠,让黄士杰在参加博士毕业答辩前,就已经获邀前往加拿大阿尔伯塔大学攻读博士后,并担任电脑围棋程序的研究员。他的博士论文题目是:《应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法》。

2011 年 6 月,黄士杰博士答辩通过, 7 月 1 日,黄士杰飞赴加拿大。

此时,他后来会遇到的席尔瓦(David Silver),早于一年前从阿尔伯塔大学离开,前往伦敦大学学院。在伦敦,席尔瓦会遇到哈萨比斯。

到阿尔伯塔大学后,黄士杰继续研究蒙特卡洛树搜索。他还浅度参与了Fuego的开发,这个团队里还有Markus Enzenberger、Martin Müller等人,这个围棋参加了当年的ICGA大赛,不过可谓一无所获。

当年 11 月,夺冠的还是Zen。

时间再过一年, 2012 年 11 月,黄士杰也来到伦敦,加入DeepMind担任高级研究员。至少从这个时候开始,黄士杰开始用新的英文名:

Aja Huang。

2014 年初

加入DeepMind的两年里,黄士杰似乎没有重大的研究成果。从论文发布量上看,也是如此, 2014 年前几乎搜不到他发的论文。

然而事情很快有了转机。

2014 年 1 月 26 日,Google宣布 5 亿美元收购DeepMind,拿下这家日后会大放异彩的初创公司。

我是黄士杰,AlphaGo人肉臂

△ 左为哈萨比斯,右为席尔瓦

有一天,席尔瓦走到黄士杰面前说:“Aja,我们准备启动一个围棋项目。最开始只有你和我”。 2014 年 2 月,AlphaGo项目正式启动,团队三个人:哈萨比斯、席尔瓦、黄士杰。哈萨比斯是整个公司的老板,席尔瓦是黄士杰的经理。所以,这个团队真正干活的只有黄士杰一个人。

AlphaGo项目,就是想搞出一个强大的围棋程序。而且从一开始,这个团队就决定不会尝试所有的方法,他们只有一个方向:沿着深度学习和强化学习的方向探索。也是从一开始,他们就知道这是一个非常困难的挑战。

哈萨比斯说,希望通过AlphaGo的研究,让机器获得直觉和创造力。

而更现实的困难是,与国际象棋相比,围棋的计算空间巨大,而且电脑无法理解一盘棋到底谁获得了胜利。

但他们就这样出发了。

2014 年 6 月- 2015 年 6 月

这年夏天,AlphaGo的第一个重要武器出现了。在卷积神经网络的帮助下,AlphaGo学习了很多人类高手的棋谱,能在 3 毫秒内做出比肩人类的下棋直觉。后来黄士杰给这个武器命名:“策略网络”,并且持续进行训练优化。

这个时候,AlphaGo的训练还是在GPU上完成的。

时间再过一年。 2015 年 6 月,AlphaGo拥有了更强大、分布式的搜索技术支持。阅读棋局的能力大幅提升,可以检索多种局面变化,并且找到最佳的应对方式。这个时候的AlphaGo,可以算出后续40- 60 步棋。

(量子位注:击败柯洁的最新版AlphaGo,也只算到 50 步棋就停止了。)

当时在相同的硬件条件下,AlphaGo对另一个围棋程序Crazy Stone取得了70%的胜率,换句话说棋力领先了一个子。这个成就让整个DeepMind都很受鼓舞,哈萨比斯这时候对黄士杰说:

“Aja,咱们要组一个团队,你不用再单打独斗了”。

(编辑:财气旺网 - 海宁网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读