围棋后德扑也被人工智能攻克了!下个会是麻将吗?

内容纲要

你有没有想过,未来某一天,称霸各种竞技、棋牌游戏的都不再是人类,而是AI(人工智能)?

据科技网站TechRepublic报道,虽说位于匹兹堡的河流赌场与“科技突破”有些不搭,但本周二(1月31日),它确实见证了卡耐基梅隆大学的AI系统Libratus将4位德州扑克顶级选手斩落马下。

据凤凰科技报道,Libratus是卡耐基梅隆大学计算机科学教授尚德洪姆与博士生布朗共同打造的,在为期20天的赛程中,它们一共进行了12万手牌的比赛,最终Libratus战胜了四位人类顶尖高手。

“这是AI开辟的新疆界,”尚德洪姆在赛后的新闻发布会上说道。“也是AI在游戏比赛中获得的里程碑式突破。”

▲图片来源:卡耐基梅隆大学

Libratus的成功主要在于不断学习,每结束一天的比赛,它都能学到人类牌手的技巧并有所提升。“每天比赛结束后,Libratus内置的原算法就会分析对手的漏洞和技巧,并将其融入到Libratus未来的牌路之中。”尚德洪姆说道。

而Libratus的方式与此前人机扑克大赛的思路有所不同,此前研究人员主要寻找对手的破绽并针对相应破绽进行各个击破。Libratus则正相反,它寻找破绽的目的是要补漏,防止自己也出现同样的破绽。

1月30日傍晚,完成了3万手比赛的Jimmy Chou就曾筋疲力尽地告诉媒体,“这太难了。它(Libratus)不仅不留空子给我钻,而且我真的觉得它在钻我空子”。

在现实生活中或许比AlphaGo更有用

Libratus的胜利是AI逐步统治棋牌类游戏的又一里程碑,1997年时IBM的深蓝电脑在国际象棋比赛中击败世界冠军卡斯帕罗夫,去年AlphaGo则成功在围棋比赛中摘冠,而此前这项运动被认为是直觉的游戏。与深蓝电脑纯靠计算能力有所不同的是,AlphaGo拥有强化学习的能力。

Libratus的胜利还象征着AI的另一个巨大突破,因为德州扑克与围棋预设的挑战不同,它信息缺失的特性是此前AI从未触碰过的。

▲图片来源:视觉中国

杜克大学计算机教授科尼特兹也认为AI击败德州扑克顶级选手是个巨大突破。“扑克是一个有关不完美信息的游戏,它与现实世界的战略决策更加息息相关,而这种特性在商业、政治、安全甚至社交生活中都能发挥直观重要的作用。”

新南威尔士大学AI教授瓦尔斯也同意这一观点。“从某些角度来看,德州扑克的难度甚至要超越国际象棋和围棋,因为它的信息缺失非常严重。你不知道对手拿了什么牌或者即将打出什么牌,这就意味着变数的增多。此外,在扑克比赛中,选手们还会动用心理战虚张声势来影响对手的判断。”

值得注意的一点是,虽然Libratus用的依旧是传统的树形搜索、抽象和游戏战略分析等AI技术,但我们现在并未完全了解Libratus的工作方式。

“AI的进步可不止在深度学习上。”瓦尔斯补充道。

同时,瓦尔斯认为我们不能高兴的太早,因为AI并未彻底统治扑克界,眼下的比赛还是一对一,如果有更多选手加入进来,德州扑克的难度将会成倍增加。想在多人比赛中获胜,AI恐怕还得多历练几年。

此外,Libratus与AlphaGo有相同的毛病,那就是它们只专精于一个领域。因此人类不必担心它们的觉醒,因为除了玩扑克和下围棋,它们什么都不会。

围棋和德州扑克之后,人工智能的下一站会是哪个游戏?不少正在家里搓着麻将的中国网友认为,麻将会是AI无法攻破的堡垒,但果真如此吗?

带着AI去打麻将,就能百战百胜?

在许多人看来,麻将只要手气足够好,不需要技术也能赢。大部分人也常常将自己的胜利或失败,归于手气,也就是运气够不够好。

但运气真的是麻将游戏中的一切吗?一局人类看起来必输的牌,让AI来接管,结果会不会有所不同?

▲图片来源:视觉中国

每经小编(微信号:nbdnews)在此向大家分享一篇深入解读的文章。以下文字摘自微信号“百度大脑”(发布于去年12月8日):

诚然,麻将是一种运气成分占比非常高的竞技棋牌项目,技艺再强的高手,也有输给菜鸟的可能性。但同时不可否认的是,麻将中“技艺高低”也是明显存在的。

麻将技艺的高低,不仅仅存在于高手和菜鸟之间。即使是顶尖高手,日本竞技麻将的高手段位中,在经过大量场数的竞技之后,顶尖选手之间的分数差距,同样可以稳定地被拉开,竞技水平被显著地区分开来。所以在麻将领域,研究出一个具有极高竞技水准的 AI,是完全有可能的。

麻将 AI 的策略是怎样的?

相比于棋类这样在大多理论上可遍历(通过计算机模拟出每一种可能的情况)的“完全信息动态博弈”,棋牌类项目, 因为很多情况下,你都不能知道对方手上的手牌,也不知道接下来会摸到什么牌,所以更多的情况是属于无法遍历的“非完全信息动态博弈”。

也就是说,相比于棋类

AI,力求“将对手逼入必输的岔路口”这个博弈目标不同,麻将 AI

的策略则更多地增加自己得点的期望值,尽量让自己有更大的可能性和大牌,同时尽量避免对手的大牌点炮。而麻将的打牌策略,显然是有最优解的。每圈弃牌的14个选择里,我们总可以找到我们当前认为最好的选择,而高等的选手,和高级的 AI 要做的,就是尽量能多思考几回合。

当代的计算机棋手大多采用的是“蒙特卡洛树”搜索算法,策略是选择或迫使对手选择一个分支,这个分支下的所有的结局都是自己胜。AlphaGo 就是蒙特卡洛算法和深度学习的结合。

让自己有更大的可能性和大牌,就需要通过手牌和弃牌池里的牌,计算自己进张(摸到有效牌)和鸣牌(吃、碰、杠),使自己手牌有进展的概率,进而计算自己和牌得分的期望值。这对于 AI 设计来说实际上是很简单的。

让 AI 避免对手的大牌点炮相对更难,一方面麻将 AI 需要通过大量的牌谱数据库,来获得通过对方打出的弃牌来分析其牌型的能力。这样可以让 AI 拥有在几圈之前,就开始弃掉别家需要的关键牌的能力。

百战百胜的麻将 AI 距离我们有多远?

因为竞技麻将这项运动的小众性,麻将

AI 目前处于一个相当缺乏发展的阶段。目前还没有可以完全战胜所有人类的麻将 AI,但这其中主要的原因是缺乏相关的研究。大多麻将 AI

都还停留在游戏厂商的 AI 上,计算强度非常有限,无法与棋类 AI 动辄就在超级计算机上进行运行相比。

但麻将运动中,可执行的打法数量,实际上是远小于围棋的。因为毕竟手上只有 14 张手牌,一共也只有 136 张的总牌数。所以实际上麻将的复杂度,AI 运行所需要的计算量,实际上也是比 AlphaGO 这样的围棋 AI 要少很多的。

并且麻将有着相对明确的目标,有着相对少的和牌牌面,所以麻将 AI 实际上完全可以储存大量的牌谱,然后在运算的时候,只要寻找对自己有用的牌即可,这样可以减少很多的计算量。

目前最强的麻将 AI,是东京大学开发的日麻 AI —— “爆打”。“爆打”在日本最大的线上麻将平台,天凤上进行了 1.3 万多场比赛,最高达到过七段的成绩,这意味着「爆打」比 96% 以上的麻将玩家都取得了更好的成绩。

▲日麻 AI “爆打”对战两位天凤六段选手和一位八段选手,自摸。

除了麻将之外的其他棋牌 AI

实际上,除了麻将之外,很多中国民间喜闻乐见的棋牌项目,对于开发

AI 来寻找最优解的能力,相比棋类 AI 程序来说,都要简单得多。其面对的问题,同样是因为这些项目中都包含了运气成分,这使验证 AI

的有效性变成了一个相当难的问题。相反,麻将还是这些项目中相对规范化程度非常高的一个,至少在日本,有着非常完善的 ranking(排名)

机制与平台。而因为验证 AI 有效性很麻烦,所以也导致了这类 AI 开发的相对滞后。

而这样的 AI 的作用是什么?除了他们可以用来研究算法本身之外,棋牌 AI 所伴随的棋牌类竞技规范化,也是一个很重要的事情。但同时,我们还可能会看到的是,伴随着棋牌类竞技项目的赌博,可能也会开始依赖于 AI 催生出一个全新的产业。

斗地主、桥牌、德州扑克…… 在未来我们都有希望看到这些项目对应的“最强 AI”,永远能找到最优解的 AI 出现。

很多人都想不通,为什么人类要研究一个仅仅是用来下围棋的

AI,更不必说“打麻将”这件事,如今在中国完全不被当做一个“正经”竞技项目。但他们很难意识到的是,AI

实际上代表了人类对这个世界,孜孜不倦的探求,和挑战自我的精神。用来“打麻将”的

AI,我们创造它的动机,当然不是让我们可以利用其功能,在麻将场上百战百胜。而是我们通过麻将 AI

这件小事,使人类的智慧之光,得以在广袤的世界中延伸,直到洒满每一角落。

这是我们要探究这个世界上一切未知事物的动力,包括却不限于,创造一个永远可以找到最优解的,麻将 AI。

发表回复