人机扑克大战,人类又败给了“EQ极强”机器2017年4月10日,“冻捉大师VS中国龙之队——人机扑克巅峰表演赛”经过五天赛事,冻捉大师最后以792327总记分牌的战绩获得胜利,此次表演赛的200万元奖励归属于冻捉大师。稍有点理解德州扑克的人都告诉,它某种程度是逻辑的比赛,还是一场心理战,人类的“阴险”在此充分发挥得淋漓尽致。
没想到,比赛期间经常被“诈唬”得一愣一愣的,反是冠军级真人牌手。AI兴起!人类的最后一道防线究竟在哪里?李开复也曾回应过,十年后世界上50%的工作都会被人工智能所代替,特别是在是翻译成、记者、助理、保安、司机、销售、客服、交易员、会计学、保姆等工作,正在专门从事涉及工作的你,发抖了吗?人类输掉眼里的AI赌神:有读心术由著名投资人、创新工场董事长李开复发动的这场德州扑克“人机大战”,人类方由六位华人顶尖扑克运动员重新组建,队长杜悦曾在世界德州扑克大赛WSOP的无限录德州扑克赛事中取得冠军,AI方背后是美国卡内基梅隆大学托马斯·桑德霍姆教授研发的玩无限德州扑克的人工智能程序Libratus,李开复给它所取了个中文名字“冻捉大师”。在德捉这件事上,冻捉大师没师父。
研究人员只告诉他它基本的德州扑克规则,然后让它开始以自我对局的“左右互搏”方式自学这个扑克游戏。在投放空战之前,冻捉大师自己对战了几百万手牌,但并没研究过人类如何打德州扑克,也没和人类职业玩家有过交手。所以,这位AI赌神构成了一种与人类截然不同的牌风,或者说是“不按牌理ATENU”。比方说,德捉顶级高手一般来说不会主动尝试找寻输掉的弱点,并进行反击,而冻捉大师是仔细观察人类找到了它什么弱点,然后有针对性地填补和提高。
诈唬(bluff)也不是人教的,而是机器自己学会的。研究人员说道:“诈唬是尤其最重要的技能,系统在自学中找到,如果有一手烂牌,必要诈唬能输掉更加多,所以它就学会了。
”和冻捉大师对战过的人类输掉回应感觉深达。中国龙之队队长杜悦在谈及五天的比赛回忆时回应:“人工智能在对战时会受到情感、心理、体力等因素影响,且强劲运算能力近超强人类大脑,被迫否认冻捉大师很多手牌一拳令人拍案叫绝。”龙之队成员许朝军也讲出了类似于感觉:“AI有读心术”。
冻捉大师与阿尔法狗谁更加得意?棋士和德捉代表了两类几乎有所不同的游戏,阿尔法狗和冻捉大师也在朝几乎有所不同的两个方向探寻。专家说明说道,计算机程序攻下这些棋类游戏的方法在本质上是一样的:搜寻。下每一步棋都是一个决策点,而计算机所做到的,就是在每一个决策点上搜寻胜率仅次于的那条路径。
黑白棋的搜寻量只有10的十几次方,国际象棋是10的四十几次方,而棋士的搜寻量超过了难以置信的10的170次方。一盘德捉的决策点数量是10的160次方,要多于棋士,但光靠搜寻是打没法德捉的。桑德海姆由此跑出了在搜寻量上的对决,对AI明确提出了另一个方向上的考验:应付隐蔽的信息。
冻捉大师的另一主要研究人员诺里·布朗在评论这两大AI时回应,棋士在“极致信息游戏”中归属于高难度水平,因而阿尔法狗也在搜寻这个核心问题上获得了巅峰成就。而冻捉大师刚关上了“非极致信息游戏”的大门,对于解决问题隐蔽信息这个问题来说,德捉AI只是个开始。
本文来源:万博app|官方网站IOS/安卓通用版/手机APP,官网-www.wingcoo.com