因此,虽然一对一无限注德扑游戏中包含10的160次方个决策点,要少于围棋,但它对人工智能的推理能力提出了更高的要求。在过去,研究人员往往采用一种压缩型的策略来开发算法,即通过把原始版本游戏中的设计和行为转移到一个被压缩了的情境下推理。但在压缩的过程中,信息会出现丢失,造成此前人工智能从未在扑克领域击败人类玩家。而这个加拿大和捷克的合作团队开发的新算法DeepStack,则注重培养人工智能出牌时的“直觉”。在运用深度学习,反复自我博弈之后,DeepStack学会了在每一个具体情境出现时进行推理。这非常接近人类玩家的“牌感”,即在当前情境下对个人牌面大小的感觉,并作出相应的决策。该团队邀请了来自17个国家的33名专业扑克选手挑战DeepStack,在2016年11月7日到12月12日之间共进行了44852次较量。DeepStack成为了首个在一对一无限注德扑中战胜人类玩家的人工智能,并且平均胜率达到了492mbb/g(milli-big-blinds per game,一般职业玩家认为50mbb/g是个门槛)。
智能界(www.znjchina.com)中国智能科技聚合推荐平台,秉承“引领未来智能生活”的理念,专注报道智能家居、可穿戴设备、智能医疗、机器人、3D打印、智能汽车、VR/AR/MR/、人工智能等诸多科技前沿领域。关注智能创新对人的生活方式、价值的改变,致力传播放大这部分声量。聚合品牌宣传、代理招商、产品评测、原创视频、fm电台与试用众测,深入智能科技行业,全平台多维度为用户及厂商提供服务,致力成为中国最具影响力的智能科技聚合推荐平台。智能界【微信公众号ID:znjchina】【新浪/腾讯微博:@智能界】