当前位置:首页 >新闻详情

{$itemInfo['publish_time']|date='Y-m-d H:i:s',_ _ _优发国际由全球娱乐业界精英组成的金牌团队,以超专业的服务素质.优发国际手机版网上娱乐最权威的真人娱乐:世界杯、欧洲杯、欧冠杯、波胆,滚球.优发国际官网是全球最著名、运营最成功的线上数字娱乐巨头之一!}##} 来源:优发国际-优发国际手机版-优发国际官网 浏览次数 6

  2月22日,DeepMind发布最新研究:证明了在足球环境下,一种基于分布式代理的连续控制培训框架,结合奖励渠道的自动优化,可以实现多智能体端到端的学习。简言之,DeepMind设置了环境,让多个AI一起踢足球赛,并且提前设置了规则,奖励整只“足球队”而不去鼓励某个"AI球员”的个人成绩,以促成整个球队的进步。这证明AI可相互合作。

  据悉,DeepMind在github上发布了他们使用的MuJoCo Soccer环境,这是一个竞争协作多智能体交互的开源研究平台,在机器学习社区已经得到了相当广泛的使用。