微软团队采用一种分解式的技术

微软团队采用一种分解式的技术微软团队采用了一种“分解式”的技术,使AI系统可以玩Atari 2600版本的这款游戏。这种方法将游戏所需的策略和技巧分解成为独立的元素。

AI的不同部分专注于其中每个元素,而更高层次的AI会做出总体决策,判断优先执行什么操作。例如,某些AI可能会追踪豆子,而另一些则专注于躲避敌人。负责最终决策的AI将基于加权逻辑去进行决策。如果100个AI希望向左侧移动去吃掉一个豆子。

而只有3个想要向右移动躲避敌人,那么最终的决策将是向右移动,以避免撞上敌人。据悉,娱乐平台团队是2017年1月收购的加拿大深度学习创业公司Maluuba。Maluuba利用了强化学习技术,即对于特定问题,AI将获得正面或负面反馈,从而应对不可预测性。

强化学习被认为可以帮助系统自主做出决策。这与受监督学习不同,即系统获得正面和负面案例数据,从而建立经验基础。