每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
Meta AI最近推出的新模型,Searchformer,成功地将强大的Transformer模型和传统的规划方法桥接了起来。虽然Transformer在通用任务上表现出色,但传统的规划方法在复杂决策制定中提供了结构化的优势。通过在模拟数据上训练,并进一步通过专家输入进行精炼,Searchformer学会了模仿高效的搜索策略。这使得它能够在比传统方法更少的步骤中找到最优解,展示了在解决复杂谜题上27%的效率提升。这一突破为AI系统在更高效、更准确地导航复杂决策制定过程中铺平了道路。
此项工作展示了如何训练Transformer来解决复杂的规划任务,并介绍了Searchformer,这是一种Transformer模型,能够在93.7%的情况下优化解决以前未见过的推箱子(Sokoban)谜题,同时使用的搜索步骤比标准A搜索少达26.8%。Searchformer是一个经过训练,用以预测A搜索动态的编码器-解码器Transformer模型。然后,通过专家迭代对这个模型进行微调,以执行比A搜索更少的搜索步骤,同时仍然生成最优计划。在训练方法中,A的搜索动态被表达为一个代币序列,概述了在符号规划期间任务状态何时被添加到搜索树中并移除。
在对迷宫导航进行的消融研究中,发现Searchformer显著优于直接预测最优计划的基线,其模型大小小5-10倍,训练数据集小10倍。我们还展示了Searchformer如何扩展到更大、更复杂的决策任务如推箱子,其解决任务的百分比和缩短的搜索动态有所改进。