基于大型语言模型的具身智能体的动作空间对齐方法、系统与流程
技术特征:
1.基于大型语言模型的具身智能体的动作空间对齐方法,其特征在于:包括内部对齐与外部对齐;
2.根据权利要求1所述的基于大型语言模型的具身智能体的动作空间对齐方法,其特征在于:所述内部对齐中,通过参数高效微调方法用于促进智能体的高效模型自适应具体包括:
3.根据权利要求1所述的基于大型语言模型的具身智能体的动作空间对齐方法,其特征在于:所述外部对齐中,通过基于检索生成的方法来确保智能体输出的动作是与安全有效的动作集是相对齐的具体包括:
4.根据权利要求1或3任一项所述的基于大型语言模型的具身智能体的动作空间对齐方法,其特征在于:在获取到获选动作集c后,引入策略模型πp来选择最佳动作;利用大型语言模型的in-context learning,即icl能力进行动作空间对齐;icl的引入旨在通过修改模型的输入查询来增强模型在新任务上的性能,而不是直接更新模型权重;将当前检索到的有效动作集c作为外部输入,允许llm获取执行上下文之外的物理世界的信息,从而锚定llm对检索到的动作的响应,降低幻觉现象的可能性;最终的动作表示为:
5.基于大型语言模型的具身智能体的动作空间对齐系统,其特征在于,包括用于执行如权利要求1-4任一权利要求所述的方法的模块。
6.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1-4中任意一项所述的基于大型语言模型的具身智能体的动作空间对齐方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1-4中任意一项所述的基于大型语言模型的具身智能体的动作空间对齐方法。
技术总结
本发明涉及基于大型语言模型的具身智能体的动作空间对齐方法、系统,属于推理和规划技术领域。本发明包括内部对齐与外部对齐;所述内部对齐中,通过参数高效微调方法用于促进智能体的高效模型自适应;所述外部对齐中,通过基于检索生成的方法来确保智能体输出的动作是与安全有效的动作集是相对齐的。本发明不仅保证了智能体生成动作的有效性,而且增强了模型的整体性能,证明了其有效性;此外,本发明的方法需要更低的计算资源;还提高了模型输出的可控性和可解释性;内外对齐方法为缓解基于llm的具身体的动作幻觉提供了有效的解决方案。
技术研发人员:李堪学,齐冲冲,詹忆冰,林旭,杨辉,李仙荣
受保护的技术使用者:云南联合视觉科技有限公司
技术研发日:
技术公布日:2024/11/26
文档序号 :
【 40126200 】
技术研发人员:李堪学,齐冲冲,詹忆冰,林旭,杨辉,李仙荣
技术所有人:云南联合视觉科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:李堪学,齐冲冲,詹忆冰,林旭,杨辉,李仙荣
技术所有人:云南联合视觉科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
