Skip to content

Latest commit

 

History

History
20 lines (15 loc) · 1.98 KB

2401.06201.md

File metadata and controls

20 lines (15 loc) · 1.98 KB

背景

  • 背景
    文章介绍了LLM(大型语言模型)-基础的代理在使用工具时面临的挑战,包括工具文档中的不一致性、冗余性和不完整性问题。由于从不同来源收集的大量工具有非一致的文档格式,这给LLM理解工具带来了新挑战。工具文档还可能包含大量冗余且无用的信息,使得获得工具功能变得更加困难。

  • 已有的工作为什么解决不了 现有的方法例如直接使用语言模型(LLM)作为控制器并以工具描述为提示来指导LLM理解和调用工具,受到上下文大小和工具文档质量的限制,可能导致一些失败或不正确的工具调用。此外,过去的一些方法试图通过构建合成数据集并对LLM进行微调以调用工具,但这种策略并不适用于一些功能强大的、封闭的LLM,且无法扩展到新工具。

核心贡献

  • 提出了一个名为EASYTOOL的方法
    • 挑战1:不一致性 将不同来源的工具文档转换为简洁统一的工具指令,这些指令包括标准的工具描述和工具功能指南,以消除无关内容并仅保留每个工具的核心功能。

    • 挑战2:冗余性与不完整性 EASYTOOL提供了工具使用的详细信息,例如参数及其演示,这些是由ChatGPT生成的,用于指导LLM使用工具,这样可以显著减少不正确的工具使用情况,并提升使用效率。

实现与部署

在三个不同领域的数据集上进行的广泛实验表明,EASYTOOL能够有效并高效地改善LLM在工具使用方面的能力。即使没有工具文档,这种方法也可以推广到开源LLM,并以即插即用的方式提升它们在工具使用方面的性能。

总结

本文提出了一种名为EASYTOOL的方法,可以通过简化和统一工具文档的指令来提高LLM基础代理在工具使用方面的表现,解决了现有工具使用中的不一致性、冗余性和不完整性问题。