llm-paper-daily/summary/2024-01/2401.06201.md at main · xianshang33/llm-paper-daily · GitHub

背景

背景
文章介绍了LLM(大型语言模型)-基础的代理在使用工具时面临的挑战，包括工具文档中的不一致性、冗余性和不完整性问题。由于从不同来源收集的大量工具有非一致的文档格式，这给LLM理解工具带来了新挑战。工具文档还可能包含大量冗余且无用的信息，使得获得工具功能变得更加困难。
已有的工作为什么解决不了 现有的方法例如直接使用语言模型（LLM）作为控制器并以工具描述为提示来指导LLM理解和调用工具，受到上下文大小和工具文档质量的限制，可能导致一些失败或不正确的工具调用。此外，过去的一些方法试图通过构建合成数据集并对LLM进行微调以调用工具，但这种策略并不适用于一些功能强大的、封闭的LLM，且无法扩展到新工具。

核心贡献

提出了一个名为EASYTOOL的方法
- 挑战1：不一致性 将不同来源的工具文档转换为简洁统一的工具指令，这些指令包括标准的工具描述和工具功能指南，以消除无关内容并仅保留每个工具的核心功能。
- 挑战2：冗余性与不完整性 EASYTOOL提供了工具使用的详细信息，例如参数及其演示，这些是由ChatGPT生成的，用于指导LLM使用工具，这样可以显著减少不正确的工具使用情况，并提升使用效率。

实现与部署

在三个不同领域的数据集上进行的广泛实验表明，EASYTOOL能够有效并高效地改善LLM在工具使用方面的能力。即使没有工具文档，这种方法也可以推广到开源LLM，并以即插即用的方式提升它们在工具使用方面的性能。

总结

本文提出了一种名为EASYTOOL的方法，可以通过简化和统一工具文档的指令来提高LLM基础代理在工具使用方面的表现，解决了现有工具使用中的不一致性、冗余性和不完整性问题。