基于fastchat部署，推理异常 #46

ruifengma · 2023-12-01T02:13:37Z

用fastchat部署AgentLM-13B，推理的时候格式是乱的，尤其是streaming的模式，每行只有几个字符就切换到下一行了，一个单词被切成了好几个字母或字母组合。如果手动用transformer加载并用gradio展示的话就没有这个问题，用fastchat的debug模式看了一下，用的是LlamaForCausalLM加载的模型，应该没错

Btlmd · 2023-12-18T10:51:42Z

我们之前没有在 FastChat 上进行过推理实验。能否给出更详细的报错、不符合预期的场景或者配置？

heimy2000 · 2024-01-25T06:58:05Z

用fastchat部署AgentLM-13B，推理的时候格式是乱的，尤其是streaming的模式，每行只有几个字符就切换到下一行了，一个单词被切成了好几个字母或字母组合。如果手动用transformer加载并用gradio展示的话就没有这个问题，用fastchat的debug模式看了一下，用的是LlamaForCausalLM加载的模型，应该没错

老师，请问您是怎么操作的呢

ruifengma · 2024-02-01T03:17:54Z

hi @Btlmd @heimy2000 , 其实就是简单的使用 fastchat.serve.cli 来加载模型进行基础对话，其实没有报错，只是输出的chunk就很奇怪并且不成句，其实你们可以试试看，操作很简单
python3 -m fastchat.serve.cli --model-path AgentTuning/AgentLM
--model-path后面就是加的实际存储的AgentLM权重

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

基于fastchat部署，推理异常 #46

基于fastchat部署，推理异常 #46

ruifengma commented Dec 1, 2023

Btlmd commented Dec 18, 2023

heimy2000 commented Jan 25, 2024

ruifengma commented Feb 1, 2024

基于fastchat部署，推理异常 #46

基于fastchat部署，推理异常 #46

Comments

ruifengma commented Dec 1, 2023

Btlmd commented Dec 18, 2023

heimy2000 commented Jan 25, 2024

ruifengma commented Feb 1, 2024