类别 | 大模型 | 阅读理解能力 | 排名 |
---|---|---|---|
商用 | 百度ERNIE-3.5-8K | 98.0 | 1 |
商用 | gpt-4o | 98.0 | 2 |
商用 | 豆包Doubao-pro-32k | 96.7 | 3 |
开源 | Llama-3-70B-Instruct | 96.0 | 4 |
开源 | qwen2.5-32b-instruct | 96.0 | 5 |
商用 | 讯飞4.0Ultra | 96.0 | 6 |
商用 | 百度ERNIE-4.0-Turbo | 96.0 | 7 |
商用 | yi-lightning(new) | 95.3 | 8 |
商用 | GLM-4-Plus(new) | 95.3 | 9 |
商用 | Baichuan3-Turbo | 94.7 | 10 |
开源 | Qwen2-72B-Instruct | 94.7 | 11 |
商用 | 百度ERNIE-4.0 | 94.7 | 12 |
商用 | 阿里qwen-max | 94.7 | 13 |
开源 | deepseek-chat-v2 | 94.0 | 14 |
商用 | gpt-4-turbo | 94.0 | 15 |
开源 | qwen2.5-14b-instruct | 94.0 | 16 |
商用 | Baichuan4 | 93.3 | 17 |
开源 | qwen2.5-7b-instruct | 93.3 | 18 |
商用 | gemini-1.5-pro(new) | 93.3 | 19 |
商用 | gemini-1.0-pro(new) | 92.7 | 20 |
商用 | gemini-1.5-flash(new) | 92.7 | 21 |
商用 | gpt-3.5-turbo | 92.7 | 22 |
商用 | 智谱GLM-4-Air | 92.7 | 23 |
商用 | 智谱GLM-4-AirX | 92.7 | 24 |
开源 | Qwen1.5-32B-Chat | 92.7 | 25 |
开源 | Llama-3.1-70B-Instruct | 92.0 | 26 |
开源 | qwen2.5-72b-instruct | 92.0 | 27 |
开源 | Qwen1.5-14B-Chat | 90.7 | 28 |
商用 | 阿里qwen-plus | 90.0 | 29 |
商用 | 智谱GLM4 | 90.0 | 30 |
商用 | yi-large | 90.0 | 31 |
开源 | glm-4-9b-chat | 90.0 | 32 |
商用 | 阿里qwen-long | 90.0 | 33 |
开源 | internlm2_5-7b-chat | 90.0 | 34 |
开源 | qwen2-57b-a14b-instruct | 89.3 | 35 |
商用 | 讯飞星火v3.5(spark-max) | 89.3 | 36 |
商用 | GLM-4-Long(new) | 89.3 | 37 |
商用 | gpt-4o-mini | 89.3 | 38 |
商用 | minimax-abab6.5-chat | 89.3 | 39 |
商用 | yi-medium | 89.3 | 40 |
商用 | minimax-abab6.5s-chat | 88.7 | 41 |
商用 | yi-large-turbo | 88.7 | 42 |
商用 | 豆包Doubao-lite-32k | 88.7 | 43 |
开源 | gemma-2-9b-it | 88.7 | 44 |
商用 | 讯飞星火v3(spark-pro) | 88.0 | 45 |
开源 | Qwen1.5-72B-Chat | 88.0 | 46 |
商用 | qwen-turbo | 88.0 | 47 |
商用 | yi-spark | 88.0 | 48 |
商用 | 商汤SenseChat-v4 | 88.0 | 49 |
商用 | 百度ERNIE-Speed-8K | 88.0 | 50 |
开源 | Qwen2-7B-Instruct | 86.7 | 51 |
商用 | minimax-abab5.5-chat | 86.7 | 52 |
开源 | internlm2_5-20b-chat | 86.0 | 53 |
商用 | 智谱GLM-4-Flash | 86.0 | 54 |
开源 | internlm2-chat-20b | 86.0 | 55 |
开源 | Yi-1.5-9B-Chat | 84.7 | 56 |
商用 | 月之暗面moonshot-v1-8k | 84.0 | 57 |
开源 | Yi-1.5-34B-Chat | 82.7 | 58 |
开源 | Llama-3.1-8B-Instruct | 82.0 | 59 |
开源 | openbuddy-llama3-8b | 81.3 | 60 |
开源 | DeepSeek-V2-Lite-Chat | 81.3 | 61 |
开源 | Llama-3-8B-Instruct | 80.0 | 62 |
开源 | Qwen1.5-4B-Chat | 79.3 | 63 |
开源 | qwen2.5-3b-instruct | 78.7 | 64 |
商用 | 商汤SenseChat-Turbo | 76.7 | 65 |
开源 | Qwen1.5-7B-Chat | 76.0 | 66 |
开源 | MiniCPM-2B-dpo | 74.0 | 67 |
开源 | internlm2-chat-7b | 72.7 | 68 |
开源 | qwen2.5-1.5b-instruct | 72.7 | 69 |
商用 | minimax-abab5.5s-chat | 70.7 | 70 |
开源 | qwen2-1.5b-instruct | 68.0 | 71 |
开源 | Phi-3-mini-128k-instruct | 65.3 | 72 |
开源 | qwen2.5-0.5b-instruct | 63.3 | 73 |
开源 | internlm2-chat-1_8b | 63.3 | 74 |
开源 | qwen2-0.5b-instruct | 62.0 | 75 |
开源 | Qwen1.5-0.5B-Chat | 60.0 | 76 |
开源 | Qwen1.5-1.8B-Chat | 52.7 | 77 |