Skip to content

Latest commit

 

History

History
81 lines (79 loc) · 2.77 KB

mrc.md

File metadata and controls

81 lines (79 loc) · 2.77 KB
类别 大模型 阅读理解能力 排名
商用 百度ERNIE-3.5-8K 98.0 1
商用 gpt-4o 98.0 2
商用 豆包Doubao-pro-32k 96.7 3
开源 Llama-3-70B-Instruct 96.0 4
开源 qwen2.5-32b-instruct 96.0 5
商用 讯飞4.0Ultra 96.0 6
商用 百度ERNIE-4.0-Turbo 96.0 7
商用 yi-lightning(new) 95.3 8
商用 GLM-4-Plus(new) 95.3 9
商用 Baichuan3-Turbo 94.7 10
开源 Qwen2-72B-Instruct 94.7 11
商用 百度ERNIE-4.0 94.7 12
商用 阿里qwen-max 94.7 13
开源 deepseek-chat-v2 94.0 14
商用 gpt-4-turbo 94.0 15
开源 qwen2.5-14b-instruct 94.0 16
商用 Baichuan4 93.3 17
开源 qwen2.5-7b-instruct 93.3 18
商用 gemini-1.5-pro(new) 93.3 19
商用 gemini-1.0-pro(new) 92.7 20
商用 gemini-1.5-flash(new) 92.7 21
商用 gpt-3.5-turbo 92.7 22
商用 智谱GLM-4-Air 92.7 23
商用 智谱GLM-4-AirX 92.7 24
开源 Qwen1.5-32B-Chat 92.7 25
开源 Llama-3.1-70B-Instruct 92.0 26
开源 qwen2.5-72b-instruct 92.0 27
开源 Qwen1.5-14B-Chat 90.7 28
商用 阿里qwen-plus 90.0 29
商用 智谱GLM4 90.0 30
商用 yi-large 90.0 31
开源 glm-4-9b-chat 90.0 32
商用 阿里qwen-long 90.0 33
开源 internlm2_5-7b-chat 90.0 34
开源 qwen2-57b-a14b-instruct 89.3 35
商用 讯飞星火v3.5(spark-max) 89.3 36
商用 GLM-4-Long(new) 89.3 37
商用 gpt-4o-mini 89.3 38
商用 minimax-abab6.5-chat 89.3 39
商用 yi-medium 89.3 40
商用 minimax-abab6.5s-chat 88.7 41
商用 yi-large-turbo 88.7 42
商用 豆包Doubao-lite-32k 88.7 43
开源 gemma-2-9b-it 88.7 44
商用 讯飞星火v3(spark-pro) 88.0 45
开源 Qwen1.5-72B-Chat 88.0 46
商用 qwen-turbo 88.0 47
商用 yi-spark 88.0 48
商用 商汤SenseChat-v4 88.0 49
商用 百度ERNIE-Speed-8K 88.0 50
开源 Qwen2-7B-Instruct 86.7 51
商用 minimax-abab5.5-chat 86.7 52
开源 internlm2_5-20b-chat 86.0 53
商用 智谱GLM-4-Flash 86.0 54
开源 internlm2-chat-20b 86.0 55
开源 Yi-1.5-9B-Chat 84.7 56
商用 月之暗面moonshot-v1-8k 84.0 57
开源 Yi-1.5-34B-Chat 82.7 58
开源 Llama-3.1-8B-Instruct 82.0 59
开源 openbuddy-llama3-8b 81.3 60
开源 DeepSeek-V2-Lite-Chat 81.3 61
开源 Llama-3-8B-Instruct 80.0 62
开源 Qwen1.5-4B-Chat 79.3 63
开源 qwen2.5-3b-instruct 78.7 64
商用 商汤SenseChat-Turbo 76.7 65
开源 Qwen1.5-7B-Chat 76.0 66
开源 MiniCPM-2B-dpo 74.0 67
开源 internlm2-chat-7b 72.7 68
开源 qwen2.5-1.5b-instruct 72.7 69
商用 minimax-abab5.5s-chat 70.7 70
开源 qwen2-1.5b-instruct 68.0 71
开源 Phi-3-mini-128k-instruct 65.3 72
开源 qwen2.5-0.5b-instruct 63.3 73
开源 internlm2-chat-1_8b 63.3 74
开源 qwen2-0.5b-instruct 62.0 75
开源 Qwen1.5-0.5B-Chat 60.0 76
开源 Qwen1.5-1.8B-Chat 52.7 77