Hugging Face的CEO宣布了全新的开放LLM排行榜。
他们使用了300个H100 GPU来重新评估所有主要的开源LLM。
本次评估引入了新的基准,包括MMLU-Pro、GPQA、MuSR、MATH、IFEval和BBH,并使用标准分数改进排名系统。
最新排名显示:阿里的通义千问Qwen2 72B Instruct霸榜第一,Meta的Llama 3 70B Instruct紧随其后,之后居然又是阿里!
难怪抱抱脸CEO连连感叹——
开源领域,中国大模型全面占据主导地位了。
Hugging Face的CEO宣布了全新的开放LLM排行榜。
他们使用了300个H100 GPU来重新评估所有主要的开源LLM。
本次评估引入了新的基准,包括MMLU-Pro、GPQA、MuSR、MATH、IFEval和BBH,并使用标准分数改进排名系统。
最新排名显示:阿里的通义千问Qwen2 72B Instruct霸榜第一,Meta的Llama 3 70B Instruct紧随其后,之后居然又是阿里!
难怪抱抱脸CEO连连感叹——
开源领域,中国大模型全面占据主导地位了。