百川智能披露Baichuan3评测结果知识百科能力超越GPT-4-Turbo

最后编辑时间:2024-05-07 19:43:57 来源:未知 作者:未知 阅读量: 未知

  新浪科技讯 4月30日下午消息,百川智能今日披露了一份由国内大模型评测机构SuperCLUE发布的评测报告,结果显示,在报告选取的国内外具有代表性的32个大模型4月份的版本中,通过多维度综合性测评,Baichuan 3在国内大模型中排名第一,在知识百科能力上Baichuan 3以82分的成绩超越了GPT-4-Turbo,位列第一。

  SuperCLUE是国内知名通用大模型综合性测评基准,其前身是第三方中文语言理解测评基准CLUE(The Chinese Language Understanding Evaluation)。据介绍,为更真实反映大模型通用能力,SuperCLUE本次测评由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等,题目为多轮开放式简答题,评测集共2194题。

(责任编辑:管理)