当前位置: 首页 > 资讯 > >正文

清华大学发布《大语言模型综合性能评估报告》 :GPT-4 第一,文心一言更懂中文

来源:品玩    时间:2023-08-10 14:13:42

X 关闭


(资料图片)

品玩 8 月 10 日讯,近日,清华大学新闻与传播学院教授、博士生导师沈阳所在团队发布了《大语言模型综合性能评估报告》(下文简称 " 报告 "),报告显示总得分率 GPT-4 第一,百度文心一言在三大维度 20 项指标中综合评分国内第一,超越 ChatGPT,其中中文语义理解排名第一,部分中文能力超越 GPT-4。

报告本次评估选取了 GPT-4、ChatGPT 3.5、文心一言、通义千问、讯飞星火、Claude、天工 7 个大语言模型,围绕生成质量、使用与性能、安全与合规三大维度,全面考察大语言模型上下文理解、中文语义理解、误导信息识别、逻辑推理、内容安全性、隐私保护等 20 项指标。综合来看,文心一言语义理解能力突出,特别是具备更好的中文理解能力,更懂中国文化,同时时效性强、内容安全把握细微,这源于其知识增强、检索增强和对话增强的技术创新。

X 关闭

推荐内容

最近更新

Copyright ©  2015-2022 南非机械网版权所有  备案号:沪ICP备2022005074号-13   联系邮箱:58 55 97 3@qq.com