首页 > 正文

中国信通院医疗健康大模型效能评估结果出炉 讯飞星火医疗大模型四大能力排名第一

日期: 2024-10-17 来源: 紫荆
字号:

扫描二维码分享到手机

编辑:孙艺宁 校对:李天源 监制:连振海
编辑:孙艺宁 校对:李天源 监制:连振海
中国信通院医疗健康大模型效能评估结果出炉 讯飞星火医疗大模型四大能力排名第一
近期,中国信通院对包括GPT-4Turbo、GPT-4O等国际通用大模型,文心一言、通义千问、混元和智谱清言ChatGLM等国内通用大模型,以及灵医Bot、夸克健康助手、讯飞星火医疗大模型和华佗GPT II等医疗健康行业大模型进行了效能评估。通过构建测试数据集、开展符合性验证和模拟实际应用场景,邀请医疗健康、人工智能领域十余位专家形成评估小组,对参测大模型的多轮问询结果进行准确性、完整性、流畅性、可解释性等维度的综合评分,考察大模型在多学科知识问答、多形式语言理解、多场景文书生成、多环节辅助诊疗、多轮对话交互、多模态支持等六大方向的实际应用效能。
紫荆杂志
影响有影响力的人