中国信通院开展医疗健康大模型效能评估工作

admin 次浏览

摘要:

  北京10月10日电 (记者 刘育英)记者10日从中国信息通信研究院了解到,今年6月来,中国信通院选取多款通用大模型和医疗健康行业大模型开展效能评估工作,结果显示,通用大模型在医学知识广度方面具有一定优势,医疗健康行业大模型在特定医疗任务上表现优异。

  据了解,中国信息通信研究院联合产学研用医各方,共同搭建医疗健康行业大模型标准体系,已形成技术要求、测试方法及成熟度评估三大系列。同时,中国信通院依托系列标准,为多家技术厂商提供医疗健康大模型的能力符合性验证,持续完善评价细则,提升标准实用性和适用性,助力行业大模型规范化、集约化发展。

  2024年6月起,中国信通院选取GPT4、GPT-4O等国外通用大模型,文心一言、通义千问、混元和智谱清言ChatGLM等国内通用大模型,灵医Bot、夸克健康助手、讯飞星火医疗大模型和华佗GPT II等医疗健康行业大模型展开效能评估,考察大模型在多学科知识问答、多形式语言理解、多场景文书生成、多环节辅助诊疗、多轮对话交互、多模态支持等六大方向的实际应用效能。

  结果显示,通用大模型在医学知识广度方面具有一定优势,医疗健康行业大模型在特定医疗任务上表现优异。以讯飞星火医疗大模型为例,其在个人画像、健康干预方案、病历文书生成及质控、检验检查报告解读、体检报告单解读、药盒解读等细分任务中表现均处于领先,在健康常识、疾病百科、用药知识、电子病历结构化、专业知识生活化等方向上均展现高度专业性。

  下一步,中国信通院将继续联合医疗机构、科研院所、技术厂商等各界力量,结合动态效能评价工作经验,持续推进医疗健康行业大模型成熟度系列标准研制,建立针对不同医疗任务的大模型成熟度评价细则,确保标准贴合实际应用需求,促进能力提升和应用落地。(完)

随机内容
版权声明 1、本网站名称:青白江咚波电子商务网
2、本站永久网址:http://www.zcxhd.com
3、本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。
4、本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报

-->