4月14日,为期四天的第89届中国国际医疗器械博览会(CMEF)盛大收官。澳鹏Appen很荣幸再次作为唯一的人工智能训练数据参展商参与此次“航母级”规模医疗产业盛会,展示如何以专业、精准、安全的高质量训练数据赋能AI医疗,助力提升医疗大模型算法精度,让公众享受更精准、更智能、更高品质的智慧医疗服务。
澳鹏Appen再次作为唯一的人工智能训练数据参展商参与此次“航母级”规模医疗产业盛会
在医疗领域,大模型的智慧生态正在逐步建立。由于学科门槛和专业要求的限制,医疗大数据平台模型往往具有高要求的数据训练标准。对专业和理论化的内容进行整理、审核、分类、排序,获得大规模、高质量的数据集,需要一定数量具备专业医学知识背景的从医人员完成。
在国内,拥有专业医学管理团队和具规模的专业医学标注人员的公司非常少。零散的训练量始终达不到模型训练所需的数据要求。澳鹏Appen医疗团队充分利用自身的专业知识和及时的权威资料学习更新,为医疗大模型部署提供了高效、大规模的数据训练养料。
澳鹏Appen拥有一支专业的医学标注团队,由具有执业医师资格、医学项目经验丰富的医学项目管理者组成;拥有多学科、近百位三甲级医院主治及以上职称医师作为专家顾问,近百人医学专业多学科的全职质检团队,以及近千人的医学资源池;涵盖700w+医学文本数据,8w+医学图像数据,以及中英等多语种医学数据。
澳鹏Appen医疗团队提供专业知识、资源和创新型解决方案。针对医学大模型训练,澳鹏Appen提供专业的医学审核、改写、排序、打分;并转换成自然语言。保障多医疗场景(医患问答、执业考试等)下的专业严谨性和医学逻辑性。
同时,澳鹏团队基于开源通用大语言模型,利用指令精调/指令微调(P-Tuning v2)技术,训练开发了澳鹏版本的中文医疗大模型。澳鹏医疗大模型在保留基座模型通用知识能力的基础上,在医疗垂直领域进行优化加强,覆盖医疗咨询、医学问答、导诊、预问诊、检查建议、用药建议等常见实用的医疗场景。
除了医学大模型数据训练,澳鹏还提供医学影像学(放射)图像标注服务。例如,在AI预测的基础上,进行肺部CT数据的医学后处理,纠正标签判断错误,增加未检出病灶,提高数据的病灶检出率并降低假阳率;对于MRA头部血管数据,在AI预测的脑动脉、静脉、微小血管基础上修改AI识别的错误,要求分割精度不低于2个马赛克位点等等。
在临床医学、病理学和心电图图像方面,澳鹏同样能够提供高质量的标注服务。例如,对胃镜图像中的病灶选择对应标签并沿边缘进行分割,保证图像内病灶标注的完整和精准;对胃部组织进行拉框选择ROI,并针对ROI内目标细胞(如慢性胃炎)进行精准的标注;在AI预测的基础上,进行心电图数据的医学后处理,纠正AI预测的错误,添加AI未检出异常等等。
对于医学内容审核和编辑,澳鹏团队针对医学文本、图像、视频等形式中的内容,根据相关规则进行专业审核,纠正文中的医学科学性、医学逻辑、医学名词不准确等错误;同样地,团队能够对医学文本的内容根据相关规则进行专业的编辑,对文中的相关名词做出专业的解释、分类、打标签等。
澳鹏智慧医疗数据是经HIPAA认证的高安全性解决方案,安全设备、现场服务、安全众包模型和技术解决方案亦获得ISO 27001,ISO 9001和ISO 27701认证,确保智能时代医疗数据的合法、合规、安全。未来,澳鹏Appen将持续以高质量训练数据赋能AI提高诊断和治疗的效率、帮助改善医疗从业者的体验,为更多病人提供更快、更好的服务,助力智慧医疗新生态建立。