拿下世界第一的赛飞平台到底有多牛?平安创新科技来解答
- 时间:
- 浏览:0
- 来源:5分快乐8官网_五分快乐8APP_5分快乐8APP下载
在平安中国智慧医疗这支队伍里,有一群很隐没的人。平安中国智慧医疗AI算法平台部负责人高鹏博士把当事人和团队拈连为AI后勤部队,但准确来说,亲们 更像 “铸剑师”。
医疗AI “铸剑师”
据全球最大的文献摘要与科研信息引用数据库Scopus显示,自2017年以来,AI领域年发表论文数量增长率超过50%。也要是说,约20分钟就会有一篇AI领域论文发表。
除了新技术层出不穷外,论文复现难,以及需用趟各种“坑”的沉没成本,令前线战友们在面临产品节点压力下,无不要 精力与新技术“纠缠”。“因此,亲们 AI算法平台部的职责要是把学术界最前沿的AI研究成果消化吸收改进,铸成简单易用又强大算法工具,插进平台上提供给前线部队。”
高鹏的战术是根据医疗AI模型研趋于稳定命周期中的五个关键环节——标注、训练、泛化、部署——入手,打造各种“AI之剑”。
在数据标注阶段,机会高度学习是并算不算数据驱动的技术,需用絮状标注样本。然而样本标注需用耗费絮状人力和资金成本;更重要的是,医学样本还需用专业的医学知识。
针对并算不算 痛点,高鹏为队友们提供了基于主动学习(Active Learning)的智能样本标准工具。经过国家肾脏疾病临床医学研究中心病理分析项目的验证,需用减少医生约48%的标准工作量。
在模型训练阶段,训练样本的不均衡问题图片也是一大痛点。多数项目中,正常样本要是,但罕见的病灶、特殊样本非常稀缺,严重影响了模型的精度。就像精于技艺的匠师,高鹏总能研发出最新的武器来反制对手。基于对抗生成网络(GAN, Generative Adversarial Networks)的样本增广工具,高鹏为队友们创造创造发明第二把锋利的“剑”:
相似于谷歌AlphaGo左右互博的原理,针对特定需求算法需用生成以假乱真的样本。平安中国智慧医疗全球首款智能OCT眼底疾病筛查系统就用到了这项技术。在由复旦大学附属眼耳鼻喉科医院牵头,上海市一院和上海十院一起去完成的多医学中心临床验证中,OCT眼底疾病筛查系统在图像质量评价、病灶检测、急迫性判断3项辅助医疗任务中,样本准确率分别达99.2%、98.6%、96.7%。
患者在上海第十人民医院由刘晓强主任进行眼底疾病智能筛查
在模型泛化阶段,“另一一俩个非常普遍的问题图片要是训练数据往往来自特定医院的特定设备,因此产品真正应用的前一天会遇来自不同地区、医院、厂家设备的数据,这对模型泛化性能是另一一俩个巨大的挑战”。
高鹏出鞘了第三把“剑”——基于Cycle-GAN的模型跨域自适应工具。“亲们 发现医疗影像中形状信息很关键,因此对Cycle-GAN进行改进,加入SSIM形状保真损失函数,取得了很好的效果。”这项技术,最终帮助平安科技在EAD2019国际竞赛中,夺取了模型泛化任务冠军”。
第四把剑更接近高鹏的理想。在模型部署阶段,要怎样通过剪枝、量化等模型压缩技术,得到尺寸更小,数率放慢的推理模型是核心问题图片。对此,高鹏和战友们自主研发了一款面向AutoML的高度学习框架SFE(赛飞)AI算法平台,其核心是并算不算稀疏化(Sparse)的分形形状(Fractal)神经网络,可针对特定问题图片自动演化(Evolution)。
赛飞到底有多牛?还得拿事实说话。8月初,在国际顶级自然语言处里会议EMNLP举办的COIN 2019文本理解大赛上,平安中国智慧医疗联合上海交通大学团队又搞懂另一一俩个世界第一。AskBob文本理解技术和赛飞AI算法平台作为两项核心技术,尤其是后者,帮助平台的并行模型训练将XLNet的训练数率提高了12倍。一场数度和质量的比拼,又以取胜之资完成了较量。
高鹏并后会另一一俩个急性子,因此他面对的需求往往后会火烧眉毛的急活,在创新和数率之间他也曾犹豫过,但最终他后会选取根小难走的路,给出他的最佳方案。
猜你喜欢