《科创板日报》12月28日讯(编辑 宋子(zǐ)乔) 众多专业学科中,医学以难度(dù)强、压力大著(zhe)称,但仍有无(wú)数人接受(shòu)挑(tiāo)战,选择迎难(nán)而上,如今,AI也跑来(lái)和(hé)医(yī)学(xué)生“抢(qiǎng)饭(fàn)碗”。
当地时(shí)间12月27日(rì),谷歌公布(bù)了一个新的医(yī)疗AI模型“Med-PaLM”。在(zài)经历一系列考(kǎo)核后,该模型被证实“几乎达(dá)到”了人类医生的(de)水平。
![]()
具体来(lái)看,研究团队准备(bèi)了一个医(yī)学问题问(wèn)答(dá)数(shù)据集“MultiMedQA”,涵盖医学考试、医学研(yán)究和消费者医学(xué)问题,该“题库(kù)”收集(jí)了MedQA(USMLE,美国医(yī)师执照考试(shì)题),还引入了他们自(zì)己的新数据集HealthSearchQA,它由搜(sōu)索过的健康问题组成(chéng)。
该(gāi)团队又请来一组临床医生作答。这些临(lín)床医生分布于美国和英(yīng)国,在初级保健、外科、内科(kē)和儿(ér)科方(fāng)面具有专业(yè)经验。
最后,研究人员将模型和人类医生的答案(àn)匿名后(hòu)交给9名分别来自美国(guó)、英国和印(yìn)度(dù)的临床医生进行评估。
结果显(xiǎn)示,Med-PaLM在科学常识方面的正确率在92%以上,在理解(jiě)、检索和推理能力方面,也几乎达到了人类医生的水(shuǐ)平,并在克(kè)服隐(yǐn)性偏见方面略(luè)胜一筹。
不过,该研究(jiū)负责人也表示,Med-PaLM给出的答(dá)案在整体上仍(réng)然不如临床医生,该模型在实际应用前有待进一步完善。
追根溯源(yuán),Med-PaLM是(shì)怎么诞生(shēng)的呢(ne)?
这里(lǐ)不得不提(tí)谷歌在今年发布(bù)的转换器语言模型——PaLM,该模型(xíng)基(jī)于Pathways架构、拥有(yǒu)5400亿参数,是(shì)Google迄今为止研发的(de)最(zuì)大规模(mó)的模型,全(quán)名(míng)为Pathways Language Model。
PaLM模型(xíng)在语言理解等各种方(fāng)面的评估测试中的表现十分(fèn)出色,甚至还在(zài)语言和推理(lǐ)类的测评中超过了(le)人(rén)类。
Med-PaLM正是PaLM的(de)衍生(shēng)品。谷歌研究团队(duì)首先在(zài)上文提及的医学问(wèn)题(tí)问答数(shù)据集“MultiMedQA”上评(píng)估了PaLM及微调(diào)变体Flan-PaLM,然后,基于此提(tí)出了(le)指令提示x调整,让Flan-PaLM进一步与医学接轨(guǐ),进一(yī)步产生了Med-PaLM。
值(zhí)得注意的是,AI模型的每一次突破,都预示着(zhe)更聪明的机(jī)器人即将到来。指挥机器人(rén)干(gàn)活不是什么新奇(qí)的(de)事(shì),但要让机器人能够理解你的(de)命令背后的意图,那就要考验(yàn)它的“大脑”好(hǎo)不(bú)好用了。将AI模型应用到机器(qì)人身上相当于给机器(qì)人“开智”。
据了(le)解,今年8月份,谷歌(gē)就将大型(xíng)语(yǔ)言模型首次集成到机器人中,有了AI模型的(de)加持,机(jī)器人能(néng)像人类(lèi)一样(yàng)响(xiǎng)应完(wán)整的命令。
谷歌研(yán)究人(rén)员(yuán)就此做了演示。当对机器人说:“我饿了,你(nǐ)能给我点零食吗?”机器人在(zài)自助餐厅中搜索(suǒ)一番后,打(dǎ)开了一个抽屉,找到一袋薯片并将(jiāng)它拿给研究人员。
可以预见(jiàn)的是,通(tōng)过进一步的训练、优(yōu)化,Med-PaLM模型的回答(dá)准确率将进一步提高,基于此模型的机器(qì)人(rén)医生(shēng)也有望更(gèng)快出现。