新浪科技讯 1月6日上(shàng)午消(xiāo)息,据报道,旧(jiù)金(jīn)山(shān)人(rén)工智能研究公司OpenAI已经(jīng)开发(fā)了一种新(xīn)系(xì)统,能根(gēn)据(jù)短文本来生成图(tú)像。
OpenAI在官方博客中表示,这(zhè)个(gè)新系统名为(wéi)DALL-E,名称来源于(yú)艺(yì)术(shù)家萨(sà)尔瓦多·达利(Salvador Dali)和皮克斯的机器(qì)人(rén)英(yīng)雄瓦力(lì)(WALL-E)的结合。新系统展(zhǎn)示了“为一系列广泛的(de)概(gài)念”创造图像的能力,创作的作(zuò)品包括牛油果形状的扶(fú)手椅等。
通过神经(jīng)网络去生成图像,这种技术(shù)并不新颖(yǐng)。此前(qián),生成对(duì)抗(kàng)网络(GAN)已(yǐ)被广泛(fàn)用(yòng)于创(chuàng)建真实的(de)人、宠(chǒng)物、租赁房(fáng)产和食物的照(zhào)片。
不(bú)过,DALL-E的独特之(zhī)处(chù)在于可以(yǐ)根据输(shū)入的文本来创作图(tú)像。该系统基于文字生成系统GPT-3的一个版(bǎn)本,该系(xì)统此前被用于撰写诗歌和新闻文章等(děng)。利用配对(duì)好的(de)文本和图像(xiàng)数据(jù)集进行训(xùn)练,DALL-E可以根据新的文字提示生成图像,此外还展(zhǎn)示了创造多种(zhǒng)风格(gé)图片(piàn)的能力。
OpenAI还发布了图像识(shí)别系统Clip。Clip通用性(xìng)比当前针(zhēn)对单(dān)个任务的系统(tǒng)更好(hǎo),可以用网(wǎng)上(shàng)公(gōng)开的文字图像配对数据集来训(xùn)练。
DALL-E还需要(yào)继(jì)续优化。OpenAI指出(chū),DALL-E目前的(de)可靠(kào)性(xìng)还存(cún)在问题,对类似“glass”等有多个含义的名词(cí)常常会混淆,文字中不同的语法也可能(néng)会造成不(bú)同的结果。
此外还有更(gèng)深层次的问题需(xū)要解决。OpenAI表示:“我们(men)注意到(dào),涉及生(shēng)成模型(xíng)的工作(zuò)可能(néng)会产生重大而广泛的(de)社会影(yǐng)响。”未来可(kě)能的举措(cuò)包括研究对就业岗位的影响,生成结果的偏(piān)见,以及技术的长期道德挑(tiāo)战。
长期以来,公众一直担心人(rén)工(gōng)智能生(shēng)成的媒体内容被滥(làn)用,例如神经网络被(bèi)用来制(zhì)造(zào)虚假的音视频和图像,用于不(bú)道德的(de)目的,例如政治上的假信(xìn)息和欺诈活动等。