最近,“新基建”真是火(huǒ)出了圈。尤其是(shì)3月4日,中央政治局常委会会议研究当前新冠肺炎疫情(qíng)防控和稳定经济社会运行重点工作,其中提出(chū)“加快5G网(wǎng)络、数(shù)据中心等新型基础设(shè)施建(jiàn)设进度”,为“新基(jī)建”摁(èn)下快(kuài)进(jìn)键。事(shì)实上(shàng),“新基建(jiàn)”不是一个新概念。2018年底召开(kāi)的中央经济工作(zuò)会议(yì)就明确了5G、人工智能、工(gōng)业(yè)互联(lián)网、物(wù)联网(wǎng)等“新型基础设施(shī)建设”的(de)定位,随后“加(jiā)强新一代信息基础设施(shī)建设”被写入2019年政府工(gōng)作报告。2020年开年的首次国(guó)务院常务会(huì)议也(yě)明确提及“新基建”。
在当前疫情防控和经济(jì)恢复的大背景(jǐng)下,由于(yú)在稳(wěn)定投资等方(fāng)面的巨大作用,“新基建”进入一个加速推进(jìn)的快车道(dào)。
华为,清华大学,旷世等人工智能企业开源,推动新基建发展3月20日,清华大学计算机系图形实验室开源AI框架(jià)计(jì)图(Jittor),这是由中国科(kē)学(xué)界开源的(de)首个AI框架。接着3月25日,旷视(shì)科(kē)技在线上发布旷视AI生产力平台Brain++,同时,也宣(xuān)布开(kāi)源(yuán)新一代AI生产力平台Brain++的核心深度学习(xí)框架旷(kuàng)视天元(MegEngine)。紧接(jiē)着28日,华为在2020年开发者大会中宣布正式开源一款支持端边云全场景的深度学习训练推理框架MindSpore。
其实,开源深度学习框(kuàng)架的重要性不言而喻。在传统深度学习研发中,产品(pǐn)从原型(xíng)到生产部署往往(wǎng)需要分开设计(jì)并调用训练(liàn)框架(jià)和推理框架两种(zhǒng)框(kuàng)架(jià),这就导致模型在(zài)训练和推理的转换的过程中容易(yì)出现不明原因的性能或精度(dù)损失,需要开发者手工(gōng)进行优化,而算法(fǎ)在计算(suàn)平台部署的时候出现的各(gè)种问题也无(wú)法追溯。
针对以上问(wèn)题,开(kāi)源框架在设计之初就可(kě)以很(hěn)好规避(bì),它(tā)不仅可以降(jiàng)低(dī)AI开发门(mén)槛,还可以提(tí)升算法研发(fā)效率。
开源意(yì)义:技术开放与AI快(kuài)速落地
那么,什么是开(kāi)源深(shēn)度(dù)学习框架?
在讲述深度学习框架(jià)之前,首(shǒu)先先了解深度学习。
大多数人对(duì)于(yú)深度学(xué)习并不陌生,深度学习即Deep Learning,源于人工神经网络的(de)研究,是机(jī)器学习的一(yī)个分支,它主要依赖于深度神经元网络,这种深度(dù)神经元网络就类似于人类(lèi)的大脑,其学习过程也与人类极(jí)其相似,并且(qiě)还可以用(yòng)海量的数据和高级算法来提(tí)高自主学(xué)习与分析事物特征的能(néng)力。
而开源深度(dù)学习框架则(zé)是(shì)在深度学习初始阶(jiē)段(duàn)基础之上,由深(shēn)度学习(xí)研究开(kāi)发者将大量重复代码写(xiě)成一个(gè)框架,然后放到网上让所有其他研究开发者(zhě)一(yī)起使用,主要是(shì)为了提高研究开发者的工(gōng)作效率。
所(suǒ)以,“开(kāi)源”就(jiù)意味着开放自己(jǐ)的源代码给别人查阅和使用(yòng),开发者可以将开(kāi)源框架用在(zài)任何平台,任何领域里。例如(rú),如果有图像(xiàng)数据,就可(kě)以将开源框架(jià)用在图(tú)像(xiàng)识别领域,如果有语音数(shù)据就可以将开源框架用在语音(yīn)识别里等等。对于使用者而言,开源框(kuàng)架即(jí)拿即用。
早前,百度(dù)高(gāo)级副总裁、AI技术(shù)平台体系(xì)总负责人王海峰就表示:“开源、开放对于人工智能时代(dài)至关重要。首先,人(rén)工(gōng)智能(néng)技术的发展需要所有人(rén)的协(xié)同推进,因此开源、开放就显得特别重要;其次,人工智能技术会赋(fù)能各(gè)行各业(yè),开源、开放可以让各行各业便(biàn)捷地使用人工智能,让社会各界都受益”。
旷视(shì)科技(jì)则把(bǎ)开源(yuán)框架做了一个很好理解的(de)比喻(yù),他(tā)们向(xiàng)笔(bǐ)者称(chēng),开源框架的作用就是(shì)为(wéi)开发者提供一个良好的开发环境(jìng),如(rú)果把算法研(yán)发比做(zuò)炒菜的过程,有无框架的区(qū)别就是,现(xiàn)在不需要厨师自己去(qù)造锅、生火和洗(xǐ)菜,直接炒(chǎo)菜就可以了。

旷视科技(jì)天(tiān)元开源框架
“开源框架就是让研发人员获得(dé)从数据到算法产业(yè)化(huà)的一揽子技术能(néng)力,不用重复造(zào)轮子也可(kě)以推进(jìn)AI快速(sù)落地。”旷视科技表示。
对于开发者来说,“开源”最大(dà)的意义就(jiù)在(zài)于其“技术共享与共建”。旷视科技介绍,“20世(shì)纪末(mò)期,Linux 系统为中国开发(fā)者打开了通往开源“集市”的(de)大门,开源软件为国产操(cāo)作系(xì)统和国产软件平台从0到1开辟了基础,同时中国的(de)开发者(zhě)们也为国际(jì)的开源社区做(zuò)出了大量的(de)贡献”。
开源社区的(de)发展壮大和成果共(gòng)享,促使(shǐ)很多企业实现了快速的成长,同时也触(chù)发了技术的加速迭代,和大批信息技术(shù)人(rén)才的涌现。
开(kāi)源:利(lì)于企业生态化,加(jiā)快新基建步伐
据笔(bǐ)者了解(jiě),在(zài)旷视、华为等(děng)发布开源之前(qián),早在2016年,百度就开放了自主(zhǔ)研(yán)发的(de)开源PaddlePaddle深度学习平台。据(jù)了解,百度PaddlePaddle是国内(nèi)最早的开源(yuán)深度学习框架,并且打破了(le)国(guó)产AI框架的开源。
除百度开源PaddlePaddle外,还有脸书Torch、蒙(méng)特利尔理工学院Theano、谷歌Tensorflow、腾讯(xùn)Angel、阿里X-DeepLearning等。据悉,目前,全(quán)球市场(chǎng)被(bèi)脸书Torch、谷(gǔ)歌Tensorflow占(zhàn)据了90%以上(shàng)的开(kāi)发者(zhě)市场(chǎng)。
笔者查询资料获悉:此前,百度相关人士曾对媒体介绍道(dào)“深度(dù)学习框架(jià)就像智能(néng)时代的操作系统(tǒng),它向下连接芯片、大型计算机(jī)系统(tǒng),向(xiàng)上承(chéng)接(jiē)各种业务模型、行业应用,在生态中处于核心位置,如果(guǒ)一直基于海外谷歌和Facebook的框架,等着别人开放功能,会(huì)丧失率先打开未知领域(yù)的机会”。
同时,如果只(zhī)偏重在上层应用(yòng)、忽视了(le)底层技术,国内底层人才将空(kōng)心(xīn)化(huà)。
亿欧智库产业(yè)互联网研(yán)究副总监薄纯(chún)敏也向笔者(zhě)表示:“目前,国(guó)内研(yán)发开源深度学习框架的企业比较(jiào)少,而且(qiě)也没有非常核心的开源深度(dù)学习框架,市场几(jǐ)乎被谷歌与(yǔ)脸书占据(jù)”。
她分析,国内企业开发开源框架主要(yào)有两个原(yuán)因:第一、大(dà)公司想要(yào)通过开源框架建(jiàn)立企业生态化;第二、大公司建立完生态化后(hòu),希望通过技(jì)术(shù)或产(chǎn)品的开源,去获取想要的数据资(zī)源,然后(hòu)对这些数据进(jìn)行分析与(yǔ)整合,再利用。
开源的本质(zhì)是开(kāi)放,而目前开源是被大多数企业(yè)当作战略来发展(zhǎn)的,因为所(suǒ)有行业最(zuì)终的目标就是通过开(kāi)放实现生态化。就拿腾(téng)讯来说,第一步,它是通过开放来进行企业生态(tài)化;第二步,则是通过生态来给社会、企业等(děng)提(tí)供(gòng)开源(yuán)框架的解(jiě)决方(fāng)案(àn)。
除此之(zhī)外,开源框(kuàng)架对初进(jìn)入AI行(háng)业(yè)的初创公司(sī)而言,可以很好降低最(zuì)开始的研究(jiū)基础(chǔ)门槛;对于本身就对AI技术比(bǐ)较感兴趣的爱好者而言,他们(men)不一定会商(shāng)业化,他们可以会通过开源框架做一些小的系统研(yán)发。不仅如此,开(kāi)源框架还可以构建全社会技术(shù)共享(xiǎng)的大生态。
在笔者看(kàn)来,AI作为新基建中的(de)一部分(fèn),开(kāi)源深度(dù)学(xué)习框架进一步加速(sù)了AI技术落地,这对于最近大家比较关注的新基建项目也有很大促进作用,AI 加速落地在(zài)一定程度上,也可加快新型(xíng)基础设施建(jiàn)设的步伐(fá)。旷(kuàng)视科技表示:“通过开源、开放的方式,可以让每(měi)一个AI开发者都有能力(lì)快速实(shí)现(xiàn)算法从0到1的(de)创造,进而创造更大的价值”。
不过,从目前的(de)现(xiàn)实情况(kuàng)来看,开源(yuán)深度学习框架确实可以给AI行(háng)业(yè)技术落(luò)地带来促进作用,但(dàn)是也会导致一些底层技术研发的滞后。薄纯敏称,“这(zhè)就(jiù)好(hǎo)比(bǐ)现在(zài)大家用(yòng)的手机一样,大部分(fèn)都局限(xiàn)于androids与ioses系统,这些(xiē)系统本身(shēn)很好,大家(jiā)都可以用,但是却不利于行业底层技(jì)术(shù)的多元化发展”。
开源框架的使用也一样,当开源框架开放后,大家就会拿(ná)来即用,会停留在一些开(kāi)源框架中,而不去思考、不去进行更深(shēn)层次(cì)的多元化开源底(dǐ)层技(jì)术(shù)研(yán)发。