技術(shù)、實(shí)踐與生態(tài):國(guó)產(chǎn)深度學(xué)習(xí)框架要過(guò)的三道關(guān)
2020年對(duì)于中國(guó)科技行業(yè)來(lái)說(shuō)是一個(gè)覺(jué)醒的元年。地緣政治產(chǎn)生的沖擊波,警覺(jué)了許多國(guó)內(nèi)的科技行業(yè)參與者。自主創(chuàng)新的呼聲一浪高過(guò)一浪。在深度學(xué)習(xí)領(lǐng)域,谷歌的TensorFlow、Facebook的PyTorch作為主流框架自然大名鼎鼎,中國(guó)企業(yè)近期也紛紛發(fā)布自己的開(kāi)源框架,例如曠視MegEngine、華為MindSpore、清華Jittor、一流Oneflow等,加上最早開(kāi)源且技術(shù)成熟、框架完備的百度飛槳,可以說(shuō)這條賽道已經(jīng)是風(fēng)起云涌,形成了群雄逐鹿的局面。
對(duì)于深度學(xué)習(xí)框架這只“鹿”的重要意義,從業(yè)人士自然清楚不過(guò):無(wú)數(shù)的AI應(yīng)用,正是在深度學(xué)習(xí)框架上建立起來(lái)的,人工智能時(shí)代,說(shuō)深度學(xué)習(xí)框架是最重要的基礎(chǔ)設(shè)施毫不為過(guò)。也正是因?yàn)槿绱?,?guó)外主流深度學(xué)習(xí)框架斷供的憂慮,一直籠罩在國(guó)內(nèi)業(yè)界的上空,現(xiàn)在看來(lái),這個(gè)擔(dān)心可以減輕很多。國(guó)產(chǎn)開(kāi)源深度學(xué)習(xí)框架的繁榮,讓中國(guó)的業(yè)界在這一領(lǐng)域有更多的選擇。
(國(guó)內(nèi)外主流深度學(xué)習(xí)框架一覽)
國(guó)產(chǎn)深度學(xué)習(xí)框架的機(jī)會(huì)和競(jìng)合
其實(shí),這么多公司新的深度學(xué)習(xí)框架的發(fā)布肯定不是偶然,完全可以預(yù)測(cè),未來(lái)還會(huì)有不少公司發(fā)布自己的開(kāi)源框架。其實(shí),每一個(gè)深度學(xué)習(xí)開(kāi)源框架的誕生,都是建立在前人努力的基礎(chǔ)上的,而且框架的側(cè)重各有不同,既有對(duì)別家的優(yōu)化,也有對(duì)別家的補(bǔ)充,還有的特別強(qiáng)調(diào)自己的特色。
筆者認(rèn)為,越來(lái)越多的國(guó)產(chǎn)深度學(xué)習(xí)開(kāi)源框架的推出,其最為重要的意義,就是表明市場(chǎng)意識(shí)到并且重視深度學(xué)習(xí)開(kāi)源框架背后的商業(yè)機(jī)會(huì),甚至極有可能成為人工智能的基礎(chǔ)設(shè)施,從而誕生平臺(tái)級(jí)的企業(yè)。這也是為什么不同的公司都進(jìn)入到這個(gè)市場(chǎng)的原因。
不同開(kāi)源框架在同一個(gè)市場(chǎng)里面競(jìng)爭(zhēng),必然要強(qiáng)調(diào)差異化才能走出。比如說(shuō),OneFlow強(qiáng)調(diào)的就是性能和小眾創(chuàng)新,這可能會(huì)吸引一部分使用者。MegEngine強(qiáng)調(diào)訓(xùn)練推理一體化,同時(shí)用過(guò)PyTorch上手會(huì)非??臁0俣蕊w槳有國(guó)內(nèi)的先發(fā)優(yōu)勢(shì),做的時(shí)間比較長(zhǎng),相對(duì)成熟,用的人也非常多,最新數(shù)據(jù)有超過(guò)210萬(wàn)開(kāi)發(fā)者在用,企業(yè)用戶也超過(guò)了9萬(wàn)多,形成的產(chǎn)業(yè)鏈生態(tài)非常完整。這樣每一個(gè)開(kāi)源框架都能夠找到適合自己的市場(chǎng)生存并發(fā)展。開(kāi)源框架彼此之間還會(huì)互相參考,彼此學(xué)習(xí),這種競(jìng)爭(zhēng)關(guān)系是良性的,產(chǎn)生的外部效果就是教育了市場(chǎng),培育了市場(chǎng),讓更多的人參與到深度學(xué)習(xí)技術(shù)的使用中來(lái)。
(飛槳是可以與PyTorch、TensorFlow掰手腕的國(guó)產(chǎn)框架佼佼者)
什么樣的深度學(xué)習(xí)框架能夠脫穎而出
龍頭總是在市場(chǎng)充分競(jìng)爭(zhēng)后才會(huì)出現(xiàn)。既然深度學(xué)習(xí)開(kāi)源框架是一個(gè)平臺(tái)型的商業(yè)機(jī)會(huì),那么,競(jìng)爭(zhēng)的結(jié)果必然是龍頭脫穎而出,占據(jù)絕大部分的市場(chǎng)份額,形成很深的行業(yè)進(jìn)入壁壘。
那么,什么樣的企業(yè)最終能追逐到這只天下艷羨的“鹿”?換一種問(wèn)法,要在競(jìng)爭(zhēng)中取勝,關(guān)鍵的決定因素是什么呢?如果去比較PyTorch、TensorFlow也好,去比較飛槳和其他框架也罷,每一種開(kāi)源框架,在某些局部領(lǐng)域,都有自己的特色。各家編程的風(fēng)格、思想,也不一樣。有的框架強(qiáng)調(diào)完備性、有的強(qiáng)調(diào)易用性,有的強(qiáng)調(diào)性能,各家有各家的絕活。像TensorFlow這樣的架構(gòu),因?yàn)橥度氲馁Y源多,已經(jīng)形成了一個(gè)巨塔。有的人用,覺(jué)得是殺雞用牛刀。有的框架里面的內(nèi)容由于做得早,在計(jì)算性能方面考慮不夠,不如新的框架。這些都是常見(jiàn)的情況。
不同的開(kāi)源框架彼此之間競(jìng)爭(zhēng),考驗(yàn)的肯定是一個(gè)綜合表現(xiàn)。
舉個(gè)例子,用戶習(xí)慣是一個(gè)很重要的方面。TensorFlow本身在某些方面是不如一些新的開(kāi)源框架的,但是用的人多,習(xí)慣了,也就不容易換。除了用戶習(xí)慣外,模型全不全也是一個(gè)重點(diǎn)。企業(yè)在飛槳?jiǎng)?chuàng)建了超過(guò)29.5萬(wàn)個(gè)模型,這種風(fēng)格可能跟他們開(kāi)發(fā)的文化有關(guān)系——有很多工程師主導(dǎo)的理念。需要做工程的,用飛槳就覺(jué)得很好用。
而最讓我覺(jué)得國(guó)產(chǎn)深度學(xué)習(xí)框架不輸外國(guó)主流框架的地方在于實(shí)踐應(yīng)用,因?yàn)槟愕目蚣芗夹g(shù)再好,沒(méi)有落地案例還是比較虛的,TensorFlow、PyTorch在互聯(lián)網(wǎng)、AI應(yīng)用上都非常廣泛,能解決實(shí)際問(wèn)題,谷歌的推薦系統(tǒng)就是用TensorFlow訓(xùn)練的。
這點(diǎn)上飛槳也做的不錯(cuò),前面有宣傳稱東南亞某國(guó)用的飛行器森林巡檢方案,就是用飛槳來(lái)訓(xùn)練的,相比人力效率直接翻了兩倍,并對(duì)國(guó)內(nèi)全境森林實(shí)現(xiàn)了100%的覆蓋率;還有個(gè)例子是醫(yī)療領(lǐng)域,打造的CT影像分析AI模型病灶識(shí)別精準(zhǔn)度達(dá)到92%,確實(shí)可以輔助醫(yī)生進(jìn)行一些診療;還有我們熟知的手機(jī)品牌OPPO,他家手機(jī)OS的推薦系統(tǒng)就是基于飛槳打造的,統(tǒng)計(jì)稱訓(xùn)練速度提升了8倍,比市面其他框架的表現(xiàn)都要好。著名深度學(xué)習(xí)框架 Caffe/Caffe2的作者也認(rèn)為“飛槳的設(shè)計(jì)很干凈……比TensorFlow好很多”。近日,飛槳再次得到了業(yè)界的認(rèn)可,榮獲了2019年度中國(guó)電子學(xué)會(huì)科學(xué)技術(shù)獎(jiǎng)科技進(jìn)步一等獎(jiǎng)。
對(duì)產(chǎn)業(yè)的友好度,和相應(yīng)方案實(shí)踐落地的可行性,是一個(gè)很重要的競(jìng)爭(zhēng)力,去年IDC有個(gè)《中國(guó)深度學(xué)習(xí)平臺(tái)市場(chǎng)份額調(diào)研》,顯示TensorFlow、PyTorch、飛槳?jiǎng)偤谜剂饲叭奈恢?,就是一個(gè)很好的證明——它們都已經(jīng)在大量實(shí)踐中證明了自己。
?。↖DC《深度學(xué)習(xí)框架和平臺(tái)市場(chǎng)份額》報(bào)告)
但是,什么樣的深度學(xué)習(xí)框架能夠脫穎而出,從目前的市場(chǎng)競(jìng)爭(zhēng)狀態(tài)來(lái)說(shuō),還不好說(shuō),隨著人工智能時(shí)代的到來(lái),以及新基建對(duì)于AI基礎(chǔ)設(shè)施的需求,未來(lái)深度學(xué)習(xí)框架市場(chǎng)依然有非常大的增長(zhǎng)空間,而目前只是一個(gè)很初級(jí)的階段,為各大深度學(xué)習(xí)框架提供了“逐鹿”的棋盤(pán)。這時(shí)候,誰(shuí)能貼近現(xiàn)實(shí)場(chǎng)景的實(shí)際需求,將技術(shù)力轉(zhuǎn)化為生產(chǎn)力,就可以占得先機(jī)。
當(dāng)然,在早期,所有的行業(yè)參與者都能夠享受到紅利,這個(gè)階段,彼此之間的合作還大于競(jìng)爭(zhēng)??v觀商業(yè)史,那些能夠持續(xù)地投入資源,持續(xù)保持更新迭代并且有能力建設(shè)一個(gè)完整的生態(tài)合作圈的平臺(tái)型企業(yè),勝出的概率更大。
公共政策應(yīng)該如何支持深度學(xué)習(xí)框架發(fā)展
從市場(chǎng)經(jīng)濟(jì)的角度,我們當(dāng)然歡迎充分競(jìng)爭(zhēng),由市場(chǎng)來(lái)選擇哪一種深度學(xué)習(xí)開(kāi)源框架。但是,考慮到現(xiàn)在國(guó)際大環(huán)境的敏感性,有形之手的參與必不可少。
國(guó)家意志層面對(duì)科技競(jìng)爭(zhēng)已經(jīng)有明確的認(rèn)知,并且提出“強(qiáng)化國(guó)家戰(zhàn)略科技力量,構(gòu)建社會(huì)主義市場(chǎng)經(jīng)濟(jì)條件下關(guān)鍵核心技術(shù)攻關(guān)新型舉國(guó)體制”,這一觀點(diǎn),已經(jīng)獲得了中國(guó)科技界的普遍認(rèn)可。
深度學(xué)習(xí)開(kāi)源框架作為戰(zhàn)略科技力量的重要一環(huán),一定要能夠保證自主可控。國(guó)家和企業(yè)都對(duì)此有清醒的認(rèn)識(shí),百度CTO王海峰曾如此評(píng)價(jià),“深度學(xué)習(xí)平臺(tái)是智能時(shí)代的操作系統(tǒng),是產(chǎn)業(yè)智能化的基礎(chǔ)底座,是新型基礎(chǔ)設(shè)施的重要一環(huán)?!笨梢?jiàn)在業(yè)內(nèi)人士看來(lái),深度學(xué)習(xí)框架與科研建設(shè)、智能時(shí)代甚至?xí)r下的“新基建”大潮均息息相關(guān)。
?。ㄈ斯ぶ悄苁恰靶禄ā贝蟪钡闹匾M成部分,深度學(xué)習(xí)框架則是AI的底座)
現(xiàn)在的問(wèn)題是,公共政策應(yīng)該如何支持深度學(xué)習(xí)框架發(fā)展?
參考過(guò)往的模式,我國(guó)面對(duì)科技競(jìng)爭(zhēng)時(shí),主要通過(guò)組建國(guó)家隊(duì),集中力量辦大事的方式。比如,在高速列車項(xiàng)目上,南北車合并。在大型船舶上,南北船合并。在大飛機(jī)上,組建中國(guó)商飛。這些都是在關(guān)鍵核心技術(shù)領(lǐng)域,通過(guò)資源整合,避免重復(fù)浪費(fèi)的方式,加快加強(qiáng)加速行業(yè)進(jìn)化??梢钥闯觯瑖?guó)家之間的科技競(jìng)爭(zhēng),主要依靠龍頭科技企業(yè)來(lái)競(jìng)爭(zhēng)。
在深度學(xué)習(xí)開(kāi)源框架上,我們呼吁,初創(chuàng)企業(yè)的部分,讓市場(chǎng)去孕育,公共政策應(yīng)該重點(diǎn)扶持已經(jīng)形成了一定先發(fā)優(yōu)勢(shì)、具備一定基礎(chǔ)的企業(yè),飛槳可以說(shuō)已經(jīng)具備了這個(gè)基礎(chǔ)。此外,早一點(diǎn)形成規(guī)模優(yōu)勢(shì),早一點(diǎn)形成產(chǎn)業(yè)鏈優(yōu)勢(shì),國(guó)際競(jìng)爭(zhēng)力就越強(qiáng)。最終國(guó)家之間的人工智能競(jìng)爭(zhēng),靠的是集團(tuán)軍作戰(zhàn),也就是說(shuō),不僅僅是深度學(xué)習(xí)開(kāi)源框架的事兒,而是包括深度學(xué)習(xí)開(kāi)源框架在內(nèi)的產(chǎn)業(yè)鏈上下游眾多企業(yè),他們必須擰成一股繩,因此在生態(tài)建設(shè)上越豐富、越完備的企業(yè),也必然會(huì)受到政策的重點(diǎn)關(guān)注,也是值得國(guó)內(nèi)其他企業(yè)向百度學(xué)習(xí)的地方。
寬泛科技專注為人工智能、邊緣計(jì)算、影視后期、動(dòng)漫設(shè)計(jì)、商務(wù)應(yīng)用等領(lǐng)域,
提供基于人臉識(shí)別、深度學(xué)習(xí)、視覺(jué)計(jì)算、VR/AR/MR、桌面虛擬化、
數(shù)據(jù)存儲(chǔ)及數(shù)據(jù)可視化、視訊會(huì)議等信息化解決方案及服務(wù)。
如果您有合作需求或?qū)氋F建議,歡迎來(lái)信。
郵箱:hezuo@kuanfans.com
合作熱線:(021) 5415 5559
官方網(wǎng)站:www.e27510.cn