AI大模型:為產(chǎn)業(yè)智能化升級(jí)“開(kāi)閘放電”
人工智能作為新一代產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力之一,其發(fā)展已經(jīng)從“大煉模型”逐步邁向“煉大模型”的階段。通過(guò)設(shè)計(jì)先進(jìn)的算法,整合盡可能多的數(shù)據(jù),匯聚大量算力,集約化地訓(xùn)練大模型,從而服務(wù)更多的企業(yè),正在成為人工智能發(fā)展的新趨勢(shì)。
機(jī)器人“小科”亮相國(guó)家“十三五”科技創(chuàng)新成就展、“冬奧手語(yǔ)播報(bào)數(shù)字人”在北京電視臺(tái)上崗。
盡管公眾對(duì)大模型的概念和它背后的技術(shù)突破還一知半解,卻已對(duì)悟道2.0大規(guī)模智能模型驅(qū)動(dòng)下的這些應(yīng)用不再陌生。
2021年,北京智源人工智能研究院(以下簡(jiǎn)稱(chēng)智源研究院)發(fā)布悟道大模型,連創(chuàng)“中國(guó)首個(gè)”“世界最大”紀(jì)錄。
以此為標(biāo)志,越來(lái)越多的研究機(jī)構(gòu)、企業(yè)加入到“煉大模型”和推動(dòng)智能普惠的隊(duì)伍中,在世界人工智能技術(shù)發(fā)展和應(yīng)用中貢獻(xiàn)中國(guó)智慧和力量。
“開(kāi)閘放電”普惠社會(huì)
2021年6月1日,由智源研究院、清華大學(xué)等多個(gè)單位聯(lián)合打造的悟道2.0發(fā)布。其參數(shù)規(guī)模達(dá)1.75萬(wàn)億,打破了之前由國(guó)外預(yù)訓(xùn)練模型創(chuàng)造的1.6萬(wàn)億的參數(shù)紀(jì)錄,成為中國(guó)首個(gè)、全球最大的萬(wàn)億級(jí)預(yù)訓(xùn)練模型。
智源研究院學(xué)術(shù)副院長(zhǎng)、清華大學(xué)教授唐杰介紹,完全基于國(guó)產(chǎn)超算GPU平臺(tái)打造的悟道2.0取得了多項(xiàng)世界級(jí)的創(chuàng)新突破,在預(yù)訓(xùn)練模型架構(gòu)、微調(diào)算法、高效預(yù)訓(xùn)練框架方面實(shí)現(xiàn)了原始理論創(chuàng)新,在世界公認(rèn)的人工智能能力排名榜單上,取得9項(xiàng)能力的領(lǐng)先地位。
為提升大規(guī)模預(yù)訓(xùn)練模型的產(chǎn)業(yè)普適性和易用性,悟道團(tuán)隊(duì)搭建的高效預(yù)訓(xùn)練框架,實(shí)現(xiàn)了全鏈路的原創(chuàng)突破或迭代優(yōu)化,預(yù)訓(xùn)練效率大幅提升。
“需求多樣化與場(chǎng)景碎片化是AI落地普遍存在的難點(diǎn)。悟道開(kāi)放平臺(tái)在快捷易用的同時(shí),更注重解決規(guī);、產(chǎn)業(yè)化AI應(yīng)用問(wèn)題!碧平鼙硎,悟道大模型具備“低門(mén)檻+高效率+高情商”的特點(diǎn),能夠滿足不同行業(yè)和企業(yè)實(shí)現(xiàn)規(guī);a(chǎn)業(yè)化的應(yīng)用需求。任何企業(yè)、開(kāi)發(fā)者拿到完全開(kāi)源的悟道2.0預(yù)訓(xùn)練框架后,都可以快速部署并應(yīng)用于實(shí)際業(yè)務(wù)中。
OPPO旗下開(kāi)放式對(duì)話虛擬語(yǔ)音助手小布,基于悟道大模型開(kāi)啟的“生成式回答系統(tǒng)”,一舉解決了行業(yè)共通性的長(zhǎng)尾問(wèn)題,單條回答建設(shè)成本降低99%。
高效的機(jī)器翻譯、智能的對(duì)話客服和語(yǔ)音播報(bào)在電商、媒體、教育、智能硬件等領(lǐng)域已經(jīng)表現(xiàn)出極大的發(fā)展空間,驗(yàn)證了大模型鋪就的邁向通用人工智能的路徑極富潛力。
智源研究院理事長(zhǎng)張宏江指出:“未來(lái),大模型會(huì)形成類(lèi)似電網(wǎng)的智能基礎(chǔ)平臺(tái),像發(fā)電廠一樣為全社會(huì)源源不斷供應(yīng)‘智力源’,高效普惠各行各業(yè)!
悟道2.0超大規(guī)模智能模型訓(xùn)練技術(shù)體系,為我國(guó)人工智能應(yīng)用構(gòu)建的基礎(chǔ)設(shè)施,已開(kāi)始為傳統(tǒng)行業(yè)智能化改造和升級(jí)“開(kāi)閘放電”。
打造新型研發(fā)機(jī)制
悟道大模型實(shí)現(xiàn)了我國(guó)在超大規(guī)模智能模型技術(shù)的自主可控及前沿引領(lǐng)。智源研究院院長(zhǎng)黃鐵軍從三個(gè)角度對(duì)于研發(fā)機(jī)制給予了解釋。
一方面,是新時(shí)代“集中力量辦大事”的科研組織模式,即保持對(duì)重大科學(xué)問(wèn)題的敏銳眼光,以需求導(dǎo)向和問(wèn)題導(dǎo)向布局重大科研任務(wù),建立大任務(wù)快速論證啟動(dòng)機(jī)制,組建跨機(jī)構(gòu)、大協(xié)同、高強(qiáng)度的科研團(tuán)隊(duì),解決大問(wèn)題。另一方面,以人才為中心,鼓勵(lì)自由探索,堅(jiān)持求真務(wù)實(shí)、不論資排輩的人才發(fā)展模式,堅(jiān)持以“代表作”和“小同行評(píng)價(jià)”遴選人才,讓想干事、能干事的青年人才“挑大梁當(dāng)主角”。
“智源研究院立志要做‘永遠(yuǎn)年輕的研究院’,注重對(duì)青年學(xué)者的吸引,期待與青年學(xué)者共同創(chuàng)造科研新范式。”張宏江說(shuō),“智源推崇‘代表作文化’,不問(wèn)出身,不看論文數(shù),只看是否取得標(biāo)桿性成就,有沒(méi)有成為標(biāo)桿的潛力。”
唐杰表示,未來(lái)智源研究院將繼續(xù)推進(jìn)機(jī)制創(chuàng)新,既要“頂天”,也要“立地”。在吸引更多學(xué)者加入,創(chuàng)造出更多類(lèi)似悟道大模型的科研“代表作”,推動(dòng)北京率先成為國(guó)際領(lǐng)先的人工智能創(chuàng)新中心的同時(shí),打造生態(tài),連接技術(shù)與產(chǎn)業(yè),推動(dòng)人工智能產(chǎn)業(yè)發(fā)展和深度應(yīng)用。
產(chǎn)學(xué)研相繼入場(chǎng)
站在“新三年計(jì)劃”的起點(diǎn),悟道將圍繞提智能、降門(mén)檻、建生態(tài)多個(gè)角度,進(jìn)一步向“更好用”邁進(jìn)。
隨著越來(lái)越多的研究機(jī)構(gòu)和技術(shù)公司入場(chǎng),以虛擬數(shù)字人為典型代表的,基于大模型應(yīng)用的技術(shù)創(chuàng)新和產(chǎn)業(yè)成果在我國(guó)全面開(kāi)花。
2021年7月9日,中國(guó)科學(xué)院自動(dòng)化研究所發(fā)布跨模態(tài)通用人工智能平臺(tái)“紫東太初”,基于這個(gè)全棧國(guó)產(chǎn)化平臺(tái),以多模態(tài)大模型為核心打造的虛擬人“小初”,圖片、文字、語(yǔ)音都能理解,真實(shí)呈現(xiàn)了圖片、文字、語(yǔ)音三種模態(tài)的關(guān)聯(lián)與協(xié)同能力,再次縮短了人工智能與人類(lèi)想象力的距離。
2021年9月28日,浪潮人工智能研究院發(fā)布人工智能巨量模型——源1.0,它發(fā)布時(shí),已幾乎讀完了近5年的中文互聯(lián)網(wǎng)浩瀚內(nèi)容。
浪潮信息副總裁劉軍表示,巨量化的一個(gè)核心特征就是模型參數(shù)多、訓(xùn)練數(shù)據(jù)量大。源1.0參數(shù)量高達(dá)2457億,訓(xùn)練數(shù)據(jù)集規(guī)模達(dá)到5000GB。
如中國(guó)工程院院士王恩東所言,讓機(jī)器像人類(lèi)一樣具有邏輯、意識(shí)和推理等認(rèn)知能力,一直是計(jì)算機(jī)科學(xué)探索、研究的重要方向。在較好解決“感知智能”問(wèn)題后,這輪人工智能的發(fā)展,已經(jīng)進(jìn)入通過(guò)各種創(chuàng)新解決更復(fù)雜的“認(rèn)知智能”問(wèn)題的發(fā)展階段。
黃鐵軍說(shuō):“人工智能是新一代產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力,它的發(fā)展已經(jīng)從‘大煉模型’逐步邁向‘煉大模型’。通過(guò)設(shè)計(jì)先進(jìn)的算法,整合盡可能多的數(shù)據(jù),匯聚大量算力,集約化地訓(xùn)練大模型,供大量企業(yè)使用,是必然趨勢(shì)!
(責(zé)任編輯:歐云海)