一大波“預(yù)演未來”的創(chuàng)新應(yīng)用來了

2022-12-05 07:11 來源：科技日報

[手機看新聞] [字號大中小] [打印本稿]

　　◎本報記者吳長鋒

　　近日，在2022科大訊飛全球1024開發(fā)者節(jié)發(fā)布會上，科大訊飛股份有限公司（以下簡稱科大訊飛）AI研究院副院長高建清以“AI新紀元，訊飛超腦2030”為主題，詳解“訊飛超腦2030計劃”階段性技術(shù)突破，一大波“預(yù)演未來”的創(chuàng)新應(yīng)用將走入日常生活。

　　高建清表示，實施“訊飛超腦2030計劃”，旨在突破人工智能共性基礎(chǔ)算法，攻克多模態(tài)感知、多維表達、認知智能、運動智能等核心技術(shù)，研究軟硬一體的機器人關(guān)鍵技術(shù)，探索虛擬人交互、機器人等方面的示范應(yīng)用。

　　突破兩個關(guān)鍵算法讓AI更好地學(xué)習(xí)、推理

　　“‘訊飛超腦2030計劃’的發(fā)展，離不開兩個關(guān)鍵算法的突破，無監(jiān)督學(xué)習(xí)和知識推理�！备呓ㄇ逭f，前者需要實現(xiàn)實用化、場景化的預(yù)訓(xùn)練技術(shù)，后者需要構(gòu)建基于知識檢索、決策以及融合的推理系統(tǒng)。

　　科大訊飛設(shè)計了基于無監(jiān)督學(xué)習(xí)的預(yù)訓(xùn)練模型，并創(chuàng)新地使用了少量有監(jiān)督數(shù)據(jù)進行優(yōu)化，大幅提升訓(xùn)練效率。高建清說：“預(yù)訓(xùn)練模型支持語音識別、聲紋識別、情感識別、多模態(tài)語音識別等多個任務(wù)，參數(shù)量少于業(yè)界公開模型，但訓(xùn)練效果卻十分顯著�！�

　　以回答“面包在低溫下會馬上發(fā)霉嗎”這一問題為例，機器要理解“低溫變質(zhì)慢”等常識，在引入海量知識的基礎(chǔ)上，要用預(yù)訓(xùn)練模型進行知識重要性排序，也要融合知識與問題進行推理，才能與人暢聊“面包變質(zhì)的二三事”。

　　科大訊飛還探索將神經(jīng)網(wǎng)絡(luò)與符號推理相結(jié)合，打造了知識推理系統(tǒng)，實現(xiàn)推理過程的可解釋性。在小學(xué)平面幾何題上，這個推理系統(tǒng)讓AI答題的正確率提升到90%的水平，顯著優(yōu)于傳統(tǒng)推理系統(tǒng)。

　　多模態(tài)語音增強技術(shù)讓AI的聲音有感情

　　在“訊飛超腦2030計劃”中，“唇形+語音”的多模態(tài)語音增強技術(shù)，實現(xiàn)了智能語音交互新模式。

　　“想要讓機器更自然地與人類進行交互，就需要通過聽覺、視覺、語義以及各種傳感器的組合讓機器獲取更多的有用信息，AI的感知方式必然要從單模態(tài)發(fā)展到多模態(tài)，逐步擬人化�！备呓ㄇ灞硎�。

　　如何讓機器的聲音媲美人類？高建清分享了科大訊飛在語音合成技術(shù)領(lǐng)域的新突破——多風(fēng)格多情感合成系統(tǒng)SMART-TTS。

　　高建清介紹，SMART-TTS可提供高興、抱歉、撒嬌、嚴肅、悲傷、困惑、害怕、鼓勵、生氣、安慰、寵溺等11種情感模式，每種情感模式依程度強弱不同分為20檔；SMART-TTS還具備對機器聲音的“個性化”設(shè)置功能，如停頓、重音、語速等，用戶可以根據(jù)自己的喜好調(diào)節(jié)。

　　當你漫步林蔭路，TA可以用字正腔圓的“播音腔”為你讀新聞；當你結(jié)束一天工作準備入睡，TA可以輕聲細語為你讀散文；當你驅(qū)車去公司上班，TA可以用你最喜歡的歌手的聲音告訴你走哪條路不堵車；當你和家人一起觀看紀錄片，TA還可以為紀錄片不同人物配音，人機交互表達自然、情感飽滿。

（責(zé)任編輯：歐云海）

免费毛片a在线观看67194,色丁狠狠桃花久久综合网,中文中字无码亚洲,曰本a级毛片无卡中文字幕,久久偷拍日本女孩,洲va久久久噜噜噜久久,欧美午夜一级艳片欧美精品

一大波“預(yù)演未來”的創(chuàng)新應(yīng)用來了

相關(guān)文章

一大波“預(yù)演未來”的創(chuàng)新應(yīng)用來了