百度大腦打造人工智能時代的驅動引擎 三大技術產品重磅發布
2021-12-29 10:27:42  來源: 南早網  
1
聽新聞

作為百度AI多年技術積累和業務實踐的集大成,百度大腦已發展成為全球領先的人工智能平臺。12月28日,百度Create AI開發者大會“百度大腦論壇”舉辦。論壇圍繞打造人工智能時代的驅動引擎展開探討,帶來了百度大腦語言與技術、語音和視覺等多項技術產品的發布,以及飛槳在開源算法模型、產業級模型庫和企業級AI應用開發等方面的全新升級。

百度大腦語言與知識技術全布局,三大技術產品重磅發布

百度技術委員會主席吳華在論壇上表示,經過11年的發展,百度已形成了完整的語言與知識技術布局,包括知識圖譜、語言理解與生成技術和應用系統等。隨后,吳華帶來了三大技術產品的發布:全球首個知識增強超大模型鵬城-百度·文心,全球最大中文跨模態生成模型 ERNIE ViLG,以及首個百億參數中英對話預訓練生成模型 PLATO-XL,實現了知識增強大模型、跨模態文圖生成、人機對話等領域的世界領先。

特別是全球首個千億知識增強的大模型鵬城—百度·文心,得益于鵬城實驗室的算力系統“鵬城云腦Ⅱ”和飛槳深度學習平臺的強強聯手,解決了超大模型訓練的多個公認技術難題,使訓練效率大幅提升,模型效果更優。鵬城-百度·文心已經在機器閱讀理解、文本分類、語義相似度計算等60多項任務取得最好效果,并在30余項小樣本和零樣本任務上刷新基準。

基于百度的語言與知識技術,百度也面向各行業開放了語言與知識開放平臺。不僅包含開源數據集“千言”和知識生產平臺“解語”,還研發了面向應用的能力引擎平臺和知識中臺,以及智能文檔分析平臺、智能對話定制平臺、智能創作平臺、翻譯開放平臺和內容審核平臺等場景定制平臺。

百度語音技術重要進展,SMLTA2全新發布

語音和語言天生更接近,因此,把語音識別模型和語義模型進行一體化后的準確率和交互成功率會大幅提升。百度語音首席架構師賈磊介紹了百度多模態語音交互的最新進展。百度提出的基于歷史信息抽象的流式截斷Confomer建模技術——SMLTA2,解決了傳統的自相關技術在進行長句識別時的計算爆炸問題和存儲爆炸問題,也很好地解決了注意力模型的焦點丟失問題。

SMLTA2通過Decoder到Encoder各層的注意力特征選擇機制來引入反饋,使得最外層識別結果信息可以直接作用于編碼器內部的每一層的編碼過程,通過歷史信息抽象充分提取有效特征信息,顯著改善了Transformer模型從NLP領域應用到語音識別領域面臨的各種問題。SMLTA2的這種全新的端到端建模方法,是對傳統Encoder-Decoder結構的端到端建模的結構性創新。

最后,賈磊還介紹了SMLTA的實際商業落地情況。浦發銀行在全國多個營業廳上線了語音交互系統,其中位于上海外灘的銀行網點語音交互識別率測試達到93.51%,語音交互已經由完全不可用變成基本可用。

智能視頻創作,計算機視覺的最新實踐

百度視覺技術部總監丁二銳重點介紹了計算機視覺在智能視頻創作中的最新進展?,F階段,視頻內容生產正在由UGC(用戶生成內容)向AIGC(AI 生產內容)轉變。

智能視頻創作是一個多技術交叉融合的領域,對于一個創作者而言,同時掌握視覺生成、多模態、3D圖形學并不現實,但百度智能視頻制作技術兼顧內容創意和視頻功能創作,不僅實現了對人臉、人體的精細處理和環境的再塑造,在創作方法上,改善存量視頻并獲取新增視頻,保障了視頻的充足展現和分發。

丁二銳表示,智能視頻創作領域目前呈現蓬勃發展的態勢,技術的發展帶來了生產工具的變革,一旦與其他生產要素結合,將帶來無盡的想象力。

飛槳產業級平臺再升級,讓AI應用門檻更低

除了技術上的融合創新,在工具與平臺方面,飛槳從開源算法模型、產業級模型庫和企業級AI應用開發等方面實現升級,持續降低AI應用的門檻。

百度杰出架構師畢然分享道,目前百度飛槳官方支持的產業級開源算法模型超過400個,覆蓋計算機視覺、自然語言處理、語音和推薦等眾多深度學習應用領域。這樣全面覆蓋,使開發者可以很快地找到所需要的模型。并且這些產業級模型庫實現了訓練部署的全流程支持,開發套件支持靈活配置化調優。

畢然還詳細介紹了飛槳最新推出的產業實踐范例庫。針對產業實際場景的AI應用,范例庫提供完整的代碼實現,覆蓋任務解析、算法選擇、模型訓練及優化、推理部署及結果可視化等產業落地全流程,讓開發者快速上手,所學即所用。

百度智能云AI產品研發部總監忻舟介紹了飛槳企業版AI開發雙平臺EasyDL和BML在幫助開發者快速提升AI開發效率和資源使用效能的上的有效助力。

目前,飛槳企業版已經成為應用和落地最廣泛的AI開發平臺?;陔p平臺的開發模式,同時滿足AI應用開發者和AI算法開發者的需求?;陲w槳推理部署工具鏈,飛槳企業版已經為開發者測試并驗證了9345種模型芯片的組合,能夠覆蓋95%的適配需求,能夠節省開發者97%的自行適配開發時間。PaddleSlim結合全自動的模型組合壓縮算法,能夠使精度損失控制在1%以內時,推理的性能提升3到5倍;智能邊緣控制臺的推出,則大幅提升模塊和系統集成的效率,集成的周期可以從天縮短到五分鐘。

百度知識圖譜部、大數據部高級總監朱勇詳細介紹了在工業領域,百度打造的工業數據智能引擎如何降低AI的應用門檻。

朱勇表示,隨著產業數字化進程不斷深入,大數據的應用趨勢也逐漸從業務數據化發展到數據智能化,工業數據智能前景廣闊,機遇和挑戰并存。百度基于領先的人工智能大數據技術,面向工業場景,打造了一套完整的工業數據智能引擎。它向下對接大數據平臺,實現數據治理,向上支撐各種類型的業務場景需求,賦能電力能源、鋼鐵、化工、汽車制造等不同行業。百度工業數據智能引擎的核心是一系列可復用的工業模型以及支持定制化模型搭建的核心組件,包括數據分析、數據處理、AI算法和工業機理。

以鋼鐵行業為例,為了保證鍍鋅板具有良好的力學性能,需要根據鋼板的原料信息對鍍鋅工藝參數進行必要的調整?;诎俣裙I數據智能引擎可以進行力學性能預測,達到90%以上的準確率, 通過工藝參數尋優,產品合格率達到99%。通過應用這套方案,企業客戶不僅能夠提升產品質量;相比傳統基于人工經驗的方式,還能大幅降低調試時間,從而提升生產效率。

最后,朱勇強調,在大數據和AI加速向工業滲透的背景下,工業數據智能前景可期。百度期待攜手更多開發者,共同助力工業智能化升級。

接下來,百度大腦將持續進化,不斷推動AI技術提升,通過融合創新,讓AI能力越來越強,與此同時,降低AI應用的門檻,讓技術的落地更加簡單,幫助越來越多行業和企業借助AI提升效率,創造價值。

爆乳奶水直流在线播放动漫