記者郭美婷 實習(xí)生麥子浩 廣州報道
(資料圖片僅供參考)
在發(fā)布“通義千問”不到兩個月后,阿里云基于大模型在AI音視頻賽道打出了一槍。
6月1日,阿里云宣布通義大模型進(jìn)展,聚焦音視頻內(nèi)容的AI新品“通義聽悟”正式上線,成為國內(nèi)首個開放公測的大模型應(yīng)用產(chǎn)品。
今年以來,國產(chǎn)AI大模型賽道熱鬧非凡,各家廠商、機構(gòu)的大模型接踵而至,應(yīng)接不暇。最新數(shù)據(jù)顯示,截至目前,我國10億級參數(shù)規(guī)模以上大模型已發(fā)布79個。
相比于集體宣布搶發(fā)AI大模型,未來,如何基于大模型研發(fā)針對行業(yè)細(xì)分領(lǐng)域的垂直的模型更加重要。各路人馬已有動向。“百模大戰(zhàn)”的下一個新擂臺,已然搭起。
國內(nèi)首個開放公測大模型應(yīng)用產(chǎn)品
開會AI幫忙記錄,還能幫忙總結(jié)、提取重點和整理待辦事項?
6月1日,阿里云宣布通義大模型進(jìn)展,聚焦音視頻內(nèi)容的AI新品“通義聽悟”正式上線,成為國內(nèi)首個開放公測的大模型應(yīng)用產(chǎn)品。
從現(xiàn)場演示可以看到,通義聽悟接入了通義千問大模型的理解與摘要能力,能夠完成對音視頻內(nèi)容的轉(zhuǎn)寫、檢索、摘要和整理,比如用大模型自動做筆記、整理訪談、提取PPT等。聽悟還與阿里云盤打通,同時支持云盤導(dǎo)入和本地上傳。
阿里云CTO周靖人介紹,聽悟集成了阿里最先進(jìn)的語音和語言技術(shù)。其內(nèi)置阿里新一代工業(yè)級語音識別模型,識別準(zhǔn)確率極高;融合自研語音語義多模態(tài)說話人算法,能對10人以上說話場景進(jìn)行角色區(qū)分;接入通義千問大模型后,能夠?qū)ι先f字的音視頻內(nèi)容進(jìn)行摘要總結(jié),支持跨多音視頻內(nèi)容的精準(zhǔn)問答理解。
聽悟技術(shù)負(fù)責(zé)人鄢志杰向記者表示,通義聽悟的前身是阿里云內(nèi)部一個名為“聽悟”的產(chǎn)品,主要為投資部、HR等部門做項目會議的音頻轉(zhuǎn)寫功能,在2022年,這款產(chǎn)品的潛力逐步被挖掘,內(nèi)部開始思考其工具屬性是不是要發(fā)生變化。
“工具是什么呢?人還是支配他的,基本上它不會比你更聰明,也不會比你懂得更多。但是,大模型能力跟工具應(yīng)用相結(jié)合變成助手以后,它甚至能給到建議啟發(fā)你,知曉你不知道的知識,留意到你之前沒有留意的細(xì)節(jié)。”鄢志杰說。
繼此前阿里云降價之后,此次聽悟同樣推出免費使用體驗,聽悟用戶可通過每日登陸等多種任務(wù)領(lǐng)取免費轉(zhuǎn)寫時長。公測期間,阿里云官方微博、微信及各大平臺社區(qū)還會發(fā)放大量20小時轉(zhuǎn)寫口令碼,用戶獲得的福利權(quán)益可累加,一年內(nèi)有效,免費時長可高達(dá)100小時以上。
周靖人表示,聽悟發(fā)布公測版后,希望更多人能夠體驗到該產(chǎn)品,真正把大模型的能力變成工作學(xué)習(xí)的AI助手。在接下來的階段,聽悟也將陸續(xù)推出增強版,到時候會有一些商業(yè)化的安排。
“百?!蓖瞥鲋?/strong>
ChatGPT帶火了國內(nèi)AI大模型市場,5月28日發(fā)布的《中國人工智能大模型地圖研究報告》顯示,截至目前,我國10億級參數(shù)規(guī)模以上大模型已發(fā)布79個。距離實現(xiàn)真正的“百模”,已然不遠(yuǎn)。
此前,中國工程院院士、清華大學(xué)計算機科學(xué)與技術(shù)系教授鄭緯民接受記者采訪時,ChatGPT的爆紅源于其能流暢地與人對話、寫詩,甚至作畫,但未來AI大模型所帶來的貢獻(xiàn)應(yīng)不止于此,如何基于大模型研發(fā)針對行業(yè)細(xì)分領(lǐng)域的垂直的模型更加重要。
各家企業(yè)、機構(gòu)也在緊鑼密鼓地發(fā)展大模型、打磨基于大模型的應(yīng)用。
阿里云推出通義聽悟時,距離“通義千問”的發(fā)布還不到兩個月的時間。周靖人對記者表示,目前外界對大模型要求很高,從通義千問發(fā)布以來,阿里云也陸陸續(xù)續(xù)做了大量工作,并在全國開始部署AI的模型。同時,在云的底層通過一系列模型優(yōu)化不斷降低模型使用的成本,降低模型所使用的資源,只有這樣能夠讓模型真正意義大規(guī)模去服務(wù)社會。
對比阿里云發(fā)布國內(nèi)首個開放公測的大模型應(yīng)用產(chǎn)品,百度則帶著國內(nèi)首個大模型基金而來。
5月31日,百度正式宣布設(shè)立規(guī)模為10億元的“百度文心投資基金”,重點投資孵化大模型領(lǐng)域的優(yōu)質(zhì)創(chuàng)業(yè)企業(yè),為其提供包括資金、技術(shù)、人才在內(nèi)的一站式資源。另外,創(chuàng)始人李彥宏正式宣布啟動百度“文心杯”創(chuàng)業(yè)大賽,致力于尋找大模型時代的“game-changing founder”,參賽創(chuàng)業(yè)者將有機會獲得來自百度集團(tuán)的1000萬元投資。
在最近的財報電話會議上,騰訊方面也表示AI基礎(chǔ)模型“混元”取得良好進(jìn)展,模型構(gòu)建進(jìn)展順利。其業(yè)務(wù)部門稱,目前正積極對訓(xùn)練部門及生產(chǎn)線擴容,相信未來人工智能將在不同領(lǐng)域有所應(yīng)用。
據(jù)悉,騰訊已成立類ChatGPT對話式產(chǎn)品項目組“混元助手”。該項目組將聯(lián)合騰訊內(nèi)部多方團(tuán)隊構(gòu)建大參數(shù)語言模型,目標(biāo)是通過性能穩(wěn)定的強化學(xué)習(xí)算法訓(xùn)練,完善騰訊智能助手工具,打造騰訊智能大助手,并能成為國內(nèi)的業(yè)界標(biāo)桿。
標(biāo)簽:
熱門