跨越奇點,對齊未來。
近年來,隨著以GPT為代表的大模型技術不斷演進,“通用性”成為人工智能發(fā)展的最新注腳。在業(yè)內看來,通用人工智能技術能夠賦予產(chǎn)業(yè)發(fā)展新動力(300152)。
近日,在由、北京人工智能產(chǎn)業(yè)聯(lián)盟元宇宙專業(yè)委員會、中國文化產(chǎn)業(yè)協(xié)會文化元宇宙專業(yè)委員會主辦的“21世紀卓越董事會人工智能閉門會”上,多位專家、學者、企業(yè)高管共話“AI領域上市公司創(chuàng)新涌現(xiàn)、技術難題與發(fā)展路徑”。
(資料圖)
對于通用人工智能技術發(fā)展,工信部賽迪研究院電子信息研究所副所長陸峰表示,“人工智能已經(jīng)從專用人工智能發(fā)展到通用人工智能的臨界點,要高度重視未來人工智能化時代,人工智能應用將無處不在?!?/p>
與此同時,我國一大批科技企業(yè)正相繼布局大模型技術與產(chǎn)業(yè)化落地,應用行業(yè)也正從辦公、生活、娛樂等方向,向醫(yī)療、工業(yè)、教育等領域加速拓展。會上,多位參會嘉賓共同探討了應用落地探索與挑戰(zhàn)的話題。
通用人工智能勢起
中國科學技術信息研究所、科技部新一代人工智能發(fā)展研究中心聯(lián)合相關研究機構編寫的《中國人工智能大模型地圖研究報告》顯示,中國自2020年起進入大模型快速發(fā)展期,現(xiàn)已在大模型方面建立起涵蓋理論方法和軟硬件技術的體系化研發(fā)能力,形成緊跟世界前沿的大模型技術群。
從政策面來看,4月28日的中央政治局會議明確指出,要重視通用人工智能發(fā)展,營造創(chuàng)新生態(tài)。
5月5日的二十屆中央財經(jīng)委一次會議再次強調,要把握人工智能等新科技革命浪潮。
為推動人工智能創(chuàng)新發(fā)展,北京、上海、深圳等多地紛紛出臺相關支持舉措,集聚人工智能創(chuàng)新資源,搶抓大模型機遇,開展大模型創(chuàng)新算法及關鍵技術研究,打造人工智能創(chuàng)新高地。
據(jù)中國信通院測算,2022年我國人工智能核心產(chǎn)業(yè)規(guī)模達5080億元,同比增長18%。與垂直人工智能相比,通用人工智能已經(jīng)不局限于處理單一任務,實現(xiàn)了跨領域、跨學科、跨任務和跨模態(tài)的應用。
在陸峰看來,人工智能經(jīng)過幾次高潮和低潮,目前正經(jīng)歷第三次高潮非常關鍵的時刻。隨著人工智能技術、算力、算法不斷突破,為從數(shù)字化、網(wǎng)絡化到智能化的跨越發(fā)展奠定了一些基礎性的條件。
因此,他認為,要充分關注應用需求的緊迫性?!拔磥砗芏囝I域由于人口結構的變化,由于很多新生代對于傳統(tǒng)勞動環(huán)境的不適應,所以必須要以機器來換人?!标懛逭f。
根據(jù)IDC預測,2023年企業(yè)在 智能技術上的投 將達到1540億美元,增 27%,這或許意味著今后 智能將釋放巨 的市場需求。
中國科學院科技戰(zhàn)略咨詢研究院研究員周城雄認為,人工智能的發(fā)展有兩個邏輯在起作用,一個是技術邏輯,還有一個是政策邏輯,可以說當前政策邏輯在其中起著很大的作用。
他指出,中國人工智能政策方面,包括《中國制造2025》、《新一代人工智能發(fā)展規(guī)劃》等相繼出臺。近期網(wǎng)信辦發(fā)布《生成式人工智能服務管理辦法(征求意見稿)》,對生成式人工智能,包括社會公德、個人信息、數(shù)據(jù)方面將進行規(guī)范。
周城雄認為,社會主體的價值在于加速人類體力、腦力和創(chuàng)新能力的解放,現(xiàn)在人工智能是加速人類創(chuàng)新能力的解放。他進一步指出,近期調研中,已經(jīng)明顯感受到人工智能逐漸發(fā)揮更多的作用。
“現(xiàn)在高校實驗室有一些實驗都是機器人在完成,有的人工智能技術還可以閱讀上萬篇文獻后寫出一個文獻摘要,還有的通過關鍵詞輸入就可以寫學術論文?!敝艹切郾硎尽?/p>
技術端、產(chǎn)業(yè)化對齊未來
“不管元宇宙也好,還是AIGC也好,都是在提升效率。在整個AIGC的應用過程中,做垂類的應用是有很多空間的。實際上GPT出現(xiàn)以后,以前的一些人工智能模型也還是可以優(yōu)化的?!北本┤斯ぶ悄墚a(chǎn)業(yè)聯(lián)盟元宇宙專委會主任、大數(shù)據(jù)分析與應用技術國家工程實驗室網(wǎng)信智能中心副主任顏陽指出。
顏陽認為,人工智能除了要有技術上的突破,還要有商業(yè)模式的突破。在突破技術瓶頸的過程中間一定要找準自己的商業(yè)模式,很多不是大流量平臺的機構肯定做不到OPENAI平臺那種對C端市場的梅特卡夫效應,但是要非常關注整個過程在B端市場的雙邊市場效應。
他表示,從技術角度看GPT,它現(xiàn)在最根本依賴的Transformer模型,其底層較多涉及向量矩陣的點積計算,因此通過硬件在處理這些運算時還有很多的優(yōu)化空間。因此,綜合考慮存儲、傳輸和計算的整體影響,通用GPU大概率開始向專門支持Transformer的AI加速的方向轉移。
另外,顏陽認為,根據(jù)Transformer的基本原理來看,很多模型可以做優(yōu)化的,例如不一定需要同時加入編碼器和解碼器等等,而需要根據(jù)場景來做匹配。未來在整個生態(tài)過程當中,有可能是群雄逐鹿。
但他同時指出,整個GPT模型也并非一股腦往大做就是最好,因為根據(jù)有關機構測試表明,大模型大數(shù)據(jù)的模型在訓練時的損失也會很大,但如果從U形的兩頭突破(也即是小數(shù)據(jù)大模型或是大數(shù)據(jù)小模型),可能是中國“沙丁魚”出圈的契機。
在他看來,金融行業(yè)或許會有很大的應用空間?,F(xiàn)在金融行業(yè)應用較少,部分原因是用一些大模型對數(shù)據(jù)精準的計算不太友好,但現(xiàn)在開源模型稍微修改以后對結構化的數(shù)據(jù)反而很有效。前幾年用邏輯回歸都能做到這種程度,現(xiàn)在有大模型加持的情況下,把使用門檻大幅度降低,海外已經(jīng)有對小盤股股指做預測的實驗室案例。
另外在科學研究領域,他認為,大模型在結構生物學方面也還是有很大空間,雖然說Alphafold2此前在蛋白質結構預測方面取得了重大成就,但還有很多涉及算力與數(shù)據(jù)不足的有待改善的方面,為我國在該領域的垂類應用帶來了非常大的想象空間。在IT領域里DBA(數(shù)據(jù)庫管理員)的工作也是相對復雜的,現(xiàn)在通過Text to SQL,也可以提升DBA工作的效率。
“我們也在做國產(chǎn)化,第一步先把開源做起來,例如我們把相關的代碼轉起來以后,就可以形成自己的開源生態(tài),例如現(xiàn)在虛擬空間的NPC都可以用AIGC形成,支持商業(yè)合作伙伴直接使用,如果他們用起來非常方便,也非常低廉,此后便可以開始進行循環(huán)迭代?!鳖侁柗Q。
“以前說是奇點已來,現(xiàn)在我們期望:跨越奇點,對齊未來?!鳖侁柋硎?。
應用落地探索與挑戰(zhàn)
人工智能在大模型泛化的過程中,企業(yè)更多是立足于自身背景和產(chǎn)業(yè)優(yōu)勢進行布局。會上,多位科技企業(yè)負責人提到了在研發(fā)以及應用落地的過程中面臨的挑戰(zhàn)。
昆侖萬維(300418)(300418.SZ)CEO方漢介紹道,在商業(yè)化方面,公司采取To B跟To C并重的戰(zhàn)略。據(jù)悉,2022年12月,昆侖萬維正式發(fā)布“昆侖天工”,其AI生成能力已覆蓋圖像、音樂、文本、編程等內容模態(tài)。今年4月17日,昆侖萬維正式發(fā)布天工大語言模型。
B端方面,方漢總結道,如何把行業(yè)數(shù)據(jù)生成大模型可用的數(shù)據(jù)是最難的事情。他表示,國內非常多的企業(yè)都缺比較好的數(shù)據(jù),國內現(xiàn)在要To B的應用,要幫助所有行業(yè)把現(xiàn)有的知識推導過程給補上,不能光有題目跟答案,而要把推導過程給列出來,這樣才能讓各個行業(yè)去利用。
談及海外市場拓展,他認為中國企業(yè)最適合的是C端市場,在海外的C端市場可以做端到端的內容生成工具。“這個聽起來比較簡單,但實際上目前所有的AIGC工具都不是端到端的內容生產(chǎn)工具,而是素材生產(chǎn)工具。”方漢稱。
另外,在方漢看來,端到端內容生成工具仍有一個技術難點沒有解決,一旦解決了一致性的內容生成之后,整個影視行業(yè)、短視頻行業(yè)都會被顛覆,而且一致性視頻生成有望在1-3年之內取得突破。最遲3年以后,人類將可以用AI來生成一致性非常強的長視頻。
拓爾思(300229)(300229.SZ)拓天大模型預計在6月底前推出。會上,拓爾思副總裁林松濤表示,大模型技術場景落地中的挑戰(zhàn),主要是質量、可控、時效和成本。
質量方面,他認為,個人服務用ChatGPT,提示詞不準可以換一個,如果圖片生成不好也可以再換一個,可以說個人對AIGC的容忍度是很高的。但是企業(yè)不一樣,給政府寫顧問報告,數(shù)據(jù)來源必須是準確的。
可控層面,一是內容安全,數(shù)據(jù)是有價值觀的,模型沒有價值觀。二是私域數(shù)據(jù)安全,中國大模型要數(shù)據(jù)化落地,如何在保證用戶私有數(shù)據(jù)安全的同時將大數(shù)據(jù)較好地運用也是一個問題。
時效方面,在大數(shù)據(jù)訓練上,災難性的遺忘一直都是訓練的問題,所以需要大模型解決這個問題。另外,怎樣輸入即時數(shù)據(jù),類似Chat GPT,數(shù)據(jù)最新只到2021年9月,因此在To B服務的時候用不好。
成本方面,千億模型私有化落地的時候需要訓練好,在企業(yè)端落地還需要讓企業(yè)用得起。拓爾思做To B服務,垂直場景落地成為“百模大戰(zhàn)”的核心要點。
此外,中科聞歌于6月3日發(fā)布雅意大模型,推出了媒體、金融、宣傳等領域的大模型應用。會上,中科聞歌副總裁、首席產(chǎn)品官汪小東亦表示,當前做大模型有生態(tài)、場景、測評機制、算法等四方面的挑戰(zhàn)。
“生態(tài)方面,現(xiàn)在國內開源生態(tài)現(xiàn)在比較弱。場景方面,現(xiàn)在落地場景還比較少,存在場景的欠缺。用戶側如何貢獻數(shù)據(jù)也至關重要。國內成體系的較科學的模型測評機制尚欠缺。各家模型水平需科學公開公正評定,這樣才能規(guī)范市場,促進良性發(fā)展。同時,針對大模型幻覺等問題,算法上的持續(xù)創(chuàng)新和突破也是大的瓶頸?!蓖粜|稱。
標簽:
熱門