999精品,丝袜综合,大陆老熟妇性,中国老女人AV,亚洲精品国产第一区二区三区

“國產(chǎn)GPT”如何走穩(wěn)突圍之路
發(fā)布時間:2023-05-08 15:53:12 文章來源:新華日報
當前位置: 主頁 > 資訊 > 國內(nèi) > 正文

ChatGPT一夜火遍全球,以簡單的語言聊天交互形式吸引大量普通用戶。當下,以ChatGPT為代表的人工智能大模型領(lǐng)域日新月異、硝煙漸起,國內(nèi)越來越多的企業(yè)競相加入戰(zhàn)局,發(fā)布新產(chǎn)品、成立新公司,參與激烈的全球競爭。人工智能熱潮涌動,國內(nèi)互聯(lián)網(wǎng)廠商能否突出重圍?


(相關(guān)資料圖)

“百模大戰(zhàn)”已開啟

4月18日,百度、字節(jié)跳動、金山辦公等6家頭部企業(yè)同時發(fā)布關(guān)于大模型的重要消息。百度“文心一言”大模型全面應(yīng)用內(nèi)部智能工作平臺“如流”;釘釘宣布正式接入阿里巴巴“通義千問”大模型測試;字節(jié)跳動旗下火山引擎發(fā)布自研DPU(數(shù)據(jù)處理單元)芯片、大模型訓練云平臺等;金山辦公宣布將推出具備大語言模型能力的生成式人工智能應(yīng)用——WPS AI;APUS在北京推出1000億個參數(shù)、自研多模態(tài)的天燕大模型AiLMe,以及基于其技術(shù)的7款AI消費端應(yīng)用App;斑馬智行宣布接入“通義千問”大模型測試,智己汽車成為首個上車品牌。

國內(nèi)群雄爭霸劍指何方?多家頭部大廠在發(fā)布會上給出相似的答案:利用類GPT技術(shù),讓產(chǎn)品變得更“聰明”。

“之前選擇云廠商更多看算力、存儲等基礎(chǔ)云服務(wù);未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應(yīng)用之間的協(xié)同。”記者從百度獲悉,“文心一言”是百度繼“文心一格”之后推出的新一代大語言模型,在繼承文心大模型“知識增強”“產(chǎn)業(yè)級”等核心特性的同時,延續(xù)“降低應(yīng)用門檻”的發(fā)展路線?!拔男囊谎浴睂⑼ㄟ^百度智能云對外提供服務(wù),根本改變云計算市場的游戲規(guī)則,“這一趨勢下,百度‘云智一體’將為產(chǎn)業(yè)帶來AI普惠,同時收獲更高的云計算市場份額,云服務(wù)將從數(shù)字時代躍遷至智能時代?!?/p>

如何用大模型賦能實體經(jīng)濟?以“文心一言”大模型為例,其將支持更多企業(yè)構(gòu)建自己的模型和應(yīng)用,賦能交通、能源、制造等實體經(jīng)濟領(lǐng)域,提升生產(chǎn)效能。例如,Apollo將“文心一言”融入智能汽車,讓智能汽車不僅有“智商”還有“情商”,“可以說,汽車機器人將首次擁有人格,我們描述一輛汽車,不再是冷冰冰的參數(shù),而是‘溫柔、貼心’甚至‘高冷’這樣的形容。”

釘釘接入阿里巴巴“通義千問”大模型,用一條斜杠完成了進化。根據(jù)現(xiàn)場演示,用戶只需在對話框里輸入“/”,便可以喚起10多項能力,完成內(nèi)容生成、摘要提取、應(yīng)用開發(fā)等諸多工作。阿里云相關(guān)負責人表示,“通義千問”是阿里云推出的類ChatGPT大模型,其基于阿里巴巴達摩院“通義”大模型技術(shù)研發(fā),在文本理解、文本生成、多輪對話等大語言模型(LLM)基礎(chǔ)能力方面表現(xiàn)突出,并正在以周為單位進行優(yōu)化迭代。“今后,阿里所有產(chǎn)品將接入‘通義千問’進行全面改造,釘釘、天貓精靈率先接入測試,將在評估認證后正式發(fā)布新功能?!?/p>

各自修煉“看家本領(lǐng)”

ChatGPT、Bard、“文心一言”背后的關(guān)鍵技術(shù)都是大模型。業(yè)內(nèi)專家認為,動輒超千億參數(shù)的大模型研發(fā),不是單一的算法問題,也不是靠簡單堆積GPU就能實現(xiàn)的,這是囊括了底層算力、網(wǎng)絡(luò)、存儲、大數(shù)據(jù)、AI框架、AI模型等復雜技術(shù)的系統(tǒng)性工程,需要AI-云計算的全棧技術(shù)能力。

大模型好不好用到底取決于什么?工信部語言信息智能處理及應(yīng)用重點實驗室副主任、江蘇省人工智能學會模式識別專業(yè)委員會委員、南京理工大學教授夏睿告訴記者,預訓練語言模型的基本技術(shù)架構(gòu)包括編碼器、解碼器和編解碼一體化3種。國產(chǎn)大模型大多建立在上述架構(gòu)之上,結(jié)合各家前期積累,各有特色。目前看來,不同架構(gòu)對于大模型能力的影響并非最大,相比而言,語料的規(guī)模及質(zhì)量、代碼數(shù)據(jù)的有效利用、人類反饋的設(shè)計使用以及大規(guī)模數(shù)據(jù)的訓練技巧,是決定大模型性能的更關(guān)鍵因素。

阿里相關(guān)負責人表示,阿里巴巴達摩院在NLP(自然語言處理)等前沿科研領(lǐng)域布局多年的基礎(chǔ)上,于2019年啟動大模型研發(fā)。2021年,阿里先后發(fā)布國內(nèi)首個超百億參數(shù)的多模態(tài)大模型M6及語言大模型PLUG;同年8月,阿里大模型在全球機器視覺問答榜單VQA上首超人類得分;2022年2月,M6實現(xiàn)可同時完成10余項單模態(tài)及多模態(tài)任務(wù),最大程度打通了AI感官;2022年9月,阿里發(fā)布集成歷年技術(shù)沉淀的“通義”大模型系列,相關(guān)核心模型和技術(shù)通過魔搭社區(qū)開源開放,為國內(nèi)大模型發(fā)展提供一臂之力。

近日,阿里云宣布將與OPPO安第斯智能云聯(lián)合打造OPPO大模型基礎(chǔ)設(shè)施,基于“通義千問”完成大模型的持續(xù)學習、精調(diào)及前端提示工程,未來建設(shè)服務(wù)于其海量終端用戶的AI服務(wù)。同時,中興通訊、吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌閱科技(603533)等多家企業(yè)向阿里云提出合作意愿,將與阿里云在大模型相關(guān)場景展開技術(shù)合作的探索和共創(chuàng)。

“百度之所以能快速推出‘文心一言’,是因為深度學習、自然語言處理、語言大模型等技術(shù)都是‘原產(chǎn)’的,可以說,百度為此積累了20年?!卑俣缺硎荆俣仍阉鞯暮诵募夹g(shù)——自然語言理解,并基于搜索引擎,演化出語音、圖像、知識圖譜、自然語言處理等人工智能技術(shù),“百度在人工智能的四層架構(gòu)中,有全棧布局,包括底層的芯片、飛槳深度學習框架、大模型以及最上層的搜索等應(yīng)用。而ChatGPT、‘文心一言’類技術(shù)位于模型層?!?/p>

2022年是大模型產(chǎn)業(yè)化應(yīng)用元年,大模型成為許多上層應(yīng)用的技術(shù)底座。而百度“文心”已經(jīng)累計發(fā)布11個行業(yè)大模型,并以“知識增強”為核心,實現(xiàn)從單模態(tài)大模型到跨模態(tài)、從通用基礎(chǔ)大模型到跨領(lǐng)域、跨行業(yè)模型,持續(xù)突破和創(chuàng)新。

“每天,文心大模型服務(wù)數(shù)十億次用戶搜索請求,在中文語言樣本訓練上具有先天優(yōu)勢。”百度介紹,文心大模型具備中文領(lǐng)域最先進的自然語言處理能力,其先進性不僅體現(xiàn)為對中文語言的理解,還體現(xiàn)為對中國文化的理解,從而更適合中國市場。

目前,國產(chǎn)大模型奮起直追,百花漸次開放。但在基礎(chǔ)理論、標注數(shù)據(jù)、芯片算力等方面與國際頂尖技術(shù)相比還存在一定差距。夏睿解釋,“OpenAI在GPT系列模型、強化學習算法、自動編程等領(lǐng)域積累了大量先進技術(shù),具有豐富的數(shù)據(jù)資源和算力支持,以及多領(lǐng)域的應(yīng)用經(jīng)驗,同時還在不斷研發(fā)新型大模型版本,因此難以在短時間內(nèi)趕超。”但他也表示,近幾年我國自然語言處理技術(shù)進步很快,“我們也不宜妄自菲薄,在追趕過程中,需要給國產(chǎn)大模型一些時間?!?/p>

夏睿告訴記者,人工智能領(lǐng)域從“0”到“1”的原創(chuàng)性、顛覆性創(chuàng)新,如Transformer、預訓練語言模型、ChatGPT等,多數(shù)源于國際頂尖互聯(lián)網(wǎng)科技公司,而我國人工智能技術(shù)更擅長從“1”到“N”,處于跟隨地位,創(chuàng)新模式以應(yīng)用創(chuàng)新、集成創(chuàng)新為主。“大模型依賴高質(zhì)量的標注數(shù)據(jù),中英文優(yōu)質(zhì)語料方面存在較大差距?!彼J為,我國需要加強構(gòu)建涵蓋多個領(lǐng)域和類型,更豐富、更優(yōu)質(zhì)的數(shù)據(jù)資源和標注規(guī)范。同時,強大的算力是構(gòu)建大模型的基礎(chǔ),目前大模型算力主要由GPU支撐,而芯片領(lǐng)域的問題也在一定程度上限制和延緩了我國大模型技術(shù)的發(fā)展。

大模型的未來發(fā)展路徑

人類獲取知識的方式有視覺、語言、聽覺等,它們在人腦中匯聚,將輸入的不同形式內(nèi)容貫通起來。因此,許多業(yè)內(nèi)專家認為,未來多模態(tài)大模型需要做到多模態(tài)的信息在高維空間實現(xiàn)有機融合。

“‘通義千問’既不是起點也不是終點,而是既定路線上的一個節(jié)點?!卑⒗镌浦悄蹸TO周靖人表示,阿里還處在不斷探索基于多模態(tài)大模型的路徑上,未來需要進一步突破創(chuàng)新。比如,如何把各個模態(tài)的模型能力融入同一個模型,是大模型探索過程中很重大的一項挑戰(zhàn)。

2022年,阿里云在業(yè)界首次提出“Model as a Service”(MaaS,模型即服務(wù))概念,并聯(lián)合生態(tài)伙伴聯(lián)合推出國內(nèi)首個“模型即服務(wù)”開放平臺魔搭社區(qū),匯集行業(yè)領(lǐng)先的預訓練模型,減少開發(fā)者的重復研發(fā)成本。目前,魔搭社區(qū)已與10多家頂尖人工智能機構(gòu)合作,以開源的方式提供超1600個優(yōu)質(zhì)模型,匯集行業(yè)和學術(shù)熱門的公開數(shù)據(jù)集以及相關(guān)專業(yè)領(lǐng)域數(shù)據(jù)集。

“AI開發(fā)的門檻會越來越低,我們希望,未來連小學生也能開發(fā)自己想要的模型,為此需要打造新的開發(fā)范式。一方面,我們認為MaaS是未來人工智能發(fā)展的重要方向,或?qū)⒋龠MAI產(chǎn)業(yè)界的大發(fā)展;另一方面,MaaS對基礎(chǔ)設(shè)施提出新要求,特別是和云計算基礎(chǔ)設(shè)施的深度融合,也帶來新的AI工具的機會?!敝芫溉苏f。

基礎(chǔ)研究是重大原始創(chuàng)新、顛覆性技術(shù)、現(xiàn)象級產(chǎn)品的源泉,但同時又存在周期長、難度大、風險高等現(xiàn)實問題。夏睿認為,從事基礎(chǔ)研究不能過于急功近利,OpenAI團隊以追求通用人工智能為理念,不因KPI和短期利益影響和否定發(fā)展路線,持續(xù)積累創(chuàng)新,最終才獲得ChatGPT的成功?!皣鴥?nèi)也需要一批有理想有情懷的科研人員,更需要營造鼓勵基礎(chǔ)科研、保障潛心致研的科研生態(tài)?!?/p>

未來,國內(nèi)通用人工智能如何發(fā)展?夏睿分析,一方面,ChatGPT是通往通用人工智能目前最可能的一條路徑,但不是唯一途徑。他表示,目前大模型主要基于連接主義,具有過度依賴數(shù)據(jù)、缺乏解釋性、難以邏輯推理等缺點,“需要引入符號主義,發(fā)展具有可解釋性的、可信和安全的人工智能。”

另一方面,大模型技術(shù)本身存在的問題需要逐個擊破。夏睿舉例說,包括大模型涌現(xiàn)能力原理的揭示、大模型生成內(nèi)容的事實正確性、大模型與真實物理世界的交互性、大模型的壓縮與輕量化、大模型實時性學習、細分專業(yè)領(lǐng)域的知識獲取與推理、大模型性能評估體系等。

企業(yè)根據(jù)獨特行業(yè)場景訓練專屬GPT產(chǎn)品,是GPT發(fā)展的又一“未來式”。據(jù)悉,阿里將開放“通義千問”的能力,企業(yè)在阿里云上既可以調(diào)用“通義千問”的全部能力,也可以結(jié)合行業(yè)知識和應(yīng)用場景,訓練自己的企業(yè)大模型。比如,每個企業(yè)都可以有自己的智能客服、智能導購、智能語音助手、文案助手、AI設(shè)計師、自動駕駛模型等,而阿里云將提供完備的算力和大模型基礎(chǔ)設(shè)施,實現(xiàn)“個性化生長”。

標簽:

最近更新