大模型在各行各業(yè)遍地開花,這一次輪到零售金融賽道。8月28日,消費(fèi)金融巨頭馬上消費(fèi)在金融大模型發(fā)展論壇中發(fā)布其“天鏡”大模型,這也是國內(nèi)首個(gè)零售金融大模型。
與傳統(tǒng)通用大模型不同的是,金融大模型面對(duì)的更多是結(jié)構(gòu)化的金融數(shù)據(jù)和知識(shí)圖譜。用馬上消費(fèi)首席信息官蔣寧的話說即為,“我們希望任何情況下,大模型給出的回答是合規(guī)的,并且任何不可預(yù)期情況下,其給出的結(jié)果是穩(wěn)定的?!?/p>
(資料圖)
在論壇中,中國信通院、重慶國家應(yīng)用數(shù)學(xué)中心還和馬上消費(fèi)牽頭發(fā)起“金融大模型可信安全驗(yàn)證與聯(lián)合創(chuàng)新行動(dòng)計(jì)劃”,參與這一計(jì)劃的還包括阿里云、騰訊云、中國科學(xué)院自動(dòng)化研究所等機(jī)構(gòu)。
大模型還有四大難題待解
“金融行業(yè)人工智能應(yīng)用要求高、場(chǎng)景豐富,是大模型技術(shù)和算法突破的沃土,”中國工程院院士倪光南在8月28日論壇上如是表述。
不過,在蔣寧看來,通用大模型在工業(yè)領(lǐng)域、金融領(lǐng)域,大模型還有四個(gè)關(guān)鍵難題待解。他表示,大模型目前還面臨關(guān)鍵性任務(wù)和動(dòng)態(tài)適應(yīng)性、個(gè)性化要求和隱私保護(hù)、群體智能與安全可信和基礎(chǔ)設(shè)施的能力四大難題。
“生成式大模型最大的問題是滿腹經(jīng)綸,回答錯(cuò)了可以不承擔(dān)風(fēng)險(xiǎn),”蔣寧直言。他以自動(dòng)駕駛中的剎車、提速、轉(zhuǎn)彎等操作為例,“隨著外界環(huán)境不斷變化,自動(dòng)駕駛決策絕對(duì)不能出錯(cuò),1%的錯(cuò)都會(huì)造成生命財(cái)產(chǎn)損失?!?/p>
蔣寧認(rèn)為,金融大模型與自動(dòng)駕駛的案例一脈相承,和傳統(tǒng)大模型最大的區(qū)別是生成式模型不能做解釋,但是金融大模型則具有判別性,“它需要做交易決策?!?/p>
他表示:“我們希望在任何情況下,給客戶的回答都是合規(guī)的,并且任何不可預(yù)期情況下,結(jié)果是穩(wěn)定的”。
歐洲科學(xué)院外籍院士、清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng)孫茂松也有類似看法。他表示,生成式人工智能目前的一大特點(diǎn)是一定會(huì)出錯(cuò)。因?yàn)橥ㄓ么竽P蛯?duì)文本語言比較重視,對(duì)數(shù)字并不敏感,而金融數(shù)據(jù)大部分是結(jié)構(gòu)化知識(shí)圖譜,所以通用大模型在金融領(lǐng)域有不少挑戰(zhàn)。
形成“三縱三橫”布局
基于此,馬上消費(fèi)在論壇上發(fā)布了國內(nèi)首個(gè)消費(fèi)金融大模型——“天鏡”大模型。
蔣寧解釋,天鏡大模型的推出基礎(chǔ)在于,馬上消費(fèi)作為以科技驅(qū)動(dòng)的頭部持牌消費(fèi)金融機(jī)構(gòu),積累了1.79億用戶,已經(jīng)有超2000個(gè)模型,10萬+變量,近50PB多模態(tài)、高質(zhì)量數(shù)據(jù)等,通過在這些自身數(shù)據(jù)上做模型精調(diào)對(duì)齊訓(xùn)練,同時(shí)再用推理加速技術(shù)實(shí)現(xiàn)模型可控,因此相對(duì)通用大模型更懂金融。
其次,他透露,在算力平臺(tái)方面,馬上消費(fèi)現(xiàn)擁有近萬臺(tái)服務(wù)器和近千張GPU儲(chǔ)存卡。
據(jù)悉,該模型已運(yùn)行近3個(gè)月,意圖理解準(zhǔn)確率達(dá)91%,相較于傳統(tǒng)AI的68%有較大提升。另外,“天鏡”大模型目前客戶參與率61%,高于傳統(tǒng)模型43%的參與率,也高于人工坐席平均28%的水平。
例如,將企業(yè)招股書、財(cái)報(bào)、經(jīng)濟(jì)預(yù)測(cè)數(shù)據(jù)等文件上傳后,“天鏡”大模型可以深入解析金融領(lǐng)域?qū)I(yè)術(shù)語、同時(shí)擁有查詢定位多個(gè)不同文檔、洞悉金融圖表隱含的信息和強(qiáng)大歸納總結(jié)能力。
而且,大模型SQL生成平臺(tái)不再需要代碼等專業(yè)指令,可直接向AI發(fā)出自然語言。隨后天鏡自動(dòng)理解需求、展開檢索、生成答復(fù),按照用戶意思去完成數(shù)據(jù)挖掘任務(wù)。據(jù)透露,當(dāng)前,天鏡每日線上SQL生成數(shù)量650多次,線上SQL生成可執(zhí)行比例53.4%,SPIDER標(biāo)準(zhǔn)數(shù)據(jù)集EX得分75.2,線上使用者滿意反饋比例82.3%。
蔣寧表示,馬上消費(fèi)目前已形成“三縱三橫”的大模型發(fā)展技術(shù)布局,并領(lǐng)航構(gòu)建可信、合規(guī)、多模態(tài)、適配全域、泛化的金融大模型技術(shù)能力體系,聚焦行業(yè)領(lǐng)先的基礎(chǔ)語言特性能力、邏輯和推理能力、語義理解、生成與創(chuàng)作、金融領(lǐng)域能力、安全與合規(guī)能力等六大核心領(lǐng)域,進(jìn)一步推動(dòng)金融數(shù)字化轉(zhuǎn)型產(chǎn)生實(shí)質(zhì)性提升。
所謂三縱,是指實(shí)時(shí)人機(jī)協(xié)作、多模態(tài)智能、數(shù)據(jù)決策智能,在數(shù)據(jù)領(lǐng)域?qū)崿F(xiàn)智能化,實(shí)現(xiàn)結(jié)構(gòu)性數(shù)據(jù)判別式模型的綜合能力。三橫即是指持續(xù)學(xué)習(xí)、模型合規(guī)、組合式AI形成安全、合規(guī)、可信的魯棒性技術(shù)能力,確保讓模型越用越聰明,同時(shí)更穩(wěn)定、更安全可控。
打造全能數(shù)字員工
基于三縱三橫,馬上消費(fèi)人工智能研究院院長(zhǎng)陸全圍繞打造全能數(shù)字員工這一核心,對(duì)天鏡大模型在匯集智慧、喚醒知識(shí)、眾創(chuàng)價(jià)值、數(shù)字分身四大應(yīng)用場(chǎng)景進(jìn)行了詮釋。他表示,匯集智慧方面是應(yīng)用人工客服主要場(chǎng)景。
“通過大模型提煉萃取一線優(yōu)秀人工坐席客服經(jīng)驗(yàn),匯聚成群體智慧,從而擁有一對(duì)多服務(wù)客戶的能力,也可作為人工坐席的輔助角色,幫助推薦、優(yōu)化回答,”他表示。
他希望打造的“數(shù)字外表+智慧大腦+情感內(nèi)心”三合一數(shù)字人,不僅擅理解、有溫度、懂心理,而且還是不休不眠的智能“打工人”。
在他看來,每個(gè)員工都可以能輕松擁有自己數(shù)字分身,上傳自己的資料并定制一些參數(shù)后,只需5分鐘的訓(xùn)練數(shù)據(jù)就可以生成“另一個(gè)我”。隨時(shí)可以被喚起,成為人人都擁有的超級(jí)助手,代替員工完成大量工作。
標(biāo)簽:
熱門