999精品,丝袜综合,大陆老熟妇性,中国老女人AV,亚洲精品国产第一区二区三区

世界訊息:“以數(shù)據(jù)為中心的人工智能”是加快人工智能工程化落地的有效途徑
發(fā)布時間:2022-12-15 16:00:48 文章來源:人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟AIIA
當前位置: 主頁 > 資訊 > 國內(nèi) > 正文


(相關資料圖)

在Gartner2022年發(fā)布的人工智能技術成熟度曲線中,“以數(shù)據(jù)為中心的人工智能”(Data-centric AI)被列為人工智能技術和應用的四大創(chuàng)新類別之一。機器學習學者吳恩達也在2022年與IEEE Spectrum的采訪中表示,人工智能將向“數(shù)據(jù)為中心”進行轉(zhuǎn)變。

眾所周知,數(shù)據(jù)是人工智能的重要生產(chǎn)要素,對于AI模型開發(fā)和應用非常關鍵,被喻為AI的原料。

說起以數(shù)據(jù)為中心(Data-centric),不得不提起以模型為中心(Model-centric)的人工智能。從以模型為中心的角度來看,工程師更加偏向從模型出發(fā),通過特征工程來使數(shù)據(jù)適合其模型,而當現(xiàn)有模型無法充分解決問題時,將開發(fā)可以解決問題的新模型。人工智能領域此前專注于通過調(diào)整算法模型來實現(xiàn)更準確的結果,但采用公開數(shù)據(jù)和低質(zhì)量數(shù)據(jù)集進行訓練的模型普適性較差,而重新訓練的成本代價更高,最終導致算力資源和時間的浪費。

從以數(shù)據(jù)為中心的角度來看,數(shù)據(jù)決定了模型的效果,通過對訓練數(shù)據(jù)集的改進可以提升模型的準確性和魯棒性。斯坦福大學李飛飛等人在2022年8月發(fā)表的論文中指出,實現(xiàn)可信AI,數(shù)據(jù)的設計、改進和質(zhì)量評估是關鍵。以數(shù)據(jù)為中心的人工智能將重點轉(zhuǎn)移到治理和增強用于模型訓練的數(shù)據(jù)上,高質(zhì)量的訓練數(shù)據(jù)集、完備的數(shù)據(jù)應用策略將會更好的服務于模型的開發(fā)與應用。通過數(shù)據(jù)治理、數(shù)據(jù)自動化、建立數(shù)據(jù)供給全流程等方式,利用數(shù)據(jù)采集標注平臺、數(shù)據(jù)管理平臺、數(shù)據(jù)質(zhì)量評估等工具和數(shù)據(jù)增強、數(shù)據(jù)挖掘、數(shù)據(jù)分析等技術手段,改進、完善、評估數(shù)據(jù),形成優(yōu)質(zhì)的標準化數(shù)據(jù)產(chǎn)品和完備的數(shù)據(jù)全生命周期管理體系,提升數(shù)據(jù)質(zhì)量,最大化釋放數(shù)據(jù)的價值。

目前,國內(nèi)外眾多研究機構、企業(yè)為實踐以數(shù)據(jù)為中心的人工智能,正在推動相關應用技術服務和產(chǎn)品的研發(fā)落地。國際權威學者吳恩達在2021年舉辦了首屆“以數(shù)據(jù)為中心的人工智能競賽”,比賽僅允許通過改進數(shù)據(jù)來提升模型的性能,將數(shù)據(jù)的重要性提升到一個新的高度。在國內(nèi),上海人工智能實驗室建設OpenDataLab浦數(shù)人工智能開放數(shù)據(jù)平臺,匯聚海量的數(shù)據(jù)資源,包括覆蓋800多種任務類型的3000多個數(shù)據(jù)集,并提供便捷檢索和快速下載服務;商湯建立了AI數(shù)據(jù)的采標平臺和數(shù)據(jù)集管理平臺,并作為商湯AI大裝置中的一環(huán),全面賦能工程化數(shù)據(jù)應用和AI模型的研發(fā)部署;格物鈦構建了新一代非結構化數(shù)據(jù)平臺,通過數(shù)據(jù)管理、數(shù)據(jù)可視化、數(shù)據(jù)協(xié)同等功能,打破數(shù)據(jù)質(zhì)量不一致、數(shù)據(jù)分散等問題,提升AI模型的訓練效果。

可見,推動將“以數(shù)據(jù)為中心的人工智能”,連接起數(shù)據(jù)團隊和模型團隊,建立起一套標準化的數(shù)據(jù)質(zhì)量控制、組織管理與工具系統(tǒng)的標準體系,對于企業(yè)更好的利用AI模型的能力促進業(yè)務增長顯得至關重要。目前,中國信息通信研究院依托人工智能關鍵技術和應用評測工業(yè)和信息化部重點實驗室,聚焦人工智能工程化應用和發(fā)展,基于人工智能開發(fā)平臺、MLOps等研究成果,構建面向AI工程化的《人工智能工程化數(shù)據(jù)應用成熟度模型》標準體系。標準體系從AI數(shù)據(jù)集質(zhì)量控制出發(fā)開展數(shù)據(jù)應用策略研究,實現(xiàn)數(shù)據(jù)質(zhì)量的提升,對人工智能產(chǎn)品落地和產(chǎn)業(yè)發(fā)展具有一定的前瞻性和長遠意義。

標簽: 人工智能 為中心的

最近更新