大模型表現(xiàn)出的強大理解、生成和推理能力,讓各行各業(yè)開始探索其落地應(yīng)用。
中關(guān)村金融科技產(chǎn)業(yè)發(fā)展聯(lián)盟專家委員會主任委員周延禮在公開場合表示,隨著深度學(xué)習(xí)和人工智能算法的發(fā)展,算力的不斷提升以及數(shù)據(jù)的積累,人工智能與各行各業(yè)逐步結(jié)合、融合發(fā)展,成為新興經(jīng)濟發(fā)展的重要力量。
結(jié)合企業(yè)的具體實踐,科技界人士普遍認為,在當前探索可研和試點應(yīng)用階段,企業(yè)一般從大模型訓(xùn)練和微調(diào)入手,而基于大數(shù)據(jù)量、大規(guī)模參數(shù)進行的大模型訓(xùn)練,需要消耗大量算力資源??梢哉f,算力日益成為數(shù)字經(jīng)濟的新型生產(chǎn)力,作為算力的重要組成部分,存力的價值也日益凸顯。
金融機構(gòu)落地大模型的關(guān)鍵點是什么?存力價值如何提升?根據(jù)《金融行業(yè)先進AI存力報告》(以下簡稱《報告》),構(gòu)建可用、可信、可控的先進存力,是金融行業(yè)落地大模型的“必答題”。
算力集群存在“木桶效應(yīng)”
算力、數(shù)據(jù)和算法是大模型落地應(yīng)用的三大支撐要素,其中,算力需求最先迎來爆發(fā)。
目前,銀行、保險、證券等金融機構(gòu)尤其是頭部金融機構(gòu)已經(jīng)開始落地大模型場景應(yīng)用,并自建大模型能力。據(jù)了解,大模型的落地應(yīng)用必須依托由高性能計算芯片、存儲和網(wǎng)絡(luò)共同構(gòu)成的大規(guī)模算力集群,對此,金融機構(gòu)也在進行重點布局。
據(jù)中國工商銀行軟件開發(fā)中心高級專家劉承巖介紹,工商銀行在算力方面已經(jīng)建成了可以支持千億模型訓(xùn)練和推理的算力集群,引入了千億模型的算法。
需要注意的是,算力集群也存在“木桶效應(yīng)”,其中,存力的重要性往往被忽視?!秷蟾妗诽岬?,大模型訓(xùn)練等場景對于存力提出了一系列新挑戰(zhàn),而存力也往往容易成為短板,制約算力效能發(fā)揮,成為大模型落地過程中潛藏的風(fēng)險。
簡單來說,如果存儲和網(wǎng)絡(luò)性能無法支撐大規(guī)模的數(shù)據(jù)存儲、讀寫和傳輸,高性能計算芯片無用武之地,價值也將大打折扣。
對于存力的發(fā)展,相關(guān)政策已有著墨。2023年10月,工業(yè)和信息化部等六部門聯(lián)合印發(fā)《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》提出“加速存力技術(shù)研發(fā)應(yīng)用”,圍繞全閃存、藍光存儲、硬件高密、數(shù)據(jù)縮減、編碼算法、芯片卸載、多協(xié)議數(shù)據(jù)互通等技術(shù),推動先進存儲創(chuàng)新發(fā)展。
滿足存力提升需要
補齊短板,重視存力的提升,與大模型落地應(yīng)用場景密切相關(guān)。
根據(jù)相關(guān)調(diào)研結(jié)論,金融行業(yè)典型的大模型應(yīng)用場景包括數(shù)據(jù)分析、智能問答、智能客服、數(shù)字營業(yè)廳、智能投顧、智能投研、營銷內(nèi)容生成、產(chǎn)品推薦、智能風(fēng)控等,部分場景已進入試點應(yīng)用階段。
面對復(fù)雜的應(yīng)用場景,大模型作為變革性技術(shù),需要實現(xiàn)能力內(nèi)化,金融機構(gòu)在應(yīng)用場景中優(yōu)先調(diào)用了自有大模型,并對其進行訓(xùn)練和部署,模型參數(shù)量往往在千億級。因此,對于大模型落地應(yīng)用走在前列的金融行業(yè)而言,AI算力建設(shè)頗具挑戰(zhàn)。
“中國人保在大模型研究和應(yīng)用場景落地過程中,感受到最大的限制并非是技術(shù)問題,而是算力資源嚴重不足。” 中國人民保險集團科技運營部總經(jīng)理劉蒼牧坦言,“在國產(chǎn)化算力尚未強大的當下,這對我們持續(xù)開展大模型研究和推廣應(yīng)用是一個巨大的挑戰(zhàn)。”
《報告》認為,在重視大模型能力建設(shè)的背景下,金融機構(gòu)必須構(gòu)建起堅實的智能算力基礎(chǔ)設(shè)施,以支撐大模型的高效訓(xùn)練和部署。作為AI算力基礎(chǔ)設(shè)施的關(guān)鍵組成部分之一,構(gòu)建先進存力的著力點在哪里?
《報告》稱,金融機構(gòu)對于AI先進存力的需求可以總結(jié)為三方面:可用、可信、可控。具體來看,在可用方面,金融機構(gòu)要滿足大模型場景對于存力的高吞吐、高IOPS、高帶寬、低延時的極致性能要求,提升算力資源利用率;在可信方面,在滿足以上極致性能要求的前提下,金融機構(gòu)在先進存力建設(shè)中還需要考慮信創(chuàng)適配問題,同時,破解國產(chǎn)硬件性能瓶頸;在可控方面,金融機構(gòu)需要盡可能降低成本,在采購存儲系統(tǒng)時,保證自身大模型能力建設(shè)的自主性和靈活性。
加強跨界合作
業(yè)內(nèi)人士認為,大模型時代的到來將推動新一輪算力基礎(chǔ)設(shè)施建設(shè),先進存力是其中至關(guān)重要的組成部分。
《報告》提出,相比算力、網(wǎng)絡(luò)可以通過直接采購成熟產(chǎn)品服務(wù)快速形成能力,軟硬件高度融合且更具開放性的存力建設(shè)具有更大的挑戰(zhàn)性。金融機構(gòu)應(yīng)當提升對存力建設(shè)的重視度,同時在算力基礎(chǔ)設(shè)施建設(shè)中進行前瞻性的統(tǒng)籌規(guī)劃,做好存力與算力、網(wǎng)絡(luò)的匹配,避免出現(xiàn)存力短板,阻礙大模型落地進程。
“大模型算法技術(shù)門檻高,底層算力資源需求大,必須借助相關(guān)產(chǎn)業(yè)公司的技術(shù)和算力共同開展大模型的底座研究和訓(xùn)練。”劉蒼牧表示,智能前沿技術(shù)如通用大模型,在底層算力算法技術(shù)儲備方面的門檻極高,金融機構(gòu)必將積極開展跨界合作,充分發(fā)揮第三方機構(gòu)的技術(shù)先發(fā)優(yōu)勢,與自身的業(yè)務(wù)場景和專業(yè)知識相結(jié)合,共同打造智能金融生態(tài)圈,實現(xiàn)優(yōu)勢互補和互利共贏。
據(jù)了解,目前業(yè)內(nèi)已有商業(yè)銀行、證券公司與科技企業(yè)在大模型算力基礎(chǔ)設(shè)施建設(shè)方面有所合作。
【關(guān)閉】