馬上消費:馴服大模型這匹“野馬”,得套“籠頭”,加“馬鞍”觀點

紅紅火火,恍恍惚惚,大模型從GPT開始爆發到現在,越來越多人加入這場科技界的“諸神之戰”。
紅紅火火,恍恍惚惚,大模型從GPT開始爆發到現在,越來越多人加入這場科技界的“諸神之戰”。不可否認,大模型確實為我們展示出了人工智能的強大之處。但在當下的狂熱氣氛中,大家仿佛都變成了“追星”的狂熱粉絲。
但技術終究要落地到垂直細分產業中,才能發揮其應有價值,這是一個積淀、積累的過程,之后才能走向真正的成熟。從大模型在金融垂直細分領域的落地來看,馬上消費正加速馴服大模型這匹“野馬”,為其套上“籠頭”,增加“馬鞍”、“馬鐙”。
馴服金融大模型“野馬”
大模型本質上是一種更高壓縮比的知識庫,這在當下已經成為共識。大模型不僅能存儲和運用隱含于訓練數據中的知識,還能新生成有邏輯的組合知識。
具體來看,大模型之所以能表現出如此強悍的能力,主要經歷了“原材料篩選”、“原材料配方”、“粗加工技術”“精加工技術”等四個步驟。大模型在對海量的網頁文本數據進行質量判斷和選取后,用于初步訓練,然后將大量的知識編碼,再精調模型,選取問題供人工標注。
對比搜索引擎,大模型可以更高效幫助我們提取有用的知識和信息,用“問題(prompt)”代替“傳統query”從大模型中查詢和提取知識。對于新知識的獲取從“主動搜索”到“直接問專家”,就像從買菜做菜變成了直接用預制菜,而且專屬機器秘書可以記住你已有的知識水平,在此基礎上像老師一樣把你現在不知道的必要知識點自動加入進來,逐步教會你新知識。
作為重慶唯一獲得國家級高新技術企業認定的金融機構,馬上消費連續2年入圍國家工信部“新一代人工智能產業創新揭榜單位”,也正研究如何沿著Human Feedback這條ChatGPT已經驗證好的路徑將金融領域知識注入大模型。
馬上消費人工智能研究院院長陸全表示,“如果把通用大模型看作一匹資質超群的‘野馬’,打造專注于金融垂直領域和細分場景的大模型應用就相當于對野馬的馴化?!?/p>
首先,需要用專有的經過加工的垂直領域的數據作為“草料”來“喂養”它。當前馬上消費的整體數據量已經超過40PB,服務器超過8000臺,每日數據交換量超過950億,其中實時數據接入量350億,每日投放數據量超過190億,而風控Hbase調用量超過40萬次/s,相關指標均在消費金融領域處于領先位置。
其次,要在垂直領域對模型進行精調對齊訓練,相當于為野馬套上“籠頭”,再用大模型的推理加速技術為它加上“馬鞍”、“馬鐙”,讓這匹駿馬跑得更快、更可控。
“由于100億以下參數的模型無法具備很多能力”,馬上消費人工智能研究院李寬補充道,“為此我們必須克服GPU和經驗的不足,以獲得對這種大小模型的‘精調訓練’和‘推理使用’的能力,并在自身數據上做模型精調;其中包括:基于自身數據,設計和訓練“問答對”,以保證既要保留原有大語言模型的常識和通用推理能力,又要能在獨有的金融垂直細分數據上產生類似的能力擴展?!?/p>
最后,要有足夠的應用場景來供這匹駿馬奔馳和迭代,使用的人越多,評估反饋越多,模型迭代越快,才會越來越好。而在這一方面,馬上消費等大型消費金融機構具有先天優勢,能夠產生很強實際使用效果。
陸全院長還表示,相比來說,擺在中小型金融機構面前的首道難關就是資源門檻,在強大動力需求的作用下,它們會向金融行業內大型機構或具備技術優勢的金融科技平臺需求協助,建立起相關的科技能力。
據最新數據顯示,馬上消費的注冊用戶已突破1.5億,累計發放消費貸款超過4000億元,合作金融機構超200個,合作商戶超100萬,形式了全渠道全場景開放生態。
布萊恩·阿瑟在《技術的本質》一書中曾提到,技術從本質上來說是自創生的,所有新技術都不是無中生有被發明出來的,新技術都是從現存技術中組合出的一組新的要素。
在馬上消費副總經理兼首席信息官蔣寧看來,ChatGPT巧妙地疊加了Transformer、有監督微調訓練、強化學習等技術,成功展現了由于模型規模帶來的突現能力,經過近幾年不斷迭代部署,量變的積累產生質變,形成了ChatGPT的語言智能。
大模型的“金融產業之戰”
需要注意的是,大模型對我們來說是做好賦能。陸全院長認為,大模型對我們社會生活的最終影響是“秘書平民化”。
比如,大模型可以幫助我們進行各種寫作工作,講稿,郵件,論文,代碼等都可以先由AIGC生成供你修改的草稿;還可以進行歸納性文字類工作,機器秘書可以按要求瀏覽大量指定文章,從中生成摘要;對于新知識的獲取從“主動搜索”到“直接問專家”,而且專屬機器秘書可以記住你已有的知識水平,逐步教會你新知識;專屬機器秘書會記住和更了解你的各種偏好,幫你做個性化復雜的決策建議等等。
當然,大模型可能會淘汰掉一些物種,但也會讓一些原有物種獲得新能力,比如智能客服。在這方面,馬上消費對待大模型有著更為清醒的認知,高效的智能客服可以替換人工坐席。
陸全院長還表示,在智能交互方面,通過配備機器人客服將金融知識及產品相關信息一條條添加到知識庫里,盡管“喂養”了很多數據,也避免不了機器人回答的機械化和準確性欠佳,因為它的識別能力是有限的,更多充當協助人工客服的角色。而大模型本身具備大量通用知識,除了金融常識外,對于其他特殊內容,可以通過知識注入的方式給到大模型,并且通過持續、充分的訓練,能夠使大模型具備更加精準的語義理解能力和強大自然語言生成能力。自然而然,大模型可以成為懂金融的“專家”。
不久前,全國首個數字警察“警小靈”,在重慶防范經濟犯罪宣傳啟動儀式現場亮相?!熬§`”就是由馬上消費提供的技術支持,可以實現24小時不間斷為群眾提供專業、精準、高效的咨詢服務。
需要注意的是,隨著大模型的能力越來越強大,大模型標準的制定也越來越急迫,因為大模型的可控性仍然較差。
為此,馬上消費積極推動人工智能生成內容(AIGC)標準的制定,從規范約束和風險監控兩個方面來保證機器智能生成內容的可信合規。截至目前,依托科技研發創新,馬上消費已參與超30項金融科技標準編制工作,涉及研發運營一體化能力成熟度、開發平臺通用能力要求等,獲得28項人工智能與交易安全領域備案認證,在標準及認證方面表現優秀。
在當下這個充斥著技術誘惑的時代,我們更需要在技術工具面前保持足夠的清醒。正確認識科技價值,才能實現“科技讓生活更美好”的目的。
1.TMT觀察網遵循行業規范,任何轉載的稿件都會明確標注作者和來源;
2.TMT觀察網的原創文章,請轉載時務必注明文章作者和"來源:TMT觀察網",不尊重原創的行為TMT觀察網或將追究責任;
3.作者投稿可能會經TMT觀察網編輯修改或補充。