日前,在福建省福州市鼓樓區(qū)安泰街道南門兜地鐵站里舉行的2025年就業(yè)援助月專項活動中,工作人員利用AI技術(shù)和大數(shù)據(jù)分析等先進(jìn)技術(shù),為求職者提供智能化的崗位匹配和職業(yè)規(guī)劃建議。謝貴明攝(人民視覺)
一位江蘇市民正在使用大模型輔助完成日常工作。王坤垚攝
國家互聯(lián)網(wǎng)信息辦公室2025年1月8日發(fā)布的信息顯示,截至2024年12月31日,共302款生成式人工智能服務(wù)在國家網(wǎng)信辦完成備案,其中2024年新增238款備案。
從名單看,細(xì)分領(lǐng)域的大模型大量涌現(xiàn),如科大訊飛的“訊飛星火教育大模型”、平安健康的“聊個天大模型”等。與此同時,隨著DeepSeek-V3等大模型產(chǎn)品憑借更低成本、更強(qiáng)性能引發(fā)海內(nèi)外市場關(guān)注,越來越多國產(chǎn)生成式人工智能大模型加入了“提質(zhì)+降價”的隊伍。
國產(chǎn)大模型應(yīng)用情況如何?正處于什么樣的發(fā)展階段?帶著這些問題,記者進(jìn)行了采訪。
功能更強(qiáng)
工作生活“好搭子”
備案數(shù)量的增多,從一個側(cè)面反映出國產(chǎn)大模型在工作和生活中出現(xiàn)的頻率增高了。
國產(chǎn)大模型具體發(fā)揮著怎樣的作用?“把自己從繁瑣、細(xì)碎的基礎(chǔ)工作中解放出來”是很多用戶談到應(yīng)用體會時的第一感受。
安徽姑娘強(qiáng)宇銘目前主修法律專業(yè)。在她看來,和人際溝通類似,如果能夠給大模型提供明確且精準(zhǔn)的提示詞,使用者就能獲得事半功倍的效果?!皣a(chǎn)大模型是我學(xué)習(xí)的‘好搭子’。國內(nèi)人工智能企業(yè)月之暗面開發(fā)的Kimi大模型幫我搜最新的司法立法動態(tài),文心一言能幫我草擬或潤色文章。我還會使用通義法睿等專門針對法律行業(yè)的大模型服務(wù),來回答法律問題、輔助案情分析,并生成各類法律文書?!睆?qiáng)宇銘舉例說。
除了搜索和生成之外,大模型提供的服務(wù)也越來越專業(yè)、越來越精細(xì)。
“有一次,我臨時需要將一份專業(yè)報告中的多種圖片調(diào)整成統(tǒng)一大小。這需通過Word文檔中的VBA功能實現(xiàn),不僅需要編寫代碼,而且較為復(fù)雜。要是在以前,我只能自己上網(wǎng)搜尋教程并從基礎(chǔ)學(xué)起。現(xiàn)在,豆包大模型提供的解決方案非常實用,同時提供了具體的代碼示例?!痹谏虾氖路康禺a(chǎn)開發(fā)工作的薛天朗說。
據(jù)百度智能云AI與大模型平臺業(yè)務(wù)副總經(jīng)理李景秋介紹,擴(kuò)展大模型應(yīng)用場景需要滿足不同維度的要求:一是基座模型質(zhì)量,要有一個可被指令增強(qiáng)的基礎(chǔ)模型;二是準(zhǔn)備相關(guān)場景化數(shù)據(jù),關(guān)注數(shù)據(jù)與實際場景的一致性和配適性;三是在訓(xùn)練過程中找到最優(yōu)的調(diào)試參數(shù)。
李景秋說,依托大模型強(qiáng)大的能力,百度智能云千帆平臺開始與更多行業(yè)和企業(yè)進(jìn)行合作。比如,在教育領(lǐng)域,借助大模型,“考試寶”為其會員提供試題解析服務(wù)的能力顯著提升。在招聘領(lǐng)域,獵聘利用大模型快速從簡歷中抽取信息進(jìn)行語義分析,人才供需匹配效果更好?!澳壳埃ヂ?lián)網(wǎng)行業(yè)之外,金融、教育、文娛、能源等行業(yè)都能看到大模型的身影。”她說。
中國信通院政策與經(jīng)濟(jì)研究所主任工程師程瑩認(rèn)為,國產(chǎn)大模型技術(shù)在語言、視覺、多模態(tài)等領(lǐng)域持續(xù)突破,在文本、音頻、視覺、3D等數(shù)據(jù)方面實現(xiàn)多模態(tài)統(tǒng)一,持續(xù)突破人工智能感知、理解和推理世界的能力邊界。這些,拓展著大模型與各行各業(yè)融合的深度和廣度?!叭缃?,芯片制造商、數(shù)據(jù)供應(yīng)商、模型研發(fā)企業(yè)、應(yīng)用開發(fā)商等方面協(xié)同合作正日益增強(qiáng),共同創(chuàng)造全新應(yīng)用場景和市場空間?!?/p>
成本更低
應(yīng)用普及“降門檻”
本領(lǐng)增長的同時,國產(chǎn)大模型的使用成本也不斷降低。
不久前,杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司推出的DeepSeek-V3上線并同步開源,快速吸引了全球同行的目光。在多項基準(zhǔn)測試中,DeepSeek-V3的成績超越了不少開源模型,并在性能上和世界頂尖的閉源模型不分伯仲。OpenAI創(chuàng)始成員安德烈·卡帕斯稱贊道:“DeepSeek—V3使得在有限算力預(yù)算上進(jìn)行模型預(yù)訓(xùn)練這件事變得容易?!?/p>
算力門檻降低、訓(xùn)練成本減少、性能持續(xù)提高……這些變化,在很多國產(chǎn)大模型上都有體現(xiàn)。
2024年12月底,阿里云計算有限公司宣布對大模型產(chǎn)品進(jìn)行新一輪降價,其中Qwen-VL-Plus輸入價格每千tokens(源代碼中可以被編譯器識別的最小單位)從0.008元降至0.0015元,降幅達(dá)81.3%。按照最新價格,1塊錢可以處理約600張720P圖片或1700張480P圖片。此前,字節(jié)、百度、智譜AI等國內(nèi)大模型領(lǐng)軍企業(yè)也紛紛調(diào)降了相關(guān)產(chǎn)品和服務(wù)的價格。
國產(chǎn)大模型降價底氣何在?商業(yè)上是否可持續(xù)?
記者了解到,在降成本方面,國產(chǎn)大模型供應(yīng)商們正在不斷取得新進(jìn)展。
有的進(jìn)行峰谷調(diào)節(jié),優(yōu)化配置資源?!岸拱竽P屯ㄟ^技術(shù)創(chuàng)新來降低成本,定價上有合理的毛利空間,既能保障企業(yè)和開發(fā)者用得起,又確保自身商業(yè)可持續(xù)?!被鹕揭嫦嚓P(guān)負(fù)責(zé)人說,業(yè)務(wù)團(tuán)隊從算法設(shè)計階段就考慮到超大規(guī)模的推理需求,在KV cache機(jī)制等方面進(jìn)行創(chuàng)新,使模型能夠用更低成本完成復(fù)雜的推理任務(wù)。在工程方面,利用規(guī)?;瘍?yōu)勢,根據(jù)科研、辦公、休閑娛樂等不同場景的不同負(fù)載進(jìn)行波峰波谷混合調(diào)度,實現(xiàn)整體成本的降低。
有的主打差異供給,力求事半功倍。比如,千帆大模型平臺根據(jù)用戶不同需要進(jìn)行針對性供給,從而降低其使用成本?!拔覀兲峁┒喾N類型的大模型服務(wù),支持企業(yè)調(diào)用旗艦級模型解決復(fù)雜問題,使用輕量級模型解決簡單問題,從而大幅降低使用成本?!卑俣戎悄茉魄Хa(chǎn)品相關(guān)負(fù)責(zé)人說,千帆積極提供工具鏈支持企業(yè)對輕量級模型進(jìn)行訓(xùn)練調(diào)試,同時通過提供數(shù)據(jù)飛輪、模型蒸餾等模型精調(diào)技術(shù)和訓(xùn)練方法進(jìn)行效果提升,幫助企業(yè)用戶以更低成本、更高效率完成專有模型的全鏈路開發(fā)。
在中國信通院人工智能研究所軟硬件與生態(tài)部主任李論看來,國產(chǎn)大模型降價有多方面因素。從供給側(cè)看,算法、芯片等軟硬件進(jìn)步帶來的技術(shù)紅利,讓大模型訓(xùn)練及推理成本逐漸降低。從需求側(cè)看,降低價格可以鼓勵更多用戶和企業(yè)使用大模型,從而豐富應(yīng)用場景、創(chuàng)造全新價值、實現(xiàn)規(guī)模效應(yīng)?!半S著預(yù)訓(xùn)練階段逐步完成,全球及國內(nèi)大模型廠商將轉(zhuǎn)向大力推進(jìn)大模型的后訓(xùn)練及推理側(cè)工程技術(shù)優(yōu)化。未來,高性價比的大模型服務(wù)有望增加?!崩钫撜f。
前景更好
“邊干邊學(xué)”是趨勢
多位業(yè)內(nèi)人士表示,理想情況下,大模型產(chǎn)品應(yīng)實現(xiàn)價格、私密安全性和大模型能力效果的平衡?,F(xiàn)實中,國產(chǎn)大模型還面臨缺乏高質(zhì)量數(shù)據(jù)、特定場景表現(xiàn)不佳、服務(wù)不穩(wěn)定等挑戰(zhàn),需要在性能優(yōu)化中擴(kuò)大應(yīng)用,在應(yīng)用擴(kuò)大中提升性能?!拔覀円煤么竽P偷幕灸芰?、創(chuàng)意能力、多模態(tài)能力、業(yè)務(wù)能力、創(chuàng)新能力和科學(xué)能力,并將其與我國產(chǎn)業(yè)創(chuàng)新應(yīng)用場景充分結(jié)合,最終賦能百行千業(yè)?!?60集團(tuán)創(chuàng)始人周鴻祎說。
數(shù)據(jù)的數(shù)量決定大模型的廣度,數(shù)據(jù)的質(zhì)量決定大模型的精度。在實踐中,不少企業(yè)正通過讓大模型“邊干邊學(xué)”實現(xiàn)良性循環(huán)。
騰訊云智能AI產(chǎn)品專家趙新宇介紹,大模型在不同行業(yè)落地的同時,也在推動其自身的成長。比如,“少年得到”的K12語文作文批改功能,就應(yīng)用了騰訊混元大模型的多模態(tài)能力。這款產(chǎn)品通過騰訊云智能的OCR技術(shù)識別學(xué)生作文內(nèi)容,并根據(jù)設(shè)置好的評分標(biāo)準(zhǔn),由大模型為作文打分。“通常,大模型和學(xué)校教師判分,偏差需要控制在5分甚至更低。”趙新宇說,客戶群體的擴(kuò)大不僅對大模型提出了新要求,也有助于加快大模型開發(fā)迭代速度,提高大模型的實用性和適應(yīng)性。
中國移動基于10086客服領(lǐng)域多年沉淀的客服業(yè)務(wù)特色數(shù)據(jù)資源,通過對用戶意圖識別、語言理解、邏輯推理、知識檢索等任務(wù)的針對性、系統(tǒng)化訓(xùn)練,讓“九天”客服大模型不斷煥發(fā)新生機(jī)?!?G網(wǎng)絡(luò)支撐起海量數(shù)據(jù)和大規(guī)模連接需求,讓全社會的信息流動更加順暢、更加高效,人與人、人與物、物與物的連接更加緊密,經(jīng)濟(jì)社會發(fā)展的網(wǎng)絡(luò)底座更加健壯。”中國移動董事長楊杰說,中國移動推廣“九天”多模態(tài)通用大模型服務(wù),積極推進(jìn)更大參數(shù)體量、更強(qiáng)推理能力的模型訓(xùn)練。
專家預(yù)計,“邊干邊學(xué)、邊學(xué)邊用”的良性循環(huán)將會讓國產(chǎn)大模型加速走進(jìn)日常生活。
“未來,大模型有望全方位融入普通人的生活。它可以作為生活助手,即時解答各類知識疑問;可作為娛樂伙伴,幫助人們創(chuàng)作小說、繪畫、音樂等;可以作為健康管家,預(yù)警健康風(fēng)險,輔助醫(yī)療咨詢?!背态撜f。(王俊嶺)
(責(zé)任編輯:蔡文斌)