近期,以自然語(yǔ)言處理技術(shù)為關(guān)鍵的生成式人工智能,在模仿人類(lèi)理解和創(chuàng)作能力上突飛猛進(jìn),成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量;谌斯ぶ悄茴I(lǐng)域的深度學(xué)習(xí)模型,AI大模型能夠處理大規(guī)模數(shù)據(jù)并具有更加精準(zhǔn)的預(yù)測(cè)和決策能力,是實(shí)現(xiàn)人工智能商業(yè)化的關(guān)鍵,應(yīng)用前景廣闊。
一、AI大模型的定義及特點(diǎn)
AI大模型是通過(guò)深度學(xué)習(xí)算法和人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練出的具有龐大規(guī)模參數(shù)的人工智能模型。AI大模型具有強(qiáng)大的計(jì)算和學(xué)習(xí)能力,能夠處理大量的數(shù)據(jù),適應(yīng)不同的業(yè)務(wù)場(chǎng)景和語(yǔ)言環(huán)境,并通過(guò)學(xué)習(xí)和推理來(lái)完成各種任務(wù),實(shí)現(xiàn)更高效、更準(zhǔn)確的語(yǔ)義理解和應(yīng)用。
目前,AI大模型具有參數(shù)規(guī)模龐大、結(jié)構(gòu)復(fù)雜、通用性強(qiáng)、多模態(tài)處理能力等特點(diǎn)。
二、AI大模型行業(yè)發(fā)展政策
目前,受政策利好,我國(guó)AI大模型行業(yè)發(fā)展迅猛。國(guó)家及相關(guān)部門(mén)陸續(xù)出臺(tái)了《“數(shù)據(jù)要素x”三年行動(dòng)計(jì)劃(2024—2026年)(征求意見(jiàn)稿)》《關(guān)于加快推進(jìn)視聽(tīng)電子產(chǎn)業(yè)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn)》《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》《電子信息制造業(yè)2023—2024年穩(wěn)增長(zhǎng)行動(dòng)方案》等一系列政策鼓勵(lì)大模型產(chǎn)業(yè)發(fā)展。
2023年12月,國(guó)家數(shù)據(jù)局發(fā)布《“數(shù)據(jù)要素x”三年行動(dòng)計(jì)劃(2024—2026年)(征求意見(jiàn)稿)》,提出以科學(xué)數(shù)據(jù)支持大模型開(kāi)發(fā),建設(shè)高質(zhì)量語(yǔ)料庫(kù)和基礎(chǔ)科學(xué)數(shù)據(jù)集,支持開(kāi)展通用人工智能大模型和垂直領(lǐng)域人工智能大模型訓(xùn)練。同時(shí),北京、上海、廣東、安徽、四川等多省市也陸續(xù)出臺(tái)大模型產(chǎn)業(yè)發(fā)展措施,加速大模型應(yīng)用落地。具體政策如下:
三、AI大模型行業(yè)發(fā)展現(xiàn)狀
1.市場(chǎng)規(guī)模
當(dāng)前,“ChatGPT”“文心一言”“盤(pán)古Chat”等大模型的爆火推動(dòng)了新一輪人工智能技術(shù)發(fā)展熱潮,AI大模型相關(guān)研究、產(chǎn)品不斷涌現(xiàn),中國(guó)大模型產(chǎn)業(yè)規(guī)模快速增長(zhǎng)中國(guó)大模型產(chǎn)業(yè)市場(chǎng)規(guī)模從2020年的15億元增長(zhǎng)至2022年的70億元,年均復(fù)合增長(zhǎng)率達(dá)116.02%,2023年約為147億元。2024年中國(guó)大模型產(chǎn)業(yè)規(guī)模將達(dá)216億元。
2.開(kāi)發(fā)模式
從開(kāi)發(fā)模式來(lái)看,國(guó)內(nèi)大學(xué)、科研機(jī)構(gòu)、企業(yè)等不同創(chuàng)新主體積極參與大模型研發(fā)。我國(guó)參數(shù)規(guī)模在10億以上的79個(gè)大模型中,企業(yè)、高校/科研機(jī)構(gòu)、校企聯(lián)合研發(fā)的數(shù)量分別為36個(gè)、29個(gè)、14個(gè),分別占比45.57%、36.71%、17.72%,學(xué)術(shù)界與產(chǎn)業(yè)界之間的聯(lián)合開(kāi)發(fā)仍有較大發(fā)展空間。
3.企業(yè)布局情況
隨著百度、騰訊、華為、阿里等互聯(lián)網(wǎng)頭部企業(yè)競(jìng)相布局大模型產(chǎn)業(yè),并推出“文心一言”“混元AI大模型”“盤(pán)古Chat”“通義千問(wèn)”等一系列通用化大模型,我國(guó)AI大模型產(chǎn)業(yè)化發(fā)展加速。具體如圖所示:
4.AI大模型備案產(chǎn)品
由國(guó)家網(wǎng)信辦聯(lián)合國(guó)家發(fā)展改革委、教育部、科技部等七部門(mén)公布的《生成式人工智能服務(wù)管理暫行辦法》自2023年8月15日起施行,辦法明確生成式AI實(shí)施算法“備案制”,意味著算法備案已成為AIGC產(chǎn)品的入市門(mén)檻。11月4日,網(wǎng)易有道(“子曰”大模型)、螞蟻集團(tuán)(百靈大模型)、面壁智能(“面壁露卡Luca”)、出門(mén)問(wèn)問(wèn)(“序列猴子”)、昆侖萬(wàn)維(“天工”大模型)等約11家公司的AI大模型產(chǎn)品獲批,并面向全社會(huì)開(kāi)放服務(wù)。加上首批的10余個(gè)大模型,目前已有超過(guò)20個(gè)大模型獲得審批。伴隨審批落地,多家搶跑,AI大模型有望快速進(jìn)入到拼原生應(yīng)用、拼產(chǎn)業(yè)落地的階段。
四、AI大模型行業(yè)重點(diǎn)企業(yè)
1.百度
百度成立于2000年,是一家擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。目前,在云、AI、互聯(lián)網(wǎng)融合發(fā)展的大趨勢(shì)下,基于搜索引擎,百度演化出語(yǔ)音、圖像、知識(shí)圖譜、自然語(yǔ)言處理等人工智能技術(shù),百度形成了移動(dòng)生態(tài)、百度智能云、智能交通、智能駕駛及更多人工智能領(lǐng)域前沿布局的多引擎增長(zhǎng)新格局。大模型方面,百度通過(guò)大模型與國(guó)產(chǎn)深度學(xué)習(xí)框架融合發(fā)展,打造了自主創(chuàng)新的AI底座,大幅降低了AI開(kāi)發(fā)和應(yīng)用的門(mén)檻。
2023年,百度實(shí)現(xiàn)總營(yíng)收1345.98億元,同比增長(zhǎng)9%,實(shí)現(xiàn)歸母凈利潤(rùn)203.15億元。
目前,百度文心大模型主打搜索模型,包括文心·NLP大模型、文心·CV大模型、文心·跨模態(tài)大模型、文心·生物計(jì)算大模型、文心·行業(yè)大模型等。2023年,文心一言使用量與文心大模型API調(diào)用量均保持高速增長(zhǎng)。截至2023年12月底,文心一言用戶(hù)規(guī)模超過(guò)1億。
2.騰訊
騰訊成立于1998年,是中國(guó)最大的互聯(lián)網(wǎng)綜合服務(wù)提供商之一,也是中國(guó)服務(wù)用戶(hù)最多的互聯(lián)網(wǎng)企業(yè)之一,業(yè)務(wù)涉及社交、金融、娛樂(lè)、資訊等領(lǐng)域。2023年9月,騰訊正式發(fā)布了自研的通用大語(yǔ)言模型——混元,并宣布通過(guò)騰訊云對(duì)外開(kāi)放;煸竽P褪怯沈v訊全鏈路自研的,重點(diǎn)解決了大模型常見(jiàn)的“幻覺(jué)”問(wèn)題,具有強(qiáng)大的中文理解與創(chuàng)作能力、邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力,可以通過(guò)語(yǔ)音、文字、圖片等多種方式與用戶(hù)交互,提供智能問(wèn)答、文本生成、文本摘要、文本分類(lèi)、文本翻譯、圖像描述、圖像生成等多種功能。
2023年前三季度,騰訊實(shí)現(xiàn)營(yíng)業(yè)收入4538億元,同比增長(zhǎng)10.80%;實(shí)現(xiàn)歸母凈利潤(rùn)881.9億元,同比增長(zhǎng)7.58%。
3.華為
華為創(chuàng)立于1987年,是全球領(lǐng)先的ICT(信息與通信)基礎(chǔ)設(shè)施和智能終端提供商。華為旗下的盤(pán)古大模型首發(fā)于2021年4月,致力于深耕行業(yè),打造金融、政務(wù)、制造、礦山、氣象、鐵路等領(lǐng)域行業(yè)大模型和能力集。2023年前三季度,華為實(shí)現(xiàn)營(yíng)業(yè)收入4566億元,同比增長(zhǎng)2.4%;歸母凈利潤(rùn)465.23億元。
目前,盤(pán)古大模型主要包括NLP大模型、CV大模型、科學(xué)計(jì)算大模型等。具體內(nèi)容如下:
4.阿里巴巴
阿里巴巴創(chuàng)立于1999年,業(yè)務(wù)涵蓋商業(yè)、云計(jì)算、數(shù)字媒體及娛樂(lè)以及創(chuàng)新業(yè)務(wù)。目前,圍繞著阿里巴巴平臺(tái)與業(yè)務(wù),阿里巴巴已經(jīng)形成了涵蓋消費(fèi)者、商家、品牌、零售商、第三方服務(wù)提供者、戰(zhàn)略合作伙伴及其他企業(yè)的生態(tài)體系。同時(shí),為提升消費(fèi)者體驗(yàn)及業(yè)務(wù)運(yùn)營(yíng)效率,阿里巴巴已將各種AI技術(shù)廣泛應(yīng)用在生態(tài)體系內(nèi)。2023財(cái)年,阿里巴巴實(shí)現(xiàn)營(yíng)業(yè)收入8686.87億元。
大模型方面,阿里巴巴推出了一個(gè)超大規(guī)模的語(yǔ)言模型——通義大模型。通義大模型包括通義-M6、通義-AliceMind和通義-CV三大模型體系,可以處理多語(yǔ)言、多模態(tài)數(shù)據(jù),同時(shí)支持多種理解和生成任務(wù),能快速滿(mǎn)足不同領(lǐng)域、不同應(yīng)用場(chǎng)景的需求。2023年10月,阿里云正式發(fā)布千億級(jí)參數(shù)大模型通義千問(wèn)2.0,以及基于通義大模型訓(xùn)練的8大行業(yè)模型和一站式大模型應(yīng)用開(kāi)發(fā)平臺(tái)阿里云百煉、阿里AI平臺(tái)PAI等。具體情況如下:
5.字節(jié)跳動(dòng)
字節(jié)跳動(dòng)成立于2012年,公司業(yè)務(wù)覆蓋150個(gè)國(guó)家和地區(qū),在全球推出了多款有影響力的產(chǎn)品,包括今日頭條、抖音、西瓜視頻、飛書(shū)、Lark、PICO、剪映、TikTok等。大模型布局方面,字節(jié)跳動(dòng)旗下云雀大模型是一種基于注意力機(jī)制的深度學(xué)習(xí)模型,非常適合處理自然語(yǔ)言處理任務(wù)。目前,云雀模型在多個(gè)自然語(yǔ)言處理任務(wù)中取得了優(yōu)異的成績(jī),包括語(yǔ)言翻譯、問(wèn)答系統(tǒng)、文本摘要等。基于云雀模型,字節(jié)跳動(dòng)開(kāi)發(fā)的AI工具“豆包”,能提供聊天機(jī)器人、寫(xiě)作助手以及英語(yǔ)學(xué)習(xí)助手等功能,幫助人們獲取信息。
五、AI大模型行業(yè)發(fā)展前景
1.政策支持行業(yè)發(fā)展
人工智能是國(guó)家戰(zhàn)略的重要組成部分,是未來(lái)國(guó)際競(jìng)爭(zhēng)的焦點(diǎn)和經(jīng)濟(jì)發(fā)展的新引擎。近年來(lái),中國(guó)人工智能行業(yè)受到各級(jí)政府的高度重視和國(guó)家產(chǎn)業(yè)政策的重點(diǎn)支持,國(guó)家陸續(xù)出臺(tái)了多項(xiàng)政策,鼓勵(lì)人工智能行業(yè)發(fā)展與創(chuàng)新。在AI產(chǎn)業(yè)鏈中,算法、算力和數(shù)據(jù)共同構(gòu)成技術(shù)發(fā)展的三大核心要素,算法模型從技術(shù)理論到應(yīng)用實(shí)踐的落地過(guò)程依賴(lài)于大量的訓(xùn)練數(shù)據(jù)。訓(xùn)練數(shù)據(jù)越多、越完整、質(zhì)量越高,模型推斷的結(jié)論越可靠。隨著人工智能、區(qū)塊鏈、IoT等新興技術(shù)的發(fā)展,AI大模型行業(yè)將飛速發(fā)展。
2.算力基礎(chǔ)設(shè)施建設(shè)加快,促進(jìn)大模型行業(yè)發(fā)展
發(fā)展AI大模型,算力是重要支撐。加快算力基礎(chǔ)設(shè)施建設(shè),優(yōu)化算力資源布局、提升算力應(yīng)用強(qiáng)度至關(guān)重要。隨著全國(guó)一體化算力網(wǎng)絡(luò)國(guó)家樞紐節(jié)點(diǎn)的部署和“東數(shù)西算”工程的推進(jìn),我國(guó)算力基礎(chǔ)設(shè)施建設(shè)快速發(fā)展,算力規(guī)模持續(xù)擴(kuò)大。根據(jù)國(guó)家信息中心與浪潮信息聯(lián)合發(fā)布的《智能計(jì)算中心創(chuàng)新發(fā)展指南》,目前全國(guó)有超過(guò)30個(gè)城市正在建設(shè)或提出建設(shè)智算中心,“十四五”期間,對(duì)智算中心的投資可帶動(dòng)人工智能核心產(chǎn)業(yè)增長(zhǎng)約2.9-3.4倍。預(yù)計(jì)算力基礎(chǔ)設(shè)施的加快建設(shè)將大大促進(jìn)AI大模型行業(yè)發(fā)展。
3.技術(shù)升級(jí)帶動(dòng)AI大模型的應(yīng)用場(chǎng)景擴(kuò)大
當(dāng)前,隨著技術(shù)的不斷升級(jí),AI大模型的應(yīng)用場(chǎng)景也在逐步擴(kuò)大,大模型發(fā)展呈現(xiàn)出從技術(shù)到產(chǎn)品、再到商業(yè)化應(yīng)用的發(fā)展路徑,并不斷深入垂直行業(yè)領(lǐng)域。從應(yīng)用領(lǐng)域來(lái)看,大模型應(yīng)用案例百花齊放,已經(jīng)在傳統(tǒng)產(chǎn)業(yè)賦能、金融、政務(wù)、文化旅游、醫(yī)療、智慧城市等各個(gè)領(lǐng)域得到初步應(yīng)用。其中,傳統(tǒng)產(chǎn)業(yè)賦能和金融領(lǐng)域發(fā)展較快,如傳統(tǒng)產(chǎn)業(yè)賦能領(lǐng)域有產(chǎn)業(yè)知識(shí)問(wèn)答、圖文生成等,金融領(lǐng)域有智能投研助理、智能客服等,行業(yè)前景廣闊。