&

ChatGPT橫空出世，開啟了AI的2.0時代。

iPhone的問世為iPhone黃金時代揭開了序幕，也帶來了上一輪科技革命。現(xiàn)在市場各方期待著，“AI的iPhone時刻”會開啟怎么樣的新世界。

(資料圖)

國內(nèi)國際廠商紛紛跟進潮流，搶占大模型高地，“百團大戰(zhàn)”如火如荼。

有人認(rèn)為，我們距大模型真正落地還很遙遠。我本來也持有類似的觀點，直到我看到商湯的財報——

一系列引人關(guān)注的數(shù)據(jù)和舉措：

根據(jù)中期業(yè)績報告，生成式AI相關(guān)收入同比增長高達670.4%，占整體收入的比重漲至20.3%。生成式AI取得不錯的商業(yè)化成績，已貢獻了很有存在感的收入體量。

商湯已經(jīng)建立了涵蓋底層基礎(chǔ)設(shè)施到上層模型的完整AI大模型服務(wù)體系。報告期內(nèi)，商湯發(fā)布了應(yīng)用于不同場景的生成式AI產(chǎn)品系列，包括商量、秒畫、如影、瓊宇、格物，分別對應(yīng)著自然語言交互、AI文生圖、數(shù)字人、3D大場景重建、3D小物體生成這五個主流的生成式AI應(yīng)用。商湯還提供諸如自動化數(shù)據(jù)標(biāo)注、自定義大模型訓(xùn)練、模型增量訓(xùn)練、模型推理部署以及開發(fā)者效率提升等一系列MaaS服務(wù)，利用自己已經(jīng)擁有的通用大模型，向客戶提供多種大模型能力，去幫助用戶更方便和快速的訓(xùn)練自己垂直領(lǐng)域的模型。

圖：商湯的MaaS模式

資料來源：華泰證券研究所

上半年，商湯在智慧商業(yè)、智慧生活、智能汽車和智慧城市四大業(yè)務(wù)線積極推廣生成式AI業(yè)務(wù)，并取得不錯反響。其中，智慧商業(yè)板塊，商湯開始為客戶定制行業(yè)大模型，推動單客戶收入同比增長60%。

商湯的大模型甚至還實現(xiàn)了出海，把大模型的商業(yè)化版圖延伸至海外市場。商湯在中期業(yè)績報告中指出，公司根據(jù)海外市場的語言和文化差異，定制了特定需求的模型，助力全球合作伙伴成為真正的AGI受益者。

橫向?qū)Ρ葋砜矗鱾€大廠的通用大模型主要還停留在研發(fā)階段、有研發(fā)成果的還在摸索如何盈利。此時商湯的AI大模型已經(jīng)在加快商業(yè)化變現(xiàn)。

縱向?qū)Ρ葋砜矗绻f投資者在上一次年報中，不難看出商湯在大模型上是具備領(lǐng)先技術(shù)實力的；那么在這次業(yè)績報告中，我們則可以清晰看到商湯大模型在短短的半年內(nèi)取得非常明顯的商業(yè)化進展。尤其是，財務(wù)指標(biāo)都是后視指標(biāo)，商業(yè)化的速度往往遠遠早于業(yè)績兌現(xiàn)的速度。因此，財報中的那些數(shù)據(jù)還難以反應(yīng)全部的商湯大模型商業(yè)化成果。

領(lǐng)先的商業(yè)化進程不可能是空中樓閣。

這一切都有跡可循。

扼住大模型咽喉的算力

隨著港美A三地的業(yè)績密集披露期到來，科技企業(yè)的中報出現(xiàn)十分有意思的分化。

我們可以看到，外國科技大廠基本都在增加CAPEX，數(shù)據(jù)中心的生意雖然仍未恢復(fù)到以前高峰增長時期，但是也依然受AI拉動了一波。

但國內(nèi)的數(shù)據(jù)中心生意卻沒有明顯起色，甚至在下滑。“需求非常大，但受制于供給瓶頸”，相關(guān)廠商都是這么表述。準(zhǔn)確的說，我們受制于芯片供給瓶頸，并不能滿足中國AI模型訓(xùn)練和推理的需求。我們的數(shù)據(jù)中心沒有足夠的AI算力，因為我們的服務(wù)器廠商沒有足夠的高端GPU。

芯片，就是算力的根本，而算力是大模型的血液。AIGC背后支撐的千億級參數(shù)超大模型，其計算訓(xùn)練輸出結(jié)果需要強大的算力支撐，

但也并非沒有變通之道——英偉達推出了數(shù)據(jù)傳輸速度相對較慢的A800、H100和H800，這些型號用來代替A100向中國出口。

但慢，則意味著需要更多的芯片堆疊。根據(jù)媒體報道，百度、騰訊、阿里巴巴以及字節(jié)跳動公司今年向英偉達下達的交付訂單金額達到10億美元，總共采購約10萬張A800芯片。平均下來，每個公司下單了2.5萬張的采購需求。全球產(chǎn)能本來已經(jīng)非常緊張，這進一步加劇了英偉達供不應(yīng)求困境。目前相關(guān)產(chǎn)品不僅漲價，交貨期還很長，連A800/H800都要到今年底或明年才能交貨。中美大廠都在緊急搶產(chǎn)能，中國廠商更是大肆囤貨，以應(yīng)對將來的復(fù)雜國際環(huán)境。

算力問題，已經(jīng)成為能否做好大模型的瓶頸問題。

但算力正好是商湯的長處——商湯自誕生之日起就是AI公司，其算力設(shè)施自然是滿足AI要求的算力設(shè)施。當(dāng)前業(yè)界訓(xùn)練大模型對大算力的需求非常旺盛，并且真正好用的基礎(chǔ)設(shè)施十分稀缺。全球TOP10超算中心中，以GPU為核心算力的僅有六家；在中國AI數(shù)據(jù)中心更為稀缺。

早于2022年1月，商湯就正式啟用了上海臨港智算中心。這是一個全球領(lǐng)先的超大型人工智能計算中心(AIDC)，能提供開放、大規(guī)模、低碳節(jié)能的先進AI計算基礎(chǔ)設(shè)施，可以滿足AIGC大模型的訓(xùn)練與推理需求。我們目前并不能知道商湯還有多少塊GPU儲存，不過可以找到間接數(shù)據(jù)作為輔佐。在AIDC的基礎(chǔ)上，商湯建設(shè)了業(yè)界領(lǐng)先的AI大裝置SenseCore，這是亞洲目前最大的智能計算平臺之一。根據(jù)中期業(yè)績報告，商湯AI大裝置SenseCore上線GPU數(shù)量已由3月底的27,000塊提升至約30,000塊，算力規(guī)模提升20%至6 ExaFLOPS。根據(jù)不同的機構(gòu)測算，GPT-4的訓(xùn)練需要的A100上數(shù)量大約在10000-25000張的區(qū)間。商湯的算力規(guī)模足以讓它再造一個通用大模型。

目前，商湯已經(jīng)搭建了較為成熟的日日新大模型體系，因此大量GPU被投入于打造生成式AI產(chǎn)品系列上去。根據(jù)業(yè)績報告，商湯共投入上萬塊GPU到大語言模型商量SenseChat的研發(fā)上，約2,000塊GPU在文生圖模型的研發(fā)上，這大大加快了商湯大模型與應(yīng)用場景的結(jié)合。

另外，商湯在依托大裝置訓(xùn)練大模型時，也通過強大的數(shù)據(jù)清洗能力大大提升模型的效果。目前商湯每月能夠產(chǎn)出約2萬億token的高質(zhì)量數(shù)據(jù)，預(yù)計年底高質(zhì)量數(shù)據(jù)儲備將突破10萬億token，足以支持更加強大的基模型的訓(xùn)練。

另外，得益于算力布局上的深厚積累，商湯通過優(yōu)秀的系統(tǒng)架構(gòu)、網(wǎng)絡(luò)架構(gòu)、訓(xùn)練框架及算法多方面的聯(lián)和優(yōu)化，將大量的GPU高效連接，使其產(chǎn)生極高的并行效率。無論是最開始的1千張卡級，還是未來的1萬張卡級，隨著集群規(guī)模的增長，商湯一直以先進的技術(shù)優(yōu)勢保障并行效率。另外，商湯也不斷總結(jié)經(jīng)驗，通過增加硬件的可靠程度及軟件的容錯能力，支撐萬卡級的人工智能大模型并行訓(xùn)練，保障算力中心長時間、無故障運行。

總結(jié)一下，商湯重視芯片等底層硬件基礎(chǔ)設(shè)施投入，具備強大的數(shù)據(jù)清洗能力，再加上其自建的AIDC算力集群大大壓縮應(yīng)用模型的訓(xùn)練時間，再以積累的豐富經(jīng)驗對整體算力中心進行調(diào)優(yōu)。這些因素讓商湯得以在生成式AI的商業(yè)化方面實現(xiàn)領(lǐng)先。

更根本的原因：中國大模型工業(yè)化生產(chǎn)開創(chuàng)者

在大模型研發(fā)成果的基礎(chǔ)上，商湯打造了“商湯日日新SenseNova”大模型及研發(fā)體系。“日日新大模型”目前整體參數(shù)量達到5000億，能提供自然語言生成、文生圖、感知模型標(biāo)注、以及模型研發(fā)功能。在“日日新”大模型上，商湯能實現(xiàn)大模型預(yù)訓(xùn)練，僅通過較少和微調(diào)就能高效生產(chǎn)AI模型。

從商湯大語言模型產(chǎn)品的更迭中，我們可以清晰得看到“日日新”底層大模型的效率：

4月，商湯推出商量SenseChat1.0，是國內(nèi)最早的基于千億參數(shù)大語言模型的聊天機器人產(chǎn)品之一；6月，商湯聯(lián)合上海人工智能實驗室等多家國內(nèi)頂尖科研機構(gòu)發(fā)布基模型書生·浦語（InternLM）；7月初商湯發(fā)布商量SenseChat2.0；8月，商湯的新模型InternLM-123B完成訓(xùn)練。InternLM-123B在全球51個知名評測集（包括MMLU,AGIEval,ARC,CEval,Race,GSM8K等）共計30萬道問題集合上測試成績整體排名全球第二，超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型。

目前，在“日日新”的基礎(chǔ)上，商湯快速形成豐富的生成式AI產(chǎn)品，囊括了自然語言交互、AI文生圖、數(shù)字人、3D大場景重建、3D小物體生成這五個主流領(lǐng)域，使得商湯得以高效應(yīng)對多樣化、碎片化的應(yīng)用場景。

有了適用、好用、有競爭力的產(chǎn)品，AI公司才能快速在應(yīng)用場景落地，實現(xiàn)商業(yè)化。這是商湯具備較高商業(yè)化能力的最關(guān)鍵因素之一。

“大模型對AI生產(chǎn)力的改進，并不亞于第一次工業(yè)革命的珍妮紡紗機。

憑借著“大模型+大算力”的優(yōu)勢，商湯正在加速開啟“21世紀(jì)的珍妮紡紗機”，并走向更光明的商業(yè)化前景。

關(guān)鍵詞：

責(zé)任編輯：QL0009