午夜不卡影院-午夜不卡在线观看-午夜超爽手机-午夜成年人网站-午夜成人-午夜成人a

商湯用“大模型+大算力”,打造AI商業(yè)化新范式

時間: 2023-08-30 21:11:16 來源: 格隆匯

ChatGPT橫空出世,開啟了AI的2.0時代。

iPhone的問世為iPhone黃金時代揭開了序幕,也帶來了上一輪科技革命。現(xiàn)在市場各方期待著,“AI的iPhone時刻”會開啟怎么樣的新世界。


(資料圖)

國內(nèi)國際廠商紛紛跟進潮流,搶占大模型高地,“百團大戰(zhàn)”如火如荼。

有人認(rèn)為,我們距大模型真正落地還很遙遠。我本來也持有類似的觀點,直到我看到商湯的財報——

一系列引人關(guān)注的數(shù)據(jù)和舉措:

根據(jù)中期業(yè)績報告,生成式AI相關(guān)收入同比增長高達670.4%,占整體收入的比重漲至20.3%。生成式AI取得不錯的商業(yè)化成績,已貢獻了很有存在感的收入體量。

商湯已經(jīng)建立了涵蓋底層基礎(chǔ)設(shè)施到上層模型的完整AI大模型服務(wù)體系。報告期內(nèi),商湯發(fā)布了應(yīng)用于不同場景的生成式AI產(chǎn)品系列,包括商量、秒畫、如影、瓊宇、格物,分別對應(yīng)著自然語言交互、AI文生圖、數(shù)字人、3D大場景重建、3D小物體生成這五個主流的生成式AI應(yīng)用。商湯還提供諸如自動化數(shù)據(jù)標(biāo)注、自定義大模型訓(xùn)練、模型增量訓(xùn)練、模型推理部署以及開發(fā)者效率提升等一系列MaaS服務(wù),利用自己已經(jīng)擁有的通用大模型,向客戶提供多種大模型能力,去幫助用戶更方便和快速的訓(xùn)練自己垂直領(lǐng)域的模型。

圖:商湯的MaaS模式

資料來源:華泰證券研究所

上半年,商湯在智慧商業(yè)、智慧生活、智能汽車和智慧城市四大業(yè)務(wù)線積極推廣生成式AI業(yè)務(wù),并取得不錯反響。其中,智慧商業(yè)板塊,商湯開始為客戶定制行業(yè)大模型,推動單客戶收入同比增長60%。

商湯的大模型甚至還實現(xiàn)了出海,把大模型的商業(yè)化版圖延伸至海外市場。商湯在中期業(yè)績報告中指出,公司根據(jù)海外市場的語言和文化差異,定制了特定需求的模型,助力全球合作伙伴成為真正的AGI受益者。

橫向?qū)Ρ葋砜矗鱾€大廠的通用大模型主要還停留在研發(fā)階段、有研發(fā)成果的還在摸索如何盈利。此時商湯的AI大模型已經(jīng)在加快商業(yè)化變現(xiàn)。

縱向?qū)Ρ葋砜矗绻f投資者在上一次年報中,不難看出商湯在大模型上是具備領(lǐng)先技術(shù)實力的;那么在這次業(yè)績報告中,我們則可以清晰看到商湯大模型在短短的半年內(nèi)取得非常明顯的商業(yè)化進展。尤其是,財務(wù)指標(biāo)都是后視指標(biāo),商業(yè)化的速度往往遠遠早于業(yè)績兌現(xiàn)的速度。因此,財報中的那些數(shù)據(jù)還難以反應(yīng)全部的商湯大模型商業(yè)化成果。

領(lǐng)先的商業(yè)化進程不可能是空中樓閣。

這一切都有跡可循。

扼住大模型咽喉的算力

隨著港美A三地的業(yè)績密集披露期到來,科技企業(yè)的中報出現(xiàn)十分有意思的分化。

我們可以看到,外國科技大廠基本都在增加CAPEX,數(shù)據(jù)中心的生意雖然仍未恢復(fù)到以前高峰增長時期,但是也依然受AI拉動了一波。

但國內(nèi)的數(shù)據(jù)中心生意卻沒有明顯起色,甚至在下滑。“需求非常大,但受制于供給瓶頸”,相關(guān)廠商都是這么表述。準(zhǔn)確的說,我們受制于芯片供給瓶頸,并不能滿足中國AI模型訓(xùn)練和推理的需求。我們的數(shù)據(jù)中心沒有足夠的AI算力,因為我們的服務(wù)器廠商沒有足夠的高端GPU。

芯片,就是算力的根本,而算力是大模型的血液。AIGC背后支撐的千億級參數(shù)超大模型,其計算訓(xùn)練輸出結(jié)果需要強大的算力支撐,

但也并非沒有變通之道——英偉達推出了數(shù)據(jù)傳輸速度相對較慢的A800、H100和H800,這些型號用來代替A100向中國出口。

但慢,則意味著需要更多的芯片堆疊。根據(jù)媒體報道,百度、騰訊、阿里巴巴以及字節(jié)跳動公司今年向英偉達下達的交付訂單金額達到10億美元,總共采購約10萬張A800芯片。平均下來,每個公司下單了2.5萬張的采購需求。全球產(chǎn)能本來已經(jīng)非常緊張,這進一步加劇了英偉達供不應(yīng)求困境。目前相關(guān)產(chǎn)品不僅漲價,交貨期還很長,連A800/H800都要到今年底或明年才能交貨。中美大廠都在緊急搶產(chǎn)能,中國廠商更是大肆囤貨,以應(yīng)對將來的復(fù)雜國際環(huán)境。

算力問題,已經(jīng)成為能否做好大模型的瓶頸問題。

但算力正好是商湯的長處——商湯自誕生之日起就是AI公司,其算力設(shè)施自然是滿足AI要求的算力設(shè)施。當(dāng)前業(yè)界訓(xùn)練大模型對大算力的需求非常旺盛,并且真正好用的基礎(chǔ)設(shè)施十分稀缺。全球TOP10超算中心中,以GPU為核心算力的僅有六家;在中國AI數(shù)據(jù)中心更為稀缺。

早于2022年1月,商湯就正式啟用了上海臨港智算中心。這是一個全球領(lǐng)先的超大型人工智能計算中心(AIDC),能提供開放、大規(guī)模、低碳節(jié)能的先進AI計算基礎(chǔ)設(shè)施,可以滿足AIGC大模型的訓(xùn)練與推理需求。我們目前并不能知道商湯還有多少塊GPU儲存,不過可以找到間接數(shù)據(jù)作為輔佐。在AIDC的基礎(chǔ)上,商湯建設(shè)了業(yè)界領(lǐng)先的AI大裝置SenseCore,這是亞洲目前最大的智能計算平臺之一。根據(jù)中期業(yè)績報告,商湯AI大裝置SenseCore上線GPU數(shù)量已由3月底的27,000塊提升至約30,000塊,算力規(guī)模提升20%至6 ExaFLOPS。根據(jù)不同的機構(gòu)測算,GPT-4的訓(xùn)練需要的A100上數(shù)量大約在10000-25000張的區(qū)間。商湯的算力規(guī)模足以讓它再造一個通用大模型。

目前,商湯已經(jīng)搭建了較為成熟的日日新大模型體系,因此大量GPU被投入于打造生成式AI產(chǎn)品系列上去。根據(jù)業(yè)績報告,商湯共投入上萬塊GPU到大語言模型商量SenseChat的研發(fā)上,約2,000塊GPU在文生圖模型的研發(fā)上,這大大加快了商湯大模型與應(yīng)用場景的結(jié)合。

另外,商湯在依托大裝置訓(xùn)練大模型時,也通過強大的數(shù)據(jù)清洗能力大大提升模型的效果。目前商湯每月能夠產(chǎn)出約2萬億token的高質(zhì)量數(shù)據(jù),預(yù)計年底高質(zhì)量數(shù)據(jù)儲備將突破10萬億token,足以支持更加強大的基模型的訓(xùn)練。

另外,得益于算力布局上的深厚積累,商湯通過優(yōu)秀的系統(tǒng)架構(gòu)、網(wǎng)絡(luò)架構(gòu)、訓(xùn)練框架及算法多方面的聯(lián)和優(yōu)化,將大量的GPU高效連接,使其產(chǎn)生極高的并行效率。無論是最開始的1千張卡級,還是未來的1萬張卡級,隨著集群規(guī)模的增長,商湯一直以先進的技術(shù)優(yōu)勢保障并行效率。另外,商湯也不斷總結(jié)經(jīng)驗,通過增加硬件的可靠程度及軟件的容錯能力,支撐萬卡級的人工智能大模型并行訓(xùn)練,保障算力中心長時間、無故障運行。

總結(jié)一下,商湯重視芯片等底層硬件基礎(chǔ)設(shè)施投入,具備強大的數(shù)據(jù)清洗能力,再加上其自建的AIDC算力集群大大壓縮應(yīng)用模型的訓(xùn)練時間,再以積累的豐富經(jīng)驗對整體算力中心進行調(diào)優(yōu)。這些因素讓商湯得以在生成式AI的商業(yè)化方面實現(xiàn)領(lǐng)先。

更根本的原因:中國大模型工業(yè)化生產(chǎn)開創(chuàng)者

在大模型研發(fā)成果的基礎(chǔ)上,商湯打造了“商湯日日新SenseNova”大模型及研發(fā)體系。“日日新大模型”目前整體參數(shù)量達到5000億,能提供自然語言生成、文生圖、感知模型標(biāo)注、以及模型研發(fā)功能。在“日日新”大模型上,商湯能實現(xiàn)大模型預(yù)訓(xùn)練,僅通過較少和微調(diào)就能高效生產(chǎn)AI模型。

從商湯大語言模型產(chǎn)品的更迭中,我們可以清晰得看到“日日新”底層大模型的效率:

4月,商湯推出商量SenseChat1.0,是國內(nèi)最早的基于千億參數(shù)大語言模型的聊天機器人產(chǎn)品之一;6月,商湯聯(lián)合上海人工智能實驗室等多家國內(nèi)頂尖科研機構(gòu)發(fā)布基模型書生·浦語(InternLM);7月初商湯發(fā)布商量SenseChat2.0;8月,商湯的新模型InternLM-123B完成訓(xùn)練。InternLM-123B在全球51個知名評測集(包括MMLU,AGIEval,ARC,CEval,Race,GSM8K等)共計30萬道問題集合上測試成績整體排名全球第二,超過GPT-3.5-turbo以及Meta新發(fā)布的LLaMA2-70B等模型。

目前,在“日日新”的基礎(chǔ)上,商湯快速形成豐富的生成式AI產(chǎn)品,囊括了自然語言交互、AI文生圖、數(shù)字人、3D大場景重建、3D小物體生成這五個主流領(lǐng)域,使得商湯得以高效應(yīng)對多樣化、碎片化的應(yīng)用場景。

有了適用、好用、有競爭力的產(chǎn)品,AI公司才能快速在應(yīng)用場景落地,實現(xiàn)商業(yè)化。這是商湯具備較高商業(yè)化能力的最關(guān)鍵因素之一。

“大模型對AI生產(chǎn)力的改進,并不亞于第一次工業(yè)革命的珍妮紡紗機。

憑借著“大模型+大算力”的優(yōu)勢,商湯正在加速開啟“21世紀(jì)的珍妮紡紗機”,并走向更光明的商業(yè)化前景。

關(guān)鍵詞:

責(zé)任編輯:QL0009

為你推薦

關(guān)于我們| 聯(lián)系我們| 投稿合作| 法律聲明| 廣告投放

版權(quán)所有 © 2020 跑酷財經(jīng)網(wǎng)

所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀網(wǎng)站聲明。本站不作任何非法律允許范圍內(nèi)服務(wù)!

聯(lián)系我們:315 541 [email protected]

主站蜘蛛池模板: 欧美一区色 | 国产精品女同 | 欧美一级大| 国产伦理一区 | 精品国产不 | 成人一区二区三区 | 日本一区成人 | 韩国免费一级a一片 | 成人精品视频 | 国语自产拍在线观 | 蜜桃色永久入口 | 国产三j | 国内不卡视频一区 | 国产日产欧产美韩 | 日本国产在线播 | 欧美日韩国产精品选 | 日韩午夜免费 | 日本成人精品一区 | 国产又猛又黄又爽 | 国产手机| 91视频一区在线 | 区三区放荡人妇 | 国产噜噜噜精品免费 | 国产91小视 | 日本免费一级二级三 | 午夜福利电影在线 | 日本成人卡一 | 日韩国产欧美经典 | 日本A区网址| 国产伦子伦精品 | 国内在线第一区 | 日韩中文高清一 | 18毛多| 精品玖玖玖视 | 无码毛片一区二 | 国产精品福 | 日韩色婷 | 精品电影在线观看 | 九九热这里 | 国产丝袜视频在线 | 日本精品a在线观看 |