伊人成人精品,久久成人激情视频,亚洲精品中文字幕视频,精品国产污,在线人成免费视频,av福利网址,狠狠干视频网站

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

紅包大戰(zhàn)正酣,算力租賃賺翻?這家廠商全線產(chǎn)品漲價,需求已轉(zhuǎn)為“訓(xùn)練+推理”雙輪驅(qū)動

2026-02-12 20:34:23

AI大模型正從生成式邁向代理式,騰訊、阿里等廠商紅包大戰(zhàn),催生了對AI基礎(chǔ)設(shè)施的巨大需求,算力租賃廠商成為贏家。云服務(wù)商優(yōu)刻得宣布全線產(chǎn)品漲價,亞馬遜云科技也上調(diào)價格。云服務(wù)商人士認(rèn)為,公有云漲價主因是推理需求爆發(fā)式增長,其中Agent需求是主要增長因素,算力需求已轉(zhuǎn)變?yōu)橛?xùn)練+推理雙輪驅(qū)動。AI推理將呈“云—邊—端協(xié)同”的混合架構(gòu)。

每經(jīng)記者|朱成祥    每經(jīng)編輯|陳旭    

當(dāng)下,AI大模型正處于從生成式AI走向代理式AI的關(guān)鍵時刻。在此背景下,騰訊、阿里等廠商不惜大發(fā)紅包以爭奪用戶。

在大模型廠商紅包大戰(zhàn)尚未分出勝負(fù)之際,算力租賃廠商卻成為當(dāng)下實實在在的贏家。正如服飾品牌李維斯的故事那般,最終贏家不是在加州挖金子的礦工,而是賣牛仔褲的李維斯。在這一輪大模型紅包大戰(zhàn)中,算力租賃賺得盆滿缽滿。

近日,云服務(wù)商優(yōu)刻得宣布漲價。在被問及具體哪些產(chǎn)品漲價時,優(yōu)刻得相關(guān)工作人員告訴《每日經(jīng)濟新聞》記者(以下簡稱每經(jīng)記者),“全線產(chǎn)品(都會上漲),具體會根據(jù)客戶資源使用情況給出方案?!?/p>

紅包大戰(zhàn)帶來對AI基礎(chǔ)設(shè)施的巨大需求

2015年除夕,微信支付憑借搖一搖搶紅包,迅速爆發(fā)。而這一波,騰訊元寶發(fā)紅包之后,阿里巴巴、百度、字節(jié)跳動也紛紛下場。

紅包大戰(zhàn),也使得對AI基礎(chǔ)設(shè)施的需求大增。

近日,國內(nèi)云服務(wù)廠商優(yōu)刻得宣布,因全球供應(yīng)鏈波動持續(xù)加劇,核心硬件采購等基礎(chǔ)設(shè)施成本出現(xiàn)顯著、結(jié)構(gòu)性的上漲,經(jīng)過慎重評估,公司決定自2026年3月1日起,對續(xù)簽及新簽用戶的全線產(chǎn)品與服務(wù)進行價格上浮調(diào)整。

漲價緣由是硬件成本提升,還是推理側(cè)需求過于旺盛而導(dǎo)致供不應(yīng)求?優(yōu)刻得上述工作人員回復(fù)稱:“兩方面(原因)都有,主要是硬件成本上升,近期需求也在增加。當(dāng)前的價格調(diào)整,也是行業(yè)從‘資源出租’向‘能力服務(wù)’轉(zhuǎn)變的體現(xiàn)?!?/p>

不僅僅是國內(nèi)廠商在漲價。1月23日,全球云計算巨頭亞馬遜云科技宣布對其面向大模型訓(xùn)練的EC2機器學(xué)習(xí)容量塊實施約15%的價格上調(diào),這是AWS(亞馬遜云計算服務(wù))約20年來首次打破“只降不漲”的定價傳統(tǒng)。機器學(xué)習(xí)容量塊是AWS為應(yīng)對高性能GPU(圖形處理器)等稀缺計算資源供需失衡所推出的定制化服務(wù)模式,用戶可提前預(yù)訂指定型號的GPU實例,確保關(guān)鍵算力資源的穩(wěn)定供給。

開源證券認(rèn)為,AWS作為亞馬遜核心的公有云平臺,此次漲價一方面再次確認(rèn)了全球AI算力需求端的高景氣度,另一方面從供給角度來看,AI云產(chǎn)業(yè)鏈資源稀缺性或日益凸顯。

Agent拉動推理需求呈指數(shù)級上漲

對于公有云漲價,云服務(wù)商派歐云(PPIO)工作人員告訴每經(jīng)記者,主要原因是推理需求的爆發(fā)式增長,其中Agent(智能體)的需求是主要增長因素;其次推理成本的上漲動力還來自服務(wù)質(zhì)量的持續(xù)提高,高SLA(服務(wù)等級協(xié)議)、低時延、長上下文、多模態(tài)等服務(wù)會產(chǎn)生支付溢價。

如果說紅包大戰(zhàn)帶來的是用戶人數(shù)增加從而帶來算力需求提升,那么Agent的盛行,對推理算力需求的提升則更為龐大。

優(yōu)刻得上述工作人員表示:“算力需求已從訓(xùn)練驅(qū)動的單一模式,轉(zhuǎn)變?yōu)橛?xùn)練+推理雙輪驅(qū)動且推理占比不斷上升的新模式。Agent的實時交互、多輪推理、工具調(diào)用與自主規(guī)劃等能力,使得單次任務(wù)所需的推理次數(shù)呈指數(shù)級上升?!?/p>

PPIO工作人員也對每經(jīng)記者表示:“Agent的廣泛應(yīng)用放大了Token(詞元)的消耗,進而推高算力需求,一方面Agent推理上下文逐漸增加到200K以上,另一方面由于計算復(fù)雜度與上下文長度是平方關(guān)系,長上下文對算力的需求呈指數(shù)級增長。據(jù)我們估算,Agent場景下單用戶的Token消耗量是普通Chat的10倍至50倍,此外Agent對內(nèi)存的需求也在持續(xù)增加,主要體現(xiàn)在Agent工具的數(shù)據(jù)記憶需求?!?/p>

值得注意的是,AI推理不僅有云端,也有邊緣側(cè)、端側(cè)設(shè)備。那么,即時性的要求是否會助推邊緣側(cè)、端側(cè)AI推理需求增長?

對此,PPIO工作人員表示:“至于邊緣和端側(cè),我認(rèn)為會增加部署,但會是“云—邊—端協(xié)同”的混合架構(gòu):實時性強、隱私要求高、網(wǎng)絡(luò)不穩(wěn)定的場景會下沉到端和邊緣,用小模型或本地推理保證響應(yīng);而需要最強通用能力、快速迭代的大模型能力,仍會集中在云端。關(guān)鍵不在把所有算力搬到端上,而在把任務(wù)鏈路切分得更合理?!?/p>

優(yōu)刻得工作人員也表示:“我們會根據(jù)客戶的需求來部署我們的產(chǎn)品和資源。根據(jù)不同業(yè)務(wù)場景對延遲、成本、合規(guī)性的差異化要求,靈活調(diào)度云端、邊緣與端側(cè)算力資源?!?/p>

封面圖片來源:每經(jīng)媒資庫

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

2

0