6月11日,字節(jié)跳動(dòng)(以下簡(jiǎn)稱“字節(jié)”)旗下火山引擎舉辦Force原動(dòng)力大會(huì),發(fā)布豆包大模型1.6、視頻生成模型Seedance 1.0 pro等新模型,并上線火山引擎AI云原生系列產(chǎn)品,包括升級(jí)后的Agent(智能體)開發(fā)平臺(tái),多模態(tài)數(shù)據(jù)湖,AI基礎(chǔ)設(shè)施的Agent套件、訓(xùn)練套件、推理套件等,以幫助To B客戶更好地構(gòu)建生產(chǎn)級(jí)Agent。
這也意味著,在AI Agent規(guī)?;逃迷?,國(guó)內(nèi)第一梯隊(duì)的四大玩家悉數(shù)亮相完畢。
4月底,百度(09888)創(chuàng)始人李彥宏在武漢率先出手,表示大模型應(yīng)用落地的春天已經(jīng)到來,要全面擁抱MCP(模型上下文協(xié)議)。5月21日,騰訊控股(00700)旗下騰訊云發(fā)布智能體開發(fā)平臺(tái);隨后,阿里巴巴集團(tuán)(09988,以下簡(jiǎn)稱“阿里”)CEO吳泳銘,在阿里云出海大會(huì)上表示,阿里云將在三個(gè)方面加大投入:第一,加速打造全球云計(jì)算一張網(wǎng);第二,加速模型出海,加速AI產(chǎn)品國(guó)際化;第三,打造海內(nèi)外一體的最優(yōu)服務(wù)體驗(yàn)。
據(jù)IDC報(bào)告,作為坐擁中國(guó)公有云大模型市場(chǎng)46.4%份額的頭部玩家,豆包大模型“壓軸”出手雖稍晚幾天,卻也是最“軟硬兼施”“秀肌肉”的:技術(shù)能力上,豆包已涵蓋多模態(tài)、視頻、圖像、語音、音樂等模型品類,豆包1.6模型在復(fù)雜推理、競(jìng)賽級(jí)數(shù)學(xué)、多輪對(duì)話和指令遵循等測(cè)試集上均躋身全球前列;行業(yè)應(yīng)用上,豆包大模型已服務(wù)全球TOP10手機(jī)廠商中的9家、8成主流汽車品牌、70%的系統(tǒng)重要性銀行及超5成985高校;AI Agent“價(jià)值戰(zhàn)”普惠上,豆包大模型1.6采用創(chuàng)新的“區(qū)間定價(jià)”,客戶使用成本降至三分之一,全方位推進(jìn)智能提升和應(yīng)用落地。
“PC時(shí)代主體是Web,移動(dòng)時(shí)代是App,AI時(shí)代則是Agent。Agent能夠自主感知、規(guī)劃和反思,完成復(fù)雜任務(wù)。從被動(dòng)工具轉(zhuǎn)變?yōu)橹鲃?dòng)執(zhí)行者。豆包大模型和AI云原生將持續(xù)迭代,助力企業(yè)構(gòu)建和大規(guī)模應(yīng)用Agent?!被鹕揭婵偛米T待認(rèn)為,AI時(shí)代已推動(dòng)開發(fā)范式與技術(shù)架構(gòu)的全面升級(jí),而只有通過技術(shù)和商業(yè)的雙重創(chuàng)新,才能推動(dòng)Agent的規(guī)?;瘧?yīng)用。
而面對(duì)行業(yè)頭部玩家的拼投入、拼研發(fā)、拼生態(tài)等的“拼刺刀”,字節(jié)CEO梁汝波表示:“字節(jié)致力成為優(yōu)秀的創(chuàng)新科技公司,會(huì)堅(jiān)定長(zhǎng)期投入,追求智能突破,服務(wù)產(chǎn)業(yè)應(yīng)用。通過火山引擎,持續(xù)把新模型、新技術(shù)開放給企業(yè)客戶?!?/p>
池大魚大,AI普惠戰(zhàn)略升級(jí)
2024年5月15日,火山引擎曾通過主力大模型降價(jià),掀起了大廠主力大模型的降價(jià)潮。
當(dāng)日發(fā)布會(huì)上,火山引擎宣布升級(jí)火山方舟、應(yīng)用服務(wù)、機(jī)器學(xué)習(xí)平臺(tái)、云底座的同時(shí),一口氣發(fā)布9款大模型,并巨幅調(diào)降主力大模型調(diào)用價(jià)格:豆包pro 32k模型推理輸入定價(jià)降至0.0008元/千tokens(文本基本處理單元),較同業(yè)價(jià)格“斷崖式”下降99.3%;豆包pro 128k模型正式定價(jià)0.005元/千tokens,較同業(yè)價(jià)格低95.8%。
雖然在豆包大模型降價(jià)前,國(guó)內(nèi)大模型“六小虎”之一的智譜AI,早在5月11日就宣布了降價(jià),將入門級(jí)大模型GLM-3-Turbo(上下文長(zhǎng)度128k)的價(jià)格從0.005元/千tokens降低到0.001元/千tokens,開放平臺(tái)新注冊(cè)用戶獲贈(zèng)從500 萬tokens提升至2500萬tokens(包含2000萬入門級(jí)額度和500萬企業(yè)級(jí)額度),但豆包的入場(chǎng),仍是百度、阿里、騰訊等大廠全面跟進(jìn)的“始作俑者”。
豆包降價(jià)后的5月21日,阿里云宣布通義千問主力模型Qwen-Long直降97%(0.0005元/千tokens)。降價(jià)后,阿里通義模型約為GPT-4價(jià)格的1/400,擊穿全球tokens底價(jià)的同時(shí),較之5月15日豆包大模型的0.0008元/千tokens,價(jià)格又降了30%+。同日,百度宣布文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite即刻起全面免費(fèi),開啟大模型API調(diào)用的“免費(fèi)時(shí)代”。百度相關(guān)負(fù)責(zé)人還特意強(qiáng)調(diào)稱,這兩款模型支持128k、8k上下文長(zhǎng)度,是目前百度文心大模型系列中服務(wù)用戶最多的模型型號(hào)。
一天后的5月22日,騰訊云將主力模型之一的混元-lite模型調(diào)整為全面免費(fèi);萬億參數(shù)模型混元-pro,API(應(yīng)用程序編程接口)輸入價(jià)格從0.1元/千tokens降至0.03元/千tokens,降幅達(dá)70%。同日,大模型“國(guó)家隊(duì)”科大訊飛(002230)發(fā)布公告稱,訊飛星火API能力正式免費(fèi)開放。其中,訊飛星火Lite API永久免費(fèi)開放,訊飛星火Pro/Max API低至0.21元/萬tokens。
彼時(shí),譚待在受訪中公開表示,“(豆包降價(jià))一是能做到,二是需要這么做;主力模型比行業(yè)便宜99.3% 在技術(shù)上可實(shí)現(xiàn),未來還有很多手段降低成本”,而且豆包分布式推理還有混合調(diào)度,通過發(fā)揮各種各樣的異構(gòu)算力解決了推理算力問題,進(jìn)而可以把模型推理的成本降到很低。
“以前企業(yè)做創(chuàng)新?lián)?ROI (投資回報(bào)率)打不正,一來創(chuàng)新項(xiàng)目90%會(huì)失敗,二來創(chuàng)新按消耗100 億Tokens 算就要80萬元;現(xiàn)在成本只需要8000元,失敗也花不了多少錢,但剩下10%項(xiàng)目成功就可以把投入都賺回來,這無疑能幫助更多企業(yè)輕裝上陣,無負(fù)擔(dān)投身 AI 大潮。”譚待說。
也正是基于此,在豆包跨過模型效果、推理成本、落地難度三道基本門檻后,把“蛋糕做大”成了火山引擎舉起價(jià)格“屠刀”的根本用意所在。
“對(duì)于大模型創(chuàng)業(yè)者來說,沒有哪家能靠To B業(yè)務(wù)賺很多錢,或者可以認(rèn)為通過To B 服務(wù)把自己的大模型商業(yè)模式正循環(huán)此路不通。而現(xiàn)在還是大模型創(chuàng)業(yè)特別早期的階段,池塘大魚才大,要把蛋糕做大先要做到普惠,讓很多企業(yè)能以更低成本做各種創(chuàng)新,這是更重要的。”譚待稱。
大模型一年來的飛速發(fā)展也表明,火山引擎堪稱是2024年國(guó)內(nèi)大模型“唯二”影響了行業(yè)發(fā)展走向的公司之一,另一家是2024年底的DeepSeek。
數(shù)據(jù)顯示,豆包大模型日均Tokens調(diào)用量從2024年12月的4萬億飆升至2025年5月的16.4萬億,年增長(zhǎng)率超300%,較2024年5月首次發(fā)布時(shí)增長(zhǎng)137倍;穩(wěn)居中國(guó)公有云大模型服務(wù)調(diào)用量第一,46.4%的市場(chǎng)份額超行業(yè)第二第三之和。
領(lǐng)先的市場(chǎng)份額之外,豆包模型企業(yè)級(jí)應(yīng)用場(chǎng)景快速擴(kuò)展、廣泛分布。AI 搜索、編程、視覺理解等場(chǎng)景Tokens消耗5個(gè)月增長(zhǎng)4.4倍,其中K12在線教育增長(zhǎng)12倍,智能巡檢、視頻檢索等新場(chǎng)景突破日均百億Tokens。
“豆包大模型1.6的價(jià)格體系,是火山引擎以技術(shù)創(chuàng)新為杠桿,打破行業(yè)定價(jià)規(guī)則,讓企業(yè)以更低成本獲取更強(qiáng)AI能力。正如豆包1.0開啟了大模型規(guī)模調(diào)用時(shí)代,豆包1.6將加速Agent的大規(guī)模落地,推動(dòng)AI真正成為企業(yè)增長(zhǎng)的核心引擎?!弊T待說,也正是從這個(gè)角度看,豆包大模型調(diào)用成本再降至原價(jià)1/3,既是火山引擎AI普惠的戰(zhàn)略升級(jí),更是Agent商用加速推廣的“價(jià)值戰(zhàn)”而非“價(jià)格戰(zhàn)”。
技術(shù)驅(qū)動(dòng),首創(chuàng)“區(qū)間定價(jià)”模式
之所以認(rèn)為此次降價(jià)是“價(jià)值戰(zhàn)”而非簡(jiǎn)單的“價(jià)格戰(zhàn)”,加快Agent商業(yè)落地的原因之外,還有火山引擎通過技術(shù)驅(qū)動(dòng)、首創(chuàng)大模型行業(yè)“區(qū)間定價(jià)”的引領(lǐng)意義。
IDC數(shù)據(jù)顯示,2024年中國(guó)AI Agent市場(chǎng)規(guī)模僅50億元,遠(yuǎn)低于預(yù)期,反映出企業(yè)對(duì)高成本的觀望心態(tài)。而這一現(xiàn)象的核心矛盾在于模型價(jià)格與企業(yè)實(shí)際需求的錯(cuò)配。行業(yè)統(tǒng)計(jì)表明,企業(yè)級(jí)Agent的實(shí)際應(yīng)用成本壓力相當(dāng)突出——單個(gè)Agent每日token消耗成本可達(dá)20美元。
據(jù)譚待介紹,以往的模型定價(jià)機(jī)制,是按大模型按tokens收費(fèi),輸入輸出的tokens數(shù)量直接決定成本。例如,輸入1000字的中文文本約生成1500個(gè)tokens,而輸出1000字則需約1500個(gè)tokens。這種計(jì)費(fèi)模式下,上下文長(zhǎng)度是成本的核心變量,而非模型是否開啟深度思考或多模態(tài)功能。
考慮到大模型的運(yùn)行還有其“成本遞增效應(yīng)”(隨著上下文長(zhǎng)度增加,模型處理每個(gè)token的計(jì)算復(fù)雜度呈指數(shù)級(jí)上升),則單token的成本會(huì)更高。例如,有些模型在處理超過128K tokens時(shí)收費(fèi)翻倍,因其注意力機(jī)制需與前文所有tokens進(jìn)行關(guān)聯(lián)計(jì)算。
而火山引擎統(tǒng)計(jì)發(fā)現(xiàn),當(dāng)前,超過80%的企業(yè)調(diào)用請(qǐng)求集中在32K tokens以內(nèi)。若能針對(duì)這一主流區(qū)間優(yōu)化調(diào)度,可顯著降低企業(yè)整體成本。
基于此,火山引擎通過深度技術(shù)優(yōu)化,首創(chuàng)豆包大模型1.6的“區(qū)間定價(jià)模式”,以精準(zhǔn)匹配企業(yè)需求分布,實(shí)現(xiàn)企業(yè)Agent成本與性能的雙重突破。
“首先,我們打破行業(yè)慣例,采用統(tǒng)一定價(jià),無論客戶是否開啟深度思考或多模態(tài)功能,豆包大模型1.6的token價(jià)格完全一致,讓客戶能夠以基礎(chǔ)語言模型的價(jià)格享受到高級(jí)功能?!弊T待告訴《財(cái)中社》,“其次,火山引擎通過分桶調(diào)度,精準(zhǔn)匹配客戶需求,降低客戶調(diào)用成本?!?/p>
譚待以企業(yè)主力需求的0-32K區(qū)間場(chǎng)景舉例分析稱,豆包大模型1.6輸入百萬tokens定價(jià)僅0.8元,輸出百萬tokens定價(jià)8元。以輸入輸出比3:1計(jì)算,綜合成本僅為2.6元/次,較豆包1.5 thinking和DeepSeek R1(綜合成本7元/次)下降62.9%。豆包1.6大模型調(diào)用成本降至豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為行業(yè)最低。
這其中,“分桶調(diào)度”技術(shù)的優(yōu)化至關(guān)重要。通過分桶調(diào)度,豆包1.6將80%的請(qǐng)求導(dǎo)向0-32K主力需求區(qū)間,利用短文本處理的高并行性提升效率,降低單位成本。
當(dāng)然,通過多模態(tài)原生支持,免掉客戶額外付費(fèi),按需調(diào)用圖文、音視頻等多模態(tài)能力,且性能優(yōu)于豆包1.5和DeepSeek R1;依托火山引擎與字節(jié)國(guó)內(nèi)業(yè)務(wù)并池的算力成本規(guī)模效應(yīng),同款GPU配置價(jià)格低于行業(yè)平均水平等舉措,同樣是客戶低價(jià)獲取高性能服務(wù)的關(guān)鍵。
此外,針對(duì)輸入32K、輸出200 tokens以內(nèi)的請(qǐng)求,豆包1.6輸出價(jià)格進(jìn)一步降至2元/百萬tokens,與豆包1.0持平,延續(xù)超低門檻,也是火山引擎通過設(shè)立特惠專區(qū)、覆蓋客戶非思考需求的“普惠”舉措組成部分。
而為了更好地支持Agent開發(fā)與應(yīng)用,火山引擎AI云原生全棧服務(wù)升級(jí),發(fā)布了火山引擎MCP服務(wù)、PromptPilot 智能提示工具、AI知識(shí)管理系統(tǒng)、veRL強(qiáng)化學(xué)習(xí)框架等產(chǎn)品,并推出多模態(tài)數(shù)據(jù)湖、AICC私密計(jì)算、大模型應(yīng)用防火墻,以及一系列AI Infra套件。
“深度思考、多模態(tài)和工具調(diào)用等模型能力提升,是構(gòu)建Agent的關(guān)鍵要素。同時(shí),由于Agent每次執(zhí)行任務(wù)都會(huì)消耗大量tokens,模型使用成本的降低,才能推動(dòng)Agent的規(guī)模化應(yīng)用?!弊T待表示。
“中美作為唯二的人工智能玩家,形成了非對(duì)稱的技術(shù)路徑——中國(guó)更重視下游應(yīng)用。想要發(fā)揮我們的比較優(yōu)勢(shì),就要降低應(yīng)用開發(fā)的成本,而大模型的降價(jià)無疑最為直接。”東吳證券(601555)研究所計(jì)算機(jī)行業(yè)首席分析師王紫敬告訴《財(cái)中社》。
發(fā)表評(píng)論
2025-06-13 16:19:01回復(fù)