據(jù)媒體周五報(bào)道,Meta有望在本月發(fā)布的新一代開(kāi)源大語(yǔ)言模型Llama 4。此前這款大語(yǔ)言模型的發(fā)布已至少經(jīng)歷兩次延期,目前仍存在再度推遲可能。

Meta新一代AI大模型Llama 4發(fā)布在即 此前兩度延期  第1張

  這距離前代模型Llama 3的發(fā)布已過(guò)去近一年,凸顯出Meta在AI軍備競(jìng)賽中面臨的技術(shù)挑戰(zhàn)。

  據(jù)Meta內(nèi)部測(cè)試顯示Llama 4在數(shù)學(xué)推理(GSM8K基準(zhǔn))和代碼生成(HumanEval)準(zhǔn)確率較Llama 3提升37%。

  這款大語(yǔ)言模型多次延期的主因是多模態(tài)訓(xùn)練數(shù)據(jù)清洗遇阻,特別是視頻-文本對(duì)齊質(zhì)量未達(dá)預(yù)期。該模型需協(xié)調(diào)16000塊H100 GPU集群,能源消耗較Llama 3訓(xùn)練增加2.3倍。

  行業(yè)觀察人士指出,若再度延期,Meta將錯(cuò)過(guò)6月開(kāi)發(fā)者大會(huì)的關(guān)鍵展示窗口。而競(jìng)爭(zhēng)對(duì)手Anthropic的Claude 4和谷歌Gemini 2.0已分別計(jì)劃在Q3發(fā)布重大更新。