C114通信網(wǎng)  |  通信人家園

人工智能
2025/4/18 15:09

谷歌首推Gemini 2.5 Flash:成本爆降600%

快科技  鹿角

據(jù)報道,谷歌發(fā)布了突破性混合推理模型Gemini 2.5 Flash,該模型創(chuàng)新性地引入可調(diào)節(jié)"思考預(yù)算"功能,在保持高性能的同時顯著降低使用成本。

在閉源思考模式下,其成本僅為0.6美元/百萬tokens,相比全功能思考模式(3.5美元/百萬tokens)大幅降低600%。值得注意的是,即便在基礎(chǔ)模式下運行,其性能依然超越前代Gemini 2.0 Flash。

性能表現(xiàn)方面,Gemini 2.5 Flash在大模型排行榜中以1392分ELO評分高居第二,僅次于GPT-4.5-preview,與Grok-3表現(xiàn)相當(dāng)。

具體任務(wù)測試中,該模型展現(xiàn)出顯著優(yōu)勢:在GPQA知識問答中,24K思考預(yù)算可帶來6%的性能提升;在LiveCodeBench代碼基準(zhǔn)測試中,16K思考預(yù)算時達到最佳表現(xiàn)。

對比測試結(jié)果顯示,Gemini 2.5 Flash在多模態(tài)推理和數(shù)學(xué)任務(wù)上明顯優(yōu)于Claude 3.7 Sonnet,綜合性能與OpenAI最新o4-mini模型不相上下。在模擬人類綜合能力的"人類最后一次考試"基準(zhǔn)測試中,該模型以12.1%的高分位列第二,再次印證其強大實力。

此次發(fā)布的Gemini 2.5 Flash通過創(chuàng)新的"思考預(yù)算"機制,在性能與成本之間實現(xiàn)了突破性平衡,為AI應(yīng)用開發(fā)提供了更靈活、更經(jīng)濟的選擇。

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141