2025/4/18 15:09

谷歌首推Gemini 2.5 Flash：成本爆降600%

快科技鹿角

據(jù)報道，谷歌發(fā)布了突破性混合推理模型Gemini 2.5 Flash，該模型創(chuàng)新性地引入可調(diào)節(jié)"思考預(yù)算"功能，在保持高性能的同時顯著降低使用成本。

在閉源思考模式下，其成本僅為0.6美元/百萬tokens，相比全功能思考模式（3.5美元/百萬tokens）大幅降低600%。值得注意的是，即便在基礎(chǔ)模式下運行，其性能依然超越前代Gemini 2.0 Flash。

性能表現(xiàn)方面，Gemini 2.5 Flash在大模型排行榜中以1392分ELO評分高居第二，僅次于GPT-4.5-preview，與Grok-3表現(xiàn)相當(dāng)。

具體任務(wù)測試中，該模型展現(xiàn)出顯著優(yōu)勢：在GPQA知識問答中，24K思考預(yù)算可帶來6%的性能提升；在LiveCodeBench代碼基準(zhǔn)測試中，16K思考預(yù)算時達到最佳表現(xiàn)。

對比測試結(jié)果顯示，Gemini 2.5 Flash在多模態(tài)推理和數(shù)學(xué)任務(wù)上明顯優(yōu)于Claude 3.7 Sonnet，綜合性能與OpenAI最新o4-mini模型不相上下。在模擬人類綜合能力的"人類最后一次考試"基準(zhǔn)測試中，該模型以12.1%的高分位列第二，再次印證其強大實力。

此次發(fā)布的Gemini 2.5 Flash通過創(chuàng)新的"思考預(yù)算"機制，在性能與成本之間實現(xiàn)了突破性平衡，為AI應(yīng)用開發(fā)提供了更靈活、更經(jīng)濟的選擇。

給作者點贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個人觀點，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

相關(guān)鏈接

測試

谷歌 Pixel 9a 加入安卓 16 Beta 測試計劃，可注冊手機靜候 OTA 推送
IT之家漾仔4-18
最強 AI 搜索模型：Perplexity 競技場奪冠，Sonar 力克谷歌 Gemini
IT之家故淵4-16
谷歌為安卓推新安全功能：手機連續(xù)鎖定三天將自動重啟
IT之家遠洋4-16
谷歌 Veo 2 視頻生成模型入駐 Gemini，用戶可創(chuàng)建 8 秒 720p 視頻
IT之家遠洋4-16