C114通信網(wǎng)  |  通信人家園

人工智能
2025/4/18 11:10

OpenAI 上線 Flex 處理模式:API 費用減半,但犧牲響應速度及穩(wěn)定性

IT之家  清源

據(jù)外媒 TechCrunch 今日報道,為在與谷歌等生成式 AI 競爭對手的較量中進一步加大投入,OpenAI 宣布推出“Flex 處理模式”新的 API 服務 —— 用戶以接受響應速度變慢和“資源偶爾無法分配”為代價,換取更優(yōu)惠的模型使用價格。

OpenAI 表示,F(xiàn)lex 處理目前已對新近發(fā)布的 o3 和 o4-mini 推理模型開放測試,主要面向模型評估、數(shù)據(jù)擴充、異步處理等優(yōu)先級較低的“非生產”任務。

采用 Flex 處理,API 費用將直接減半。以 o3 為例,F(xiàn)lex 模式下的費用為每百萬輸入 tokens 收取 5 美元(IT之家注:現(xiàn)匯率約合 36.5 元人民幣,相當于約合 75 萬字),每百萬輸出 tokens 收取 20 美元(現(xiàn)匯率約合 146 元人民幣)。

作為參考,標準價格分別為 10 美元和 40 美元。對于 o4-mini,F(xiàn)lex 模式的費用則從每百萬輸入 tokens 收取 1.10 美元、每百萬輸出 tokens 收取 4.40 美元,降至每百萬輸入 tokens 收取 0.55 美元(現(xiàn)匯率約合 4 元人民幣)和每百萬輸出 tokens 收取 2.20 美元(現(xiàn)匯率約合 16.1 元人民幣)。

OpenAI 在向客戶發(fā)送的通知郵件中還表示,按照公司用戶的消費層級劃分,處于第 1 至第 3 層的開發(fā)者必須完成新上線的身份驗證流程,方可獲取 o3 的訪問權限。此外,OpenAI 指出,o3 及其他模型的推理摘要功能和流式 API 服務同樣需要完成身份驗證后才能啟用。

OpenAI 此前強調,身份驗證機制的目的是防止用戶違反公司制定的使用政策。

給作者點贊
0 VS 0
寫得不太好

免責聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權所有 舉報電話:021-54451141