2025/4/16 09:25

OpenAI 更新《準備框架》：聚焦識別和緩解具體風險、細化能力分類，更好應(yīng)對 AI 安全挑戰(zhàn)

IT之家故淵

OpenAI 公司今天（4 月 16 日）發(fā)布博文，宣布為更好追蹤和應(yīng)對前沿 AI 能力可能帶來的嚴重危害風險，發(fā)布新版《準備框架》（Preparedness Framework）。

IT之家注：《準備框架》是 OpenAI 在開發(fā)和部署環(huán)節(jié)，用于評估 AI 模型安全性的內(nèi)部系統(tǒng)。

新框架通過更聚焦的方式，識別并緩解具體風險，同時強化風險最小化的要求，為組織如何評估、治理和披露安全措施提供明確指引。OpenAI 還承諾，隨著技術(shù)進步，將投入更多資源，確保準備工作更具行動力、嚴謹性和透明度。

新框架為高風險能力設(shè)定了清晰的優(yōu)先級標準，通過結(jié)構(gòu)化的風險評估流程，判斷某項前沿能力是否可能導致嚴重危害。每項能力根據(jù)定義標準被歸類，并追蹤符合五項關(guān)鍵標準的能力。

此外，框架引入了更細化的能力分類，包括追蹤類別（Tracked Categories）、網(wǎng)絡(luò)安全能力（Cybersecurity capabilities）和 AI 自我改進能力（AI Self-improvement capabilities）等。

OpenAI 認為，這些領(lǐng)域?qū)?AI 在科學、工程和研究中最具變革性的益處。同時，新增的研究類別（Research Categories）涵蓋可能造成嚴重危害但尚未達到追蹤標準的領(lǐng)域，如長距離自主性（Long-range Autonomy）、故意低表現(xiàn)（Sandbagging）和自主復(fù)制與適應(yīng)（Autonomous Replication and Adaptation）等。

框架進一步明確了能力等級，簡化為“高能力”（High capability）和“關(guān)鍵能力”（Critical capability）兩個門檻。無論哪一等級，在開發(fā)和部署前均需采取足夠的安全措施，以降低嚴重危害風險。

OpenAI 內(nèi)部的安全顧問小組（Safety Advisory Group）負責審查這些措施，并向領(lǐng)導層提出建議。此外，框架引入了可擴展的評估機制，支持更頻繁的測試，并通過詳細的 Safeguards Reports 報告安全措施的設(shè)計強度和驗證效果。若其他 AI 開發(fā)者發(fā)布缺乏同等安全措施的高風險系統(tǒng)，OpenAI 可能調(diào)整自身要求，但會先確認風險形勢變化，公開承認調(diào)整，確保不增加整體風險。

給作者點贊

0 VS 0

寫得不太好

免責聲明：本文僅代表作者個人觀點，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實，對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實相關(guān)內(nèi)容。

相關(guān)鏈接

網(wǎng)絡(luò)安全 Autonomy 測試

OpenAI高管計劃收購谷歌Chrome：對ChatGPT搜索至關(guān)重要
快科技鹿角4-23
OpenAI 為 macOS 版 ChatGPT App 帶來更強大集成功能：能直接搜索、編程
IT之家清源4-22
OpenAI o3 模型基準測試成績遭質(zhì)疑，實測分數(shù)遠不及宣稱
IT之家遠洋4-21
OpenAI 上線 Flex 處理模式：API 費用減半，但犧牲響應(yīng)速度及穩(wěn)定性
IT之家清源4-18

OpenAI 更新《準備框架》：聚焦識別和緩解具體風險、細化能力分類，更好應(yīng)對 AI 安全挑戰(zhàn)

OpenAI 更新《準備框架》：聚焦識別和緩解具體風險、細化能力分類，更好應(yīng)對 AI 安全挑戰(zhàn)