C114通信網(wǎng)  |  通信人家園

人工智能
2025/2/11 13:23

IBM企業(yè)級AI開發(fā)平臺watsonx.ai上線DeepSeek R1蒸餾模型

IT之家  清源

IBM 日前宣布,DeepSeek-R1 蒸餾版 Llama 3.1 8B 和 Llama 3.3 70B 現(xiàn)已上線 IBM 的企業(yè)級 AI 開發(fā)平臺 watsonx.ai。

根據(jù)官方介紹,DeepSeek 還借助知識蒸餾技術(shù),利用 R1 模型生成的數(shù)據(jù)優(yōu)化了多個 Llama 和 Qwen 變體。用戶可通過以下方式在 watsonx.ai上使用 DeepSeek 蒸餾模型:

在 watsonx.ai的“按需部署”目錄中,IBM 提供 Llama 蒸餾版,用戶可以部署專用實例以進(jìn)行安全推理。

用戶還可通過“自定義基礎(chǔ)模型”導(dǎo)入功能,上傳 DeepSeek-R1 其他變體,例如 Qwen 蒸餾模型。

DeepSeek-R1 具備強大的推理能力,適用于多個領(lǐng)域:

規(guī)劃:其“鏈?zhǔn)剿季S”邏輯有助于處理需要逐步推理的任務(wù),特別適合智能體(agentic)應(yīng)用。

編程:可用于代碼生成、調(diào)試和優(yōu)化,提升開發(fā)效率。

數(shù)學(xué)問題求解:具備處理復(fù)雜數(shù)學(xué)問題的能力,在科研、工程和科學(xué)計算等領(lǐng)域表現(xiàn)突出。

開發(fā)者可在 watsonx.ai上利用 DeepSeek-R1 進(jìn)行 AI 解決方案開發(fā),并使用以下解決方案能力:

直觀測試和評估模型輸出

通過連接向量數(shù)據(jù)庫和嵌入模型構(gòu)建 RAG(檢索增強生成)管道

支持 LangChain、CrewAI 等主流 AI 框架

IBM watsonx.ai提供靈活的開源模型定制選項,支持 DeepSeek-R1 在不同環(huán)境下的部署,并簡化智能體開發(fā)、微調(diào)、RAG、提示工程等工作流。此外,watsonx.ai內(nèi)置安全機制,保障用戶應(yīng)用的安全性。

據(jù)此前報道,IBM 首席執(zhí)行官本月初曾發(fā)表長文稱,他們(DeepSeek)僅用約 2000 枚英偉達(dá)芯片,以大約 600 萬美元的成本訓(xùn)練了最新的模型,遠(yuǎn)低于行業(yè)預(yù)期。這再次證明,小型、高效的模型也能帶來實際成果,無需依賴龐大而昂貴的專有系統(tǒng)。

給作者點贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報電話:021-54451141