C114通信網(wǎng)  |  通信人家園

人工智能
2025/2/18 11:04

Mistral推出其首個(gè)專業(yè)區(qū)域語(yǔ)言模型Saba :專精阿拉伯語(yǔ)和印度起源語(yǔ)言

IT之家  溯波(實(shí)習(xí))

法國(guó) AI 初創(chuàng)企業(yè) Mistral AI 當(dāng)?shù)貢r(shí)間昨日宣布推出其首個(gè)專業(yè)區(qū)域語(yǔ)言模型 Saba。該模型在源自中東與南亞的精選數(shù)據(jù)集上訓(xùn)練,能以相對(duì)較小的規(guī)模為上述區(qū)域用戶提供更準(zhǔn)確、相關(guān)的回應(yīng)

Saba 模型參數(shù)規(guī)模為 32B,支持本地單 GPU 系統(tǒng)部署。Mistral AI 給出的數(shù)據(jù)顯示 Saba 在阿拉伯語(yǔ)的模型基準(zhǔn)測(cè)試中明顯優(yōu)于同參數(shù)規(guī)模的 Mistral Small 3 24B,在同更大參數(shù)模型的比較里也毫不遜色。

 

 

同時(shí),由于中東與南亞持續(xù)不斷的文化交流,Mistral Saba 除阿拉伯語(yǔ)語(yǔ)外也支持多種印度起源語(yǔ)言,尤其是以泰米爾語(yǔ)為代表的南印度達(dá)羅毗荼語(yǔ)系諸語(yǔ)種(IT之家注:該語(yǔ)系使用者總數(shù)達(dá) 2.5 億人)。

Mistral AI 認(rèn)為,要讓 AI 無(wú)處不在就需要解決各種文化和語(yǔ)言問(wèn)題。目前較大規(guī)模的通用模型在多種語(yǔ)言上都有良好表現(xiàn),但缺乏語(yǔ)言細(xì)微差別、文化背景和深入的區(qū)域知識(shí),無(wú)法為具有強(qiáng)大區(qū)域背景的用例提供服務(wù),而這就是 Mistral Saba 等專精特定語(yǔ)言的較小模型的用武之地。

給作者點(diǎn)贊
0 VS 0
寫(xiě)得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡(jiǎn)介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141