法國(guó) AI 初創(chuàng)企業(yè) Mistral AI 當(dāng)?shù)貢r(shí)間昨日宣布推出其首個(gè)專業(yè)區(qū)域語(yǔ)言模型 Saba。該模型在源自中東與南亞的精選數(shù)據(jù)集上訓(xùn)練,能以相對(duì)較小的規(guī)模為上述區(qū)域用戶提供更準(zhǔn)確、相關(guān)的回應(yīng)。
Saba 模型參數(shù)規(guī)模為 32B,支持本地單 GPU 系統(tǒng)部署。Mistral AI 給出的數(shù)據(jù)顯示 Saba 在阿拉伯語(yǔ)的模型基準(zhǔn)測(cè)試中明顯優(yōu)于同參數(shù)規(guī)模的 Mistral Small 3 24B,在同更大參數(shù)模型的比較里也毫不遜色。
同時(shí),由于中東與南亞持續(xù)不斷的文化交流,Mistral Saba 除阿拉伯語(yǔ)語(yǔ)外也支持多種印度起源語(yǔ)言,尤其是以泰米爾語(yǔ)為代表的南印度達(dá)羅毗荼語(yǔ)系諸語(yǔ)種(IT之家注:該語(yǔ)系使用者總數(shù)達(dá) 2.5 億人)。
Mistral AI 認(rèn)為,要讓 AI 無(wú)處不在就需要解決各種文化和語(yǔ)言問(wèn)題。目前較大規(guī)模的通用模型在多種語(yǔ)言上都有良好表現(xiàn),但缺乏語(yǔ)言細(xì)微差別、文化背景和深入的區(qū)域知識(shí),無(wú)法為具有強(qiáng)大區(qū)域背景的用例提供服務(wù),而這就是 Mistral Saba 等專精特定語(yǔ)言的較小模型的用武之地。