在加拿大溫哥華昨日舉行的全球最大計算機(jī)視覺會議 CVPR 2023 上,LG 人工智能研究所公開了該公司首個生成式 AI 商業(yè)化服務(wù) Captioning AI,為需要管理大量圖片的客戶提供了更高效的解決方案。
▲ 圖源:LG
LG 介紹,Captioning AI 基于零次學(xué)習(xí)技術(shù),使 AI 可以像人類一樣利用其先前積累的經(jīng)驗和知識來解釋它第一次看到的物體或場景。平均而言,該服務(wù)能在 10 秒內(nèi)為一張圖片生成 5 個完整的描述性句子和 10 個關(guān)鍵詞。如果將圖片數(shù)量擴(kuò)大到 1 萬張,這些工作將在兩天內(nèi)完成,從而在短時間內(nèi)建立定制化的圖片搜索和管理系統(tǒng)。
LG 表示,Captioning AI 是 LG 人工智能研究所與全球最大的圖庫之一 Shutterstock 深度合作研發(fā),后者在圖像標(biāo)簽方面擁有豐富的專業(yè)知識。此外,雙方還進(jìn)行了學(xué)習(xí)數(shù)據(jù)的過濾和篩選等 AI 倫理驗證,以確保版權(quán)透明度。
Shutterstock 首席技術(shù)官 Sezal Amin 表示:“目前,我們正在通過為全球 10 家客戶開展早期訪問(Early Access)計劃來進(jìn)一步開發(fā)這種服務(wù)。這項服務(wù)意在幫助人們關(guān)注更重要的內(nèi)容和具有創(chuàng)造性的任務(wù),而不是重復(fù)性的機(jī)械任務(wù)。”
據(jù)此前報道,韓國政府為進(jìn)一步加強(qiáng)新興技術(shù)領(lǐng)域發(fā)展,本月初已決定加大對人工智能技術(shù)研發(fā)的投入,投資約 5000 億韓元(IT之家備注:當(dāng)前約 26.9 億元人民幣)推進(jìn)韓國 AI 項目發(fā)展。