2023/6/19 13:57

LG發(fā)布首個(gè)生成式AI商業(yè)化服務(wù)Captioning AI：10秒內(nèi)為圖片提供5句描述和10個(gè)關(guān)鍵詞

IT之家江程（實(shí)習(xí)）

在加拿大溫哥華昨日舉行的全球最大計(jì)算機(jī)視覺會(huì)議 CVPR 2023 上，LG 人工智能研究所公開了該公司首個(gè)生成式 AI 商業(yè)化服務(wù) Captioning AI，為需要管理大量圖片的客戶提供了更高效的解決方案。

　　▲ 圖源：LG

LG 介紹，Captioning AI 基于零次學(xué)習(xí)技術(shù)，使 AI 可以像人類一樣利用其先前積累的經(jīng)驗(yàn)和知識(shí)來解釋它第一次看到的物體或場景。平均而言，該服務(wù)能在 10 秒內(nèi)為一張圖片生成 5 個(gè)完整的描述性句子和 10 個(gè)關(guān)鍵詞。如果將圖片數(shù)量擴(kuò)大到 1 萬張，這些工作將在兩天內(nèi)完成，從而在短時(shí)間內(nèi)建立定制化的圖片搜索和管理系統(tǒng)。

LG 表示，Captioning AI 是 LG 人工智能研究所與全球最大的圖庫之一 Shutterstock 深度合作研發(fā)，后者在圖像標(biāo)簽方面擁有豐富的專業(yè)知識(shí)。此外，雙方還進(jìn)行了學(xué)習(xí)數(shù)據(jù)的過濾和篩選等 AI 倫理驗(yàn)證，以確保版權(quán)透明度。

Shutterstock 首席技術(shù)官 Sezal Amin 表示：“目前，我們正在通過為全球 10 家客戶開展早期訪問（Early Access）計(jì)劃來進(jìn)一步開發(fā)這種服務(wù)。這項(xiàng)服務(wù)意在幫助人們關(guān)注更重要的內(nèi)容和具有創(chuàng)造性的任務(wù)，而不是重復(fù)性的機(jī)械任務(wù)。”

據(jù)此前報(bào)道，韓國政府為進(jìn)一步加強(qiáng)新興技術(shù)領(lǐng)域發(fā)展，本月初已決定加大對(duì)人工智能技術(shù)研發(fā)的投入，投資約 5000 億韓元（IT之家備注：當(dāng)前約 26.9 億元人民幣）推進(jìn)韓國 AI 項(xiàng)目發(fā)展。

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

LG 計(jì)算機(jī)