C114通信網(wǎng)  |  通信人家園

人工智能
2025/2/12 11:19

BBC 研究:AI 聊天機(jī)器人總結(jié)新聞錯(cuò)誤百出,分不清事實(shí)和觀點(diǎn)

IT之家  遠(yuǎn)洋

英國廣播公司(BBC)近期開展了一項(xiàng)大規(guī)模研究,旨在評(píng)估人工智能(AI)聊天機(jī)器人在新聞總結(jié)方面的表現(xiàn)。研究涉及了微軟的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而,研究結(jié)果顯示,這些工具在生成新聞總結(jié)時(shí)存在大量準(zhǔn)確性問題。

研究中,BBC 讓這些 AI 工具對(duì) 100 篇新聞報(bào)道進(jìn)行總結(jié),并基于總結(jié)提出內(nèi)容相關(guān)問題。結(jié)果顯示,AI 生成的答案中有超過一半存在“顯著問題”,其中約五分之一的答案引入了明顯的事實(shí)錯(cuò)誤,這些錯(cuò)誤包括數(shù)據(jù)、陳述和日期等關(guān)鍵信息。BBC 新聞與時(shí)事首席執(zhí)行官德博拉 特內(nèi)斯(Deborah Turness)指出:“AI 助手在引用 BBC 文章內(nèi)容時(shí),超過十分之一的‘引文’被篡改或根本不存在于原文中。”

此外,研究還發(fā)現(xiàn),AI 助手在新聞總結(jié)時(shí)無法區(qū)分事實(shí)與觀點(diǎn),也無法辨別新聞報(bào)道中當(dāng)下的信息和歷史存檔的信息,在給出答案的時(shí)候還容易摻入主觀的觀點(diǎn)。特內(nèi)斯表示:“這些 AI 工具所生成的結(jié)果往往是各種問題的混合體,與消費(fèi)者所期望的經(jīng)過驗(yàn)證的事實(shí)和清晰性相去甚遠(yuǎn)。”

值得注意的是,BBC 的研究還發(fā)現(xiàn),微軟的 Copilot 和谷歌的 Gemini 在處理新聞總結(jié)時(shí)出現(xiàn)了更復(fù)雜的問題,相較于 ChatGPT 和 Perplexity,它們?cè)趨^(qū)分觀點(diǎn)與事實(shí)、編輯化處理以及遺漏關(guān)鍵背景信息方面表現(xiàn)不佳。

IT之家注意到,AI 工具的準(zhǔn)確性問題并非僅限于這些聊天機(jī)器人。蘋果公司近期也因旗下 Apple Intelligence 通知工具分享錯(cuò)誤標(biāo)題而引發(fā)爭議,導(dǎo)致其暫時(shí)停用該功能,并遭到新聞機(jī)構(gòu)和自由團(tuán)體的批評(píng)。

BBC 呼吁,在與 AI 服務(wù)提供商進(jìn)行深入對(duì)話并找到解決方案之前,應(yīng)暫停使用 AI 生成的新聞總結(jié)。特內(nèi)斯表示:“我們希望通過合作,共同尋找解決辦法。”

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號(hào)

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141