去年 12 月首次亮相的亞馬遜 AI 視頻模型 Nova Reel 迎來(lái)升級(jí),其新版本 Nova Reel 1.1 能夠生成時(shí)長(zhǎng)最長(zhǎng)可達(dá)兩分鐘的視頻。
據(jù)亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)開發(fā)者倡導(dǎo)者伊麗莎白 豐特斯在博客文章中介紹,Nova Reel 1.1 能夠生成具有“一致風(fēng)格”的“多鏡頭”視頻。用戶可以提供長(zhǎng)達(dá) 4000 個(gè)字符的提示詞,來(lái)生成由六秒鏡頭組成的最長(zhǎng)兩分鐘的視頻。
IT之家注意到,Nova Reel 1.1 還引入了一種名為“多鏡頭手動(dòng)”(Multishot Manual)的新模式。在這種模式下,該模型可以結(jié)合一張圖片和提示詞來(lái)生成視頻鏡頭,從而為用戶在視頻鏡頭的構(gòu)圖上提供更多控制權(quán)。豐特斯表示,當(dāng)提供一張分辨率為 1280×720 的圖片以及最多 512 個(gè)字符的提示詞時(shí),“多鏡頭手動(dòng)”模式能夠生成包含多達(dá) 20 個(gè)鏡頭的視頻。
目前,Nova Reel 僅通過(guò) AWS 平臺(tái)和服務(wù)提供,包括亞馬遜的 AI 開發(fā)套件 Bedrock,客戶需要申請(qǐng)才能使用。
然而,與大多數(shù)生成式 AI 系統(tǒng)一樣,Nova Reel 在開發(fā)過(guò)程中是否采用了符合倫理的方法也引發(fā)了諸多疑問(wèn)。視頻生成模型通常是通過(guò)大量視頻示例進(jìn)行訓(xùn)練,以“學(xué)習(xí)”這些視頻中的模式,進(jìn)而生成新的視頻片段。一些公司會(huì)在未經(jīng)版權(quán)所有者或創(chuàng)作者許可的情況下,使用受版權(quán)保護(hù)的視頻來(lái)訓(xùn)練模型,當(dāng)這些模型“復(fù)制”出受版權(quán)保護(hù)的靜態(tài)圖像時(shí),就會(huì)使模型的使用者面臨知識(shí)產(chǎn)權(quán)訴訟的風(fēng)險(xiǎn)。
盡管亞馬遜尚未透露 Reel 訓(xùn)練數(shù)據(jù)的來(lái)源,也沒(méi)有為可能為模型數(shù)據(jù)集提供視頻的創(chuàng)作者提供明確的退出方式,但該公司表示,將根據(jù)其賠償政策,為任何被指控因使用其模型生成的媒體而侵犯版權(quán)的 AWS 客戶提供保護(hù)。