位元組跳動的AI影片產生工具以逼真的場景產生效果引發熱議,同時也因觸及隱私邊界和版權紅線面臨抵制。
TikTok母公司開發出一款人工智慧(AI)模型,可根據單一文字提示,產生具有故事情節、場景切換和鮮明人物形象的高品質影片。
總部位於北京的字節跳動(ByteDance)最新推出的這款AI視訊生成模型正在中國引發熱議,卻因版權問題遭到好萊塢抵制。該模型顯示出,以打造TikTok而聞名的字節跳動正成為OpenAI和谷歌(Google)的對手,參與AI電影和其他娛樂視頻製作工具的競爭。
「中國的視覺模型一直非常非常有競爭力,」赫爾辛基的遊戲開發者史蒂夫·朗(Steve Long)說,他曾參與谷歌和字節跳動的內測項目。
為化解美國的國家安全擔憂,位元組跳動近期已將TikTok美國版的控制權轉讓給了一個投資者團體。
位元組跳動表示,其另一款應用CapCut的全球用戶很快就會使用其最新的AI視訊生成模型Seedance 2.0。 CapCut是一款廣受歡迎的影片創作和編輯應用程式。該模型已在CapCut的中國版應用「剪映」(Jianying)上向用戶開放。
在給出文字提示後,Seedance 2.0能夠編排連貫的故事情節,合成逼真的旁白與環境音效,並產生複雜的角色動作。
「分鏡一直是最能體現人的思考和創作的,」杭州的電影導演Liu Yiran在嘗試了新的Seedance模型後說。 “現在已經被證明,AI是可以取代的。”
字節跳動的視頻生成工具與OpenAI的Sora和谷歌的Veo展開競爭,後兩者也能通過文本生成堪比電影大片的視頻,令用戶驚嘆不已。
目前Seedance 2.0仍有限制:只能產生時長不超過15秒的影片。相較之下,Sora面向Pro訂閱用戶的影片長度上限為25秒。
有些人表示,位元組跳動的這款工具尚未成熟至廣泛商用的階段。他們指出了影片生成過程中的技術瑕疵,並表示用戶需要具備影片編輯和提示詞編寫的專業知識,才能製作出媲美好萊塢水準的影片。

一段由Seedance 2.0根據提示詞生成的視頻,該提示詞描述了一段20世紀20年代爵士俱樂部風格的查爾斯頓舞。
另有批評者對隱私及版權問題提出質疑,這種擔憂與先前埃隆·馬斯克(Elon Musk)旗下Grok模型生成深度偽造(deepfake)圖片引發的爭議極其相似。
電影製作人、中國知名科技頻道影視颶風(MediaStorm)的創始人潘天鴻(Tim Pan)表示,字節跳動的模型僅根據他的一張面部照片,生成了與他本人聲音幾乎完全一樣的音色,儘管他並未向該工具提供語音樣本。潘天鴻質疑位元組跳動是否曾將其視訊素材用於訓練模型,並擔憂不法分子可能利用該工具偽造公眾人物的身份。
在潘天鴻發布影片揭露這些問題後不久,位元組跳動表示,在收到用戶回饋後,正進行緊急修改。該公司暫停了一項允許根據真人素材創建視訊人物的功能。
代表好萊塢主要製片廠的美國電影協會(Motion Picture Association)表示,該模型未經授權「大規模」使用了受美國版權保護的作品。
該協會上週四表示:“字節跳動無視既有的版權法,這些法律保護創作者的權利,並支撐著數百萬美國人的就業崗位。”
迪士尼(Disney)上週五向字節跳動發出一封勒令停止通知函,稱這家中國公司“正在劫持迪士尼的角色“,包括來自《復仇者聯盟》(The Avengers)和《星球大戰》(Star Wars)的角色。迪士尼稱這種行為「蓄意、普遍且完全不可接受」。
位元組跳動表示,該公司尊重智慧財產權。該公司稱,正採取措施加強現有保障措施,力求防止用戶未經授權使用智慧財產權和肖像。
趕在周二春節開啟前,位元組跳動與眾多中國AI開發者紛紛推出新模型與新功能。 AI巨頭DeepSeek和阿里巴巴(Alibaba)也正籌備發布下一代模型。
雖然位元組跳動在中國以外主要因TikTok而聞名,但在大本營中國,它是一家業務廣泛的AI巨頭,擁有聊天機器人以及圖像和視訊生成工具。
各公司發布的數據顯示,以衡量AI工作負載的詞元(token)使用量計算,字節跳動旗艦AI模型的日均使用量正逼近谷歌和OpenAI。根據數據追蹤機構QuestMobile統計,位元組跳動在中國推出的聊天機器人豆包(Doubao)擁有近2.5億月活用戶。
然而,要獲得足夠的算力來支撐如此龐大的工作負載——尤其是數據密集的影片生成任務——絕非易事。
據知情人士透露,位元組跳動即將達成協議,將在印尼的一個資料中心使用包含超過7,000枚英偉達(Nvidia)B200晶片的AI伺服器。其中一些知情人士說,位元組跳動計畫將這些晶片用於AI研發。他們說,該公司亦在尋求擴充東南亞地區的資料中心容量。
由於美國出口管制,這些屬於英偉達旗艦Blackwell系列的晶片無法運往中國。
Seedance模型是由位元組跳動於2023年成立的Seed實驗室研發,該實驗室旨在探索通用人工智慧。該部門目前由吳永輝領導,他曾是谷歌的高級研究員,去年初加入字節跳動,目前常駐加州聖何塞。
Gavekal Technologies董事萊拉·哈瓦賈(Laila Khawaja)說,鑑於高昂的訓練與運行成本,源自中國的聊天機器人不太可能挑戰ChatGPT等美國競爭對手,但「在照片與視頻編輯、文生視頻等特定細分領域,中國應用很有可能佔據領先地位」。
根據市場情報公司Sensor Tower的數據,CapCut擁有6.42億月度活躍用戶。
哈瓦賈在一封電子郵件中表示,「中國公司在此類應用程式上擁有更多專有數據和深厚經驗」。他也說,「我們或將目睹TikTok的故事在AI領域重演:源自中國的AI應用產生全球性影響力」 。
赫爾辛基的遊戲開發者朗則警告稱,中國開發者仍受制於美國AI晶片管制,可能增加後續技術突破的難度。此外他認為,出於國家安全和網路安全的考量,美國消費者可能會對使用中國模型感到擔憂。
華客|新聞與歷史:Seedance 2.0大片級AI視頻曝光 顛覆好萊塢?
探索更多來自 華客 的內容
訂閱即可透過電子郵件收到最新文章。