跳至正文

虛擬人直播帶貨,這事兒靠譜嗎?

晚上12點,還沒睡的小王不經意間刷到了一場帶貨直播。

這位主播像往常一樣嫻熟地介紹著產品,推薦著各種熱銷的套餐——即使是擁有著數百個SKU,各種風格,口味特別的產品和優惠政策,這位主播依然可以講得是頭頭是道。

不過吸引他的是,它並不是哪個主播簽約公司旗下的當家主播,而是一名剛剛上崗的虛擬人。作為2022年互聯網領域最火熱的兩個賽道,虛擬人和電商直播,被這樣地結合在了一起。

寧波銀行最近也上線了一位虛擬主播。12月16日的一場直播活動中,上海分行的001號數字人員工“小寧”主持了一場虛實結合的線上直播活動,她風趣幽默地介紹了自己的工作內容,還專業、親切地向網友推薦寧波銀行的多種金融產品和優惠福利。在直播活動之後,也獲得了不錯的反響。

圖源:商湯科技

在各大電商平台,虛擬人直播帶貨其實已經不是什麽新鮮事。他們越來越頻繁地出現在各大直播間,有的作為主力直播,有的被當做直播的輔助數字映射員工,有的則會和真人主播進行配合完成一場遊戲互動和連麥直播,玩法多樣,吸睛效果提升明顯。

據了解,有了虛擬主播的幫助,AI主播的表現和業績幾乎與一名真實人類主播無異。而類似的數據,證明著虛擬人直播的存在自有其邏輯。

虛擬主播背後更大的話題,則是AIGC。和PGC、UGC等概念類似,AIGC則是指利用AI人工智能技術生成的內容,也就是說內容的生產者已經完全從人變成了AI。

作為當下最炙手可熱的技術概念,這也是虛擬主播正創造著的更多的內容和更大的價值——他們既成為了生產力又成為了生產工具,既解放了工具又解放了“思想”。

被調侃許多的虛擬人帶貨其實隻是起點,它背後所代表的技術迭代和產業效率提升才是未來。

虛擬主播:買它買它買它!

虛擬主播,簡而言之,就是虛擬人/數字人,其實是通過計算機圖形技術、CG渲染、動作捕捉、人工智能、語音合同等數十種計算機技術打造。她通常擁有人類一樣的外觀麵貌,可以表達麵部表情;她還可以張嘴交流,甚至是結合語言內容和表情表達某種內心心境;而更厲害的是,如今的虛擬人也可以具備多樣性的人格,不同的虛擬人也可以像真實世界的人一樣展現完全不同的性格。

市場數據驗證了虛擬人技術的發展趨勢。IDC發布的《中國AI數字人市場現狀與機會分析,2022》報告顯示,中國AI數字人市場規模呈現高速增長趨勢,預計到2026年將達到102.4億元人民幣。

近年來,國內直播電商也呈現著迅猛發展的態勢。引述電子商務研究中心發布的《2022年(上)中國直播電商市場數據報告》,預計2022年國內直播電商交易規模可達34879億元,同比增長47.69%。

而直播電商這一概念的興起,其實源自於商家或品牌等借助直播平台或電商平台直播板塊來觸達用戶,讓用戶了解產品各項功能及促銷信息,從而實現購買這種交易行為。

於是,很多企業主就看到了一層機遇:不僅將直播作為一種促成交易的場景,也天然地將其作為一個展現品牌線上營銷內容的絕佳“渠道”。

隨著直播告別了過去幾年野蠻爆發式的增長時期,如今直播電商行業正呈現著去頭部化和多樣化的趨勢,越來越多的企業主,走上了直播的道路,並且帶上了各種新的內容、元素和玩法加入到直播中去。

虛擬人的眾多應用場景中,也就擴展到直播,成為了最近火熱的賽道之一。

夜晚刷手機直播的小王其實提供了一個很好的場景:相比於真實人類,虛擬人直播的優勢還不少,虛擬人和真實人類可以在直播中配合,完美覆蓋到全天24小時介紹商品。尤其是當麵向Z時代的用戶的時候,更容易被這種新鮮事物吸引。

幾家開始引入虛擬主播的企業主也對我們表示,新鮮內容是其一,更重要的是通過低成本的方式做到更長時間的覆蓋。

企業主其實內心都會打著一個小算盤——直播的轉化率、人效比等是否真的有所改善。結論是,在擁有一個穩定,和不受時間、空間限製的虛擬主播之後,很多商家估算,本身的成本效益表現也不錯。這是他們繼續使用虛擬主播帶貨的主要原因。

但從技術上來看,虛擬主播背後,其實代替的是真人主播的個人能力水平,比如產品介紹的業務,更關鍵的是帶動直播間的情緒等等。

所以這就極其考驗,虛擬主播具體在場景的中的表現效果,它的效果/交互足不足夠真實,因為虛擬主播又是一個剛剛興起的行業,背後則是產業鏈找那個各個節點之間的配合,不同節點和層級一旦配合不好,其具體展現就可能相對割裂,如何高效協同,將不同的技術作為一個整體考量,則是運營虛擬主播的關鍵。

從形神兼備到富有情緒

寧波銀行的那段直播活動中,“小寧”一段逗趣的脫口秀表演引爆直播間,展現了鮮明的人格化魅力,隨後又化身專業的銀行業務經理,以生動自然的聲音和動作、紮實的業務能力,獲得網友們的紛紛稱讚。

據了解,本次活動不僅是“小寧”在直播平台的首次亮相,也是商湯科技AI數字人“虛擬IP”在“線上”營銷場景中的首次應用,用創新的用戶觸達方式,讓廣大客戶對寧波銀行產生更具象化的品牌認知和好感,進一步助推寧波銀行上海分行的數字化轉型。

過去在金融和銀行業,商湯科技已經在線下服務型虛擬人領域深耕,打造了諸多範例。比如AI虛擬人“小寧”,過去以“服務型數字人”,不僅能夠主動接待前來辦理業務的顧客,還能夠提供各類業務谘詢和服務辦理。“小寧”能回答550個以上常見業務問題,以及由此衍生的3000個以上相關業務問題。通過運營管理平台的持續運營優化,每天能夠新增50個以上衍生問題。

從效率上,“小寧”在一定程度上已經提升網點的服務速度和質量。

而此次線上營銷場景的展現,則代表著商湯科技虛擬人數字技術綜合運用能力和成熟度體現。以具有IP屬性的“人格型數字人”,幫助企業建立目標受眾的品牌認知,促進轉化。

不同的數字人在應用端的職能劃分上不同,產生的內容形式以及帶來的價值不一樣。

數字人的擬人化,以及生產製作的自動化程度反映數字人係統整體進化和發展水平。在此之前,商湯科技將數字人像自動駕駛分級一樣分成了L1-L5五個等級。達到L4級時,數字人能夠實現部分智能化交互;L5級則能夠實現完全智能化交互,而數字人智能化交互程度的加深,則依賴於底層的AI技術的迭代。

圖源:商湯智能產業研究院

我們都很清楚,人工智能技術作為生態基礎層的核心要素,既關係到數字人的擬人化程度,包括形象和動作的逼真性,以及深度學習和多模態交互能力的發展,也是數字人製作效率提升的關鍵引擎。在這方麵,商湯關注情感,也更關注效率,在虛擬人技術定製服務中,已經擁有了不可多得的全套技術能力。

用一句比較流行的話說,商湯科技擁有AIGC“全棧式”布局,打造了“一站式”生產流水線。

據了解,基於原創的OpenXRLab擴展現實平台的領先算法,結合大量真人動作數據,商湯打造了一套基於深度學習的動作捕捉及生成解決方案。該方案適配性強、自由度高、易於部署,無需綠幕和專業動捕設備,即可高效率、低成本地實現AIGC內容生成,滿足企業在虛擬IP內容定製、直播運營等活動中的廣泛需求。即便在日常直播等低算力設備應用場景,也可進行流暢、高精度的視頻創作和實時互動。同時,該方案可配套提供用於“虛擬IP”生成的大規模、高質量、語義化的3D動作庫,供企業進行數字人相關的自主高效創作,推動企業數字化時代升級。

圖源:商湯智能產業研究院

簡單解釋一下,在應用層麵,多模態交互其實是AI虛擬人的“核心力”。

虛擬主播在更廣泛的應用場景中逐步替代真人角色其實就是深度學習神經網絡和計算機圖形學相結合,是一種多模態的交互。簡而言之,這是讓虛擬主播學會能聽會說,還能表演出來。總之,為的是讓他的表現更真實。

圖源:商湯科技

其次,AIGC其實重塑了虛擬主播的生產流程,在人物模型的重建、動畫準備和製作等各個環節輔助數字人自動化生成,大幅加速虛擬人生產,降低製作門檻和成本投入。

比如過去綠幕動捕需要長達數月的時間製作一個動態視頻,而如今通過AI驅動的模型,對於少量照片進行麵部掃描,就可以在數天之內生成一個高精度的人物3D模型。

技術積累方麵,商湯科技視覺相關的算法模型已累計超過49000個,覆蓋視覺信號的分析理解,以及實現數字內容的生成,並研發建成了世界上最大的計算機視覺基模型,參數高達300億,可以支持數字人在圖像、視頻等視覺信號處理的複雜長尾應用。在語音語義理解方麵,商湯也自研並具備了包括語音識別
(ASR)、語義理解(NLP/ 知識圖譜)、語音合成(TTS)以及語音動畫合成(STA)等多項技術能力。

虛擬主播和AIGC的未來

商湯科技提到,結合企業品牌的符號、標簽等元素,商湯“虛擬IP解決方案”可智能生成符合品牌性格和調性的專屬形象,讓品牌形象更年輕、更鮮活、更具辨識度和記憶點,打破刻板印象,拉近與用戶的距離。

這套方案還具有高度可延展的內容生成能力,定製生成IP人物成長故事、創意短視頻等一係列AIGC內容,使虛擬IP形象更飽滿,提升品牌親和力。商湯數字人“虛擬IP”可以自主直播運營,從粉絲互動到直播帶貨,用更低的運營成本為企業前端業務帶來全天候的“用戶觸達”,不斷增強品牌粘性,為品牌帶來持續增值。

任何行業的發展,或者走向成熟,不能隻靠一到兩個成熟的IP,或是直播網紅,它需要的一定是一個批量參與的過程。

這也是商湯科技一直以來對AI世界的思考——如何解放生產力才是王道。商湯科技此次著重研發了AIGC賦能平台——以人工智能技術為核心生產力,通過算法程序模塊化、技術服務組件化、
生產流程標準化,為開發者創造“低代碼”的數字人開發環境。

在這方麵,商湯科技不光注重批量生產,也更注重運用和管理。為此,商湯科技通過運營管理平台的“架橋通路”,實現與商業化的最終鏈接,打通創新技術到產業應用的“最後一公裏”,為企業全流程實現降本增效。

其次,虛擬主播強依賴NLP自然語言處理以及GPT(Generative Pre-Training
生成式預訓練)這類AI底層技術的突破。前者是說,當你在和虛擬主播對話時,形象的真實度隻是一方麵,最重要的還是互動。終有一天,你不會發覺你是在和一位虛擬人在交流。

後者也關乎虛擬人的未來。想象一下,如果我們看到的虛擬主播隻會站在原地發表生產的內容和觀點,但不能隨時“附和”上手部動作,那怎麽可以稱之為真實呢。

圖源:機器之心Pro

人工智能最重要學術會議之一CVPR
2022,今年也給出了最新的數字人技術趨勢。來自商湯的研究者們和南洋理工大學、中山大學和UCLA在論文《Bailando: 3D
Dance Generation via Actor-Critic GPT with Choreographic
Memory》中提出了一種音樂到舞蹈的新框架Bailando——給出一段內容比如音樂,讓計算機理解,並生成視覺跳舞的動畫。這段舞蹈得卡上點,使其看起來更自然,這是一個非常困難的任務。

想要虛擬人AIGC實現更廣泛更真實的生產力,就離不開這些底層AI技術的突破。

商湯科技正在往這個方向努力。根據沙利文發布的《2022年中國數字人市場觀測報告-裏程碑》,商湯的數字人產品已進入“成熟階段”。而作為技術的領導者之一,商湯科技要以此為契機,不斷拓展AI數字人的角色和能力,助力企業更好地擁抱數字時代,實現品牌破圈。