10月21日上午,人民網(wǎng)研究院在2023(GIAC)智能視聽大會開幕式暨主論壇發(fā)布《新技術(shù)浪潮下的智能視聽步入深度變革新階段——2023年人工智能賦能網(wǎng)絡(luò)視聽產(chǎn)業(yè)觀察報告》(以下簡稱《報告》)。《報告》圍繞綜合視頻、短視頻、網(wǎng)絡(luò)直播和網(wǎng)絡(luò)音頻四種視聽形態(tài)梳理了2023年人工智能賦能網(wǎng)絡(luò)視聽創(chuàng)新應(yīng)用的典型案例,以及人工智能相關(guān)法規(guī)政策與行業(yè)規(guī)范發(fā)布情況,并探討了行業(yè)未來發(fā)展趨勢,為智能視聽未來發(fā)展提供參考。
人工智能推動行業(yè)質(zhì)效變革
《報告》指出,2023年,人工智能技術(shù)的突破式發(fā)展與創(chuàng)新應(yīng)用,給視聽行業(yè)帶來了“質(zhì)量與效率”變革,推動視聽產(chǎn)品實現(xiàn)更多創(chuàng)意、更高效率、更新體驗與更高品質(zhì)。
在綜合視頻領(lǐng)域,2023年,隨著AI大模型和多模態(tài)AI技術(shù)的融合發(fā)展,人工智能生成內(nèi)容的創(chuàng)作能力、通用化能力以及工業(yè)化水平快速提升。影視創(chuàng)作中的AI前沿技術(shù)應(yīng)用進入新階段,貫通影視內(nèi)容策劃、開發(fā)、制作和宣發(fā)等各個環(huán)節(jié)。
相對于專業(yè)的影視制作,AI技術(shù)在短視頻方面的應(yīng)用門檻相對更低。在關(guān)鍵詞自動提取、字幕自動生成等基本操作基礎(chǔ)上,文本自動配音、文本轉(zhuǎn)視頻、數(shù)字人播報、個性化文案、多元風(fēng)格等升級功能在2023年加速發(fā)展。作為創(chuàng)作基礎(chǔ)工具的AI模型與產(chǎn)品、平臺加速發(fā)展,初步獲得可觀的商業(yè)流量。
網(wǎng)絡(luò)直播領(lǐng)域,人工智能技術(shù)進一步應(yīng)用到電商直播、音樂會直播、體育直播等多種場景中。其中,大批數(shù)字人虛擬主播涌入直播間帶貨,成為當(dāng)前網(wǎng)絡(luò)直播行業(yè)的火熱景象。不過,數(shù)字人直播目前處在發(fā)展應(yīng)用的初期,效果有待提升優(yōu)化,數(shù)字人在一些平臺的使用規(guī)則尚處于探索中。
網(wǎng)絡(luò)音頻領(lǐng)域,2023年,部分垂直類音頻平臺通過引入AI大模型,促進AI前沿技術(shù)在音頻產(chǎn)業(yè)落地應(yīng)用。未來,AI音頻行業(yè)將觸發(fā)各細分應(yīng)用場景全面變革,圍繞音頻生成、語音交互、識別翻譯、個性化推薦等領(lǐng)域,應(yīng)用產(chǎn)品將覆蓋在線辦公、移動社交、廣告營銷、學(xué)校教育、體育比賽、居家養(yǎng)老等多元場景。
劃定行業(yè)發(fā)展“紅線”
《報告》還梳理了近一年來我國出臺的人工智能相關(guān)的法規(guī)政策與行業(yè)規(guī)范,包括《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》《生成式人工智能服務(wù)管理暫行辦法》《科技倫理審查辦法(試行)》等。
隨著人工智能技術(shù)的進一步成熟和應(yīng)用場景的擴展,人工智能創(chuàng)新應(yīng)用給行業(yè)和全社會帶來的治理挑戰(zhàn)不容忽視。國家相關(guān)部門及時出臺法規(guī)政策,相關(guān)行業(yè)規(guī)范及平臺自治規(guī)定也陸續(xù)發(fā)布,推動人工智能技術(shù)合理有效利用,及時劃定發(fā)展“底線”與“紅線”。
打造視聽行業(yè)深度變革新起點
《報告》最后展望了人工智能賦能網(wǎng)絡(luò)視聽的未來發(fā)展趨勢。
一是網(wǎng)絡(luò)視聽將成為AI大模型垂直應(yīng)用探索落地核心場景。AI技術(shù)發(fā)展的重點未來將轉(zhuǎn)向?qū)嵱眯院涂沙掷m(xù)性方向,關(guān)注如何將大模型與實際應(yīng)用場景相結(jié)合,實現(xiàn)真正的商業(yè)化應(yīng)用。網(wǎng)絡(luò)視聽始終是信息網(wǎng)絡(luò)新技術(shù)創(chuàng)新應(yīng)用的前沿領(lǐng)域,未來也將進一步成為大模型垂直應(yīng)用探索落地的核心場景,催生新業(yè)態(tài)新模式。
二是生成式人工智能迭代升級打造視聽行業(yè)深度變革新起點。目前,生成式人工智能的底層技術(shù)和產(chǎn)業(yè)生態(tài)已形成了新格局,未來該技術(shù)在更多行業(yè)的海量應(yīng)用場景有望打開。在此背景下,“平均水平的基礎(chǔ)勞動”加速被取代,未來視聽創(chuàng)作焦點更多轉(zhuǎn)向高質(zhì)量創(chuàng)意、藝術(shù)審美與內(nèi)容共情,推動更高水平競爭。技術(shù)應(yīng)用與生產(chǎn)范式的突破性創(chuàng)新,也將成為整個視聽產(chǎn)業(yè)新變局的起點,推動視聽形態(tài)、場景、體驗、產(chǎn)業(yè)布局的多維變革,并對文化發(fā)展、社會交往等方面產(chǎn)生深遠影響。
三是新技術(shù)交叉融合發(fā)展將助力“視聽+”產(chǎn)業(yè)新生態(tài)。當(dāng)前,人工智能新技術(shù)的發(fā)展演進不是單一升級,而是與5G、VR等新技術(shù)發(fā)展相互融合、多點突破,以技術(shù)的融合發(fā)展應(yīng)用提升創(chuàng)新密度、解決復(fù)雜問題、豐富產(chǎn)品體驗。另一方面,在“萬物皆媒”的時代,視聽具備巨大的信息交流“基礎(chǔ)設(shè)施”優(yōu)勢,使得網(wǎng)絡(luò)視聽行業(yè)不斷與各行業(yè)交叉融合發(fā)展,推動形成“大視聽”的產(chǎn)業(yè)發(fā)展新生態(tài)。隨著技術(shù)融合與產(chǎn)業(yè)融合相互促進,跨模態(tài)、多元化、邊界消融將成為重要特征。
四是治理協(xié)調(diào)性有效性的加強促使AI治理框架逐步完善。在人工智能快速發(fā)展過程中,如何建立合理審慎的AI倫理和治理框架,塑造負責(zé)任的AI生態(tài),越來越受到社會各界的重視。在當(dāng)前政策措施基礎(chǔ)上,下一階段圍繞人工智能技術(shù)應(yīng)用的敏捷治理、分類分級管理將進一步加強,人工智能治理體系逐步完善。在智能視聽方面,尤其需要統(tǒng)籌推進“技術(shù)”監(jiān)管與“內(nèi)容”治理,實現(xiàn)發(fā)展與規(guī)范的動態(tài)平衡。
《報告》認為,2023年,面對人工智能新浪潮帶來的巨大沖擊,一方面防止“高估一項技術(shù)在短期內(nèi)的影響”,另一方面防止“低估其在長期內(nèi)的影響”,人工智能賦能視聽行業(yè)的創(chuàng)新探索仍任重道遠。
青島財經(jīng)日報/首頁新聞記者 封滿樓
責(zé)任編輯:李賽男
請輸入驗證碼