近日,北京經開區融媒體中心在當虹科技的技術支持下,正式啟用融合了DeepSeek-R1和DeepSeek Janus Pro的BlackEye多模態視聽大模型,率先開啟“DeepSeek+視聽+行業端側”的大模型應用之旅,為新聞生產注入全新動能。
“僅需幾十秒,就可快速生成一段高精度視頻,大大節省了視頻生產的時間和成本?!薄耙曨l橫轉豎一直是我們視頻業務的難點,這次終于有了好用的工具?!薄拔纳曨l、圖生視頻、智能橫轉豎、智能慢動作、智能摳像,有一說一,功能真的太全面了”……北京經開區融媒體中心記者、編輯們表示,有了多模態視聽大模型這位“賽博同事”,內容生產質效正在飛速提升。
據悉,北京經開區融媒體中心布局應用的多模態視聽大模型,是其聯合專注大視頻領域的國家級專精特新“小巨人”企業當虹科技打造。該大模型在當虹科技BlackEye多模態視聽大模型融合DeepSeek-R1和DeepSeek Janus Pro基礎上,完成視聽傳媒垂類場景數據調優訓練?;贒eepSeek-R1強大的模型推理能力,該大模型融合了多種深度神經網絡組件,包括Transformer、Diffusion等組件,通過文本、圖像、視音頻、三維模型等多種模態的編碼、解碼、多模態潛空間對齊、多模態語言推理及生成等技術,實現不同模態信息之間的推理和預測生成,具備了更強大的多模態理解能力,可以更好地理解和處理視聽內容,顯著提升傳媒文化領域內容生產、審核、推薦和用戶體驗等方面的效率與質量。
小亦觀察到,通過多模態視聽大模型進行一段10分鐘的養生視頻創作,大模型可一鍵理解視頻內容,并由DeepSeek-R1進行深度思考,給出健康科普、食材挑選、烹飪技巧等三個角度的短視頻腳本,并結合BlackEye文生視頻、圖生視頻等生成式算法,以及AI超分、AI插幀、AI橫豎屏同步制作等分析式算法,短時間就能制作出精美的專業級視頻。
目前,該多模態視聽大模型可以生成電影、連環畫、3D卡通等八種風格的2K視頻并可通過AI超分算法進一步提升至4K。同時,為了適應手機豎屏觀看需求,還可將橫屏視頻智能轉化為豎屏,AI橫豎屏同步制作效率大幅提升。
“多模態視聽大模型的應用,標志著北京經開區融媒體中心在AI技術應用領域邁出關鍵一步?!北本┙涢_區融媒體中心有關負責人表示,作為率先擁抱前沿AI技術的區級融媒體中心,北京經開區融媒體中心已通過本地化部署,在保障數據安全的基礎上實現了大模型與新聞場景的深度適配。未來,北京經開區融媒體中心將持續借助AI 技術能力,進一步加大在新聞挖掘、內容創作、新聞分發、用戶互動等領域的應用力度,積極探索 AI 技術在媒體行業的創新應用場景,為用戶提供更豐富、更優質、更智能的新聞服務,引領區級融媒體中心在新時代的智能化發展浪潮。