DeepSeek+BlackEye！北京經(jīng)開區(qū)融媒體中心攜手當虹科技開啟智媒新時代

資訊 dvbcn編輯 2025-02-10 14:34 閱讀 3,397 來源：　

近日，北京經(jīng)開區(qū)融媒體中心在當虹科技的技術支持下，正式啟用融合了DeepSeek-R1和DeepSeek Janus Pro的BlackEye多模態(tài)視聽大模型，率先開啟“DeepSeek+視聽+行業(yè)端側”的大模型應用之旅，為新聞生產(chǎn)注入全新動能。

“僅需幾十秒，就可快速生成一段高精度視頻，大大節(jié)省了視頻生產(chǎn)的時間和成本。”“視頻橫轉豎一直是我們視頻業(yè)務的難點，這次終于有了好用的工具。”“文生視頻、圖生視頻、智能橫轉豎、智能慢動作、智能摳像，有一說一，功能真的太全面了”……北京經(jīng)開區(qū)融媒體中心記者、編輯們表示，有了多模態(tài)視聽大模型這位“賽博同事”，內(nèi)容生產(chǎn)質效正在飛速提升。

據(jù)悉，北京經(jīng)開區(qū)融媒體中心布局應用的多模態(tài)視聽大模型，是其聯(lián)合專注大視頻領域的國家級專精特新“小巨人”企業(yè)當虹科技打造。該大模型在當虹科技BlackEye多模態(tài)視聽大模型融合DeepSeek-R1和DeepSeek Janus Pro基礎上，完成視聽傳媒垂類場景數(shù)據(jù)調優(yōu)訓練。基于DeepSeek-R1強大的模型推理能力，該大模型融合了多種深度神經(jīng)網(wǎng)絡組件，包括Transformer、Diffusion等組件，通過文本、圖像、視音頻、三維模型等多種模態(tài)的編碼、解碼、多模態(tài)潛空間對齊、多模態(tài)語言推理及生成等技術，實現(xiàn)不同模態(tài)信息之間的推理和預測生成，具備了更強大的多模態(tài)理解能力，可以更好地理解和處理視聽內(nèi)容，顯著提升傳媒文化領域內(nèi)容生產(chǎn)、審核、推薦和用戶體驗等方面的效率與質量。

小亦觀察到，通過多模態(tài)視聽大模型進行一段10分鐘的養(yǎng)生視頻創(chuàng)作，大模型可一鍵理解視頻內(nèi)容，并由DeepSeek-R1進行深度思考，給出健康科普、食材挑選、烹飪技巧等三個角度的短視頻腳本，并結合BlackEye文生視頻、圖生視頻等生成式算法，以及AI超分、AI插幀、AI橫豎屏同步制作等分析式算法，短時間就能制作出精美的專業(yè)級視頻。

目前，該多模態(tài)視聽大模型可以生成電影、連環(huán)畫、3D卡通等八種風格的2K視頻并可通過AI超分算法進一步提升至4K。同時，為了適應手機豎屏觀看需求，還可將橫屏視頻智能轉化為豎屏，AI橫豎屏同步制作效率大幅提升。

“多模態(tài)視聽大模型的應用，標志著北京經(jīng)開區(qū)融媒體中心在AI技術應用領域邁出關鍵一步。”北京經(jīng)開區(qū)融媒體中心有關負責人表示，作為率先擁抱前沿AI技術的區(qū)級融媒體中心，北京經(jīng)開區(qū)融媒體中心已通過本地化部署，在保障數(shù)據(jù)安全的基礎上實現(xiàn)了大模型與新聞場景的深度適配。未來，北京經(jīng)開區(qū)融媒體中心將持續(xù)借助AI 技術能力，進一步加大在新聞挖掘、內(nèi)容創(chuàng)作、新聞分發(fā)、用戶互動等領域的應用力度，積極探索 AI 技術在媒體行業(yè)的創(chuàng)新應用場景，為用戶提供更豐富、更優(yōu)質、更智能的新聞服務，引領區(qū)級融媒體中心在新時代的智能化發(fā)展浪潮。

人工智能