
圖為 上海創旗天下科技股份有限公司婁智超
一、數據爆發式增長帶來的機遇和挑戰
當前互聯網絡和流量爆發式增長,網絡視頻與直播用戶據統計超過5億或4億。隨著大流量內容的產生和企業管理成本的提高,互聯網產生的圖片和視頻內容都可能成為不良信息的載體。一旦得到傳播,將會造成非常嚴重的后果,甚至威脅到國家安全。
隨著政府對不良信息監管力度的加強,每個網站和平臺都嚴肅的對待和處理這些危險因素,傳統人力審核的方式處理網絡上每天新增的圖片和視頻變成了不可能完成的任務。這里列舉兩方面:第一方面,對一些合法合規的有利于帶來流量的優秀作品需要我們快速審核和推薦;另一方面,對侵權和違規需要盡快處置。圍繞這兩方面內容管控,內容管控能力已經成為企業快速發展的瓶頸,建設高效、可控的內容管控系統意義重大。
隨著網絡安全法以及相關法律條款的發布與實施,國家將加大對內容監控的重視。現在我們看到的畫面是統計部分省份對比信息的處置情況,比如:山東網信辦依照法律條款規定,關閉了128家涉及到賭博類型的網站;黑龍江網信辦依法審批違規網站和帳號;河北開展網絡生態治理專項行動,依法依規查處35家違法違規網站;安徽省網信辦依法關閉41家違法違規網站。這只是列舉其中個別省份。
如今,內容安全面臨著嚴重的挑戰,我這里主要總結了四點:第一,審計效率低下。采用人員審核的周期比較長、用戶體驗比較差。第二,人力成本提高。審核人員的招募、場地等費用的支出。第三,違規內容對企業的形象以及對企業正常經營的影響。第四,審查標準滯后。最新的審核標準如果不第一時間在審核團隊完全同步,那就會帶來違規內容的披露,造成不良影響。
二、當前內容審計現狀
網絡信息內容審計指的是針對信息管理系統進行審查,從中找出網絡信息內容存在的問題,并提出有效的問題解決方案。當前,增值電信企業審查的現狀,主要還是靠人力為主,機器為輔。
這個圖片截取了來自網絡上今日頭條、快手關于這方面人員招募的情況。比如,今日頭條招募審核人員,每天要審核1000條內容,快收招募3000團隊去審核相關的違規信息。
三、內容數據審計關鍵技術
面對嚴峻的挑戰,上海創旗天下婁智超認為,在內容審計方面具有以下四大關鍵技術:
1、模式匹配算法
模式匹配主要是在審計系統利用多模式精準匹配和多模式相似匹配的算法,搜索出數據包中是否存在敏感模式串,并統計模式串出現的頻率,為后續的文本內容分析提供支持。
2、文本內容分析技術
文本內容分析在內容審計中有深度識別的可疑文本,同時發現當前信息流中熱點信息,當前文本內容分析技術大多數主要以詞語為基礎元素,構建文本模式,分析文本相似度,并采用類似等方法進行屬性的劃分。
3、不良圖像內容識別
現在不良圖片的主要信息多為色情信息的主要載體之一。圖片的識別屬于內容圖像過濾范疇,但又具有一定的獨特性,很難用簡單的模型把分析圖片的所有特征表現出來。但具體的圖像也有比較明確的特點,比如膚色裸露,簡單來說,不良圖片包括膚色檢測以及敏感特征提取技術。
4、流媒體視頻內容審計
網絡視頻內容豐富、感官性強等特點,已經成為不良信息在互聯網上傳播的主要方式之一。如果及時、準確的識別類似視頻流量,并采取有效的監管措施,已經成為十分緊迫的信息。
審計內容需要對不良信息流量進行實時的監測與阻斷,截止到目前沒有一個很好的有效審計的測試方法?,F有的檢測方法主要是提取視頻完整的視頻文件幀圖像,然后采用不良圖片內容識別的方法進行檢測。
四、創旗內容管控解決方案
上海創旗天下婁智超在演講的現場,帶來了創旗的內容管控方案的違法和不良信息管控系統:
1、智能備案監管
域名/IP的備案監測和管理。
2、AI多媒體識別
快速識別出多媒體中違規信息,并且對違規信息進行證據留存。
3、AI文本分析
識別出疑似的違規圖像、違規網頁,進行證據留存,增值電信企業可以在后續應用過程中問責,把網站違規存儲圖像存儲到設備的本地端,即使網站的主辦者第一時間把違規信息清除掉,但是違規信息存儲在我們的監管設備,對我們后期取證提供了很好的保障。
同時,通過研發人員的調試優化,創旗天下這套違法和不良信息管控系統可以做到以下幾個特點:
1、低成本
在考慮到企業成本的情況下,把企業支持硬件的利舊,降低投入成本50-80%,維護工時縮短70%-90%。
2、高性能
未備案發現率100%,封堵的準確率為99.99%
3、高準確性
比如文本、圖片、視頻,通過我們的調優,可以做到90%或者95%以上。
4、部署靈活
部署方式主要是采取旁路式部署,不改變業務狀況,支持彈性擴容,業務功能支持動態擴容。
創旗希望和各位多交流、合作,為建設綠色安全的網絡環境做出我們應有的義務。