該公司表示,這兩項工具可用來減少垃圾消息的數量,同時屏蔽內容和視頻中的攻擊性評論。
自動評論過濾器自去年9月就一直存在,用戶可以選擇自動啟動該程序。該程序可利用機器學習來識別可能引人反感的評論。如果在評論過濾器開啟的情況下仍然出現攻擊性評論,那么用戶可以像以往一樣直接向Instagram報告。Instagram表示,評論過濾器目前僅支持英語,不過未來將支持其他語言。
另一方面,垃圾消息過濾器自去年10月上線以來就一直處于對外界保密的狀態。而上線9月有余都未被用戶發現,于 Instagram 而言已經說不準是好事還是壞事。目前該功能可以自動清除英語、西班牙語、葡萄牙語、阿拉伯語、法語、德語、俄語、日語和漢語共9種語言的垃圾消息。
雷鋒網了解到,Facebook于2012年以10億美元收購了Instagram,并將其內部技術遷移至Facebook的數據中心。
據報道,此次Instagram 發布的評論過濾器就是使用了Facebook 旗下AML實驗室建立的“Deep Text”系統。在Facebook 上,其可以結合機器學習輔助器完成每日 40 億次以上的翻譯功能的處理。此外,該系統還能在一秒之內理解超過二十多種語言的數千封郵件的內容。
如此前雷鋒網報道的Facebook 在AI+廣告中的應用和探索一文里,就詳細的介紹了這一文本系統對 Feeds Ads的支持。
去年6月,Deep Text上線。其一開始被定位為內部工具,用來幫助Facebook 工程師快速排序大量文本,創建分類規則。其后 Instagram 高管深入了解該系統之后,立即看到了機會——借其打擊垃圾郵件。因為對于Instagram 的用戶來說,垃圾郵件幾乎是一個極其影響用戶體驗的煩惱。
在決定使用該系統之后,Instagram 第一步就是聘請了一批人員對該平臺進行評論,并將評論按照“垃圾郵件”和“非垃圾郵件”分類。事實上,這種工作,在社交媒體涉及的技術行業而言非常普遍。先利用人類來訓練機器,讓其執行單調甚至無聊的工作,如此反復,最終機器會慢慢變得聰明和智能。
Instagram 相關負責人表示,最終通過不斷地數據整合,有3/4的數據被送入 Deep Text。基于此,Instagram 的工程師可創建算法,并對垃圾郵件可進行正確的分類。
在經歷4個多月的不斷測試和研究后,Instagram 團隊在去年10月悄悄地上線了垃圾郵件過濾的功能。Instagram 的CEO Kevin Systrom對該功能的效果感到十分滿意。他決定利用 Deep Text 來處理更復雜的問題——消除與Instagram 社區準則相悖的意見或評論。為此,Instagram 還公開發布了一個 1200字的長文,來解釋其社區的精神。
與垃圾郵件過濾功能的開發過程類似,這次Instagram 又聘請了一大批的人員,每天就重復干一件事——看評論,并確定該評論是否合適。然后將其分類是否涉及欺騙 or 種族主義 or 性騷擾等等。所有這些工作人員都必須會兩種語言。經過一段集中的處理,這些人一共分析了大約200萬條評論。
同時,Instagram的員工率先在自己的手機上內測了該系統,以此協助公司調整算法。與垃圾郵件算法一樣,該系統會基于文本語義來分析發帖的人和評論者(以及其發表的歷史評論)之間的關系。通過一段時間對神經網絡的訓練和使用真實數據對模型的測試,Deep Text 已經可以探查到文本之間非常細微的語義差別。
直至今日,Instagram 終于正式宣布兩大工具的上線。
當然,就目前這兩大工具而言,仍然存在一些算法缺陷,如當被問及一些特定句子時,系統無法給出具體的回應。經過前文對 Instagram 這兩個工具的開發過程的描述,我們也能看到 Instagram 的AI仍然依賴人類的力量,來訓練機器學習系統。
正如 Facebook歐洲、中東和非洲地區公共政策副總裁 Richard Allen 如是表述,Facebook“還需要很長一段時間,才能依靠機器學習和人工智能來處理評估仇視言論時的復雜性。”