創新工場、搜狗和今日頭條三方聯合宣布發起“AI Challenger全球AI挑戰賽”。三年內,三方將投入千萬元打造中國最大的科研數據集與世界級AI競賽平臺。發布會現場,官方透露,大賽第一年將開放超過1000萬條中英文翻譯數據、70萬個人體動作分析標注數據、30萬張圖片場景標注和語義描述數據。
在人工智能領域,數據的數量與質量是科學研究與產品技術研發的核心。不止一次,創新工場董事長曾經公開表示過諸如百度、蘋果、IBM、谷歌、Facebook等頂尖公司壟斷了數據,阻礙AI行業發展。李開復表示,AI Challenger就是通過提供免費海量數據解決數據集缺失問題,為科研機構和創業公司提供更多可能性。
DoNews記者了解到,AI Challenger數據集將涵蓋人體骨骼關鍵點數據集(用于無人駕駛、安防、體感游戲等場景)、圖像中文描述數據集、中英翻譯數據集等。
對于這次提供數據集的今日頭條和搜狗來說,今日頭條將算法、工程、產品、運營在AI應用層面的結合已經得到了市場的肯定。同時在產品中同樣積累了大量文本、圖像、視頻等數據集和計算機視覺、自然語言理解、數據挖掘等方面AI技術。
搜狗CEO王小川則在發布會上再次強調,搜狗不是轉型做AI,從始至終它就是一家AI公司。除文本數據集外,搜狗還積累了大量語音、圖像視頻等數據集,他透露搜狗語音輸入頻次每日可達到2.6億次。除此次開放數據集外,其實已經與清華合作9年,進行產學研結合。