走過2016,迎來2017,不少人在寫行業大趨勢。我沒那個本事,只能在年初寫下自己的一些通用性的觀點,準備到今年底的時候再翻出來看看。這是第一篇,說說運營商數據的價值問題。
回顧過去
在運營商的系統里,流轉著各種數據,而這些數據,正在變得越來越值錢。
第一,運營商數據的全面性。
運營商擁有的數據,有很多的類型,比如:
1.客戶的身份信息,包括用戶的姓名、身份證信息、消費能力。
2.交互的流量等。
3.客戶的行為信息,包括行動軌跡,出行情況,作息時間,各類APP的使用頻次等。
4.客戶的附加屬性,包括終端的使用和更換情況,對新業務和各種產品體驗的偏好等。
除了這些基本信息,還可以基于這些數據進行整合和交叉,形成更多的數據集合和分析能力,比如將終端信息和客戶信息放在一起,就能看到:什么樣的客戶喜歡使用什么樣的終端,各種終端用戶在通信方面的表現和特點是什么,各類品牌終端的客戶忠誠度如何等等。
這些數據的分析和展示,具有非常高的商業價值,技術實現方面的難度也并不大,只需要進行簡單的多維建模分析,就能看到結果。而同時擁有這么多類型的數據和信息的,以前除了電信運營商,誰能做到?
第二,運營商數據的準確性。
世人都曉數據好,唯有質量做不高。
在IT不發達的時代,要處理和存儲海量用戶的海量數據,需要巨大的計算能力才能做到。
在過去,似乎只有金融和電信行業,才可能擁有這么豐富的IT資源。而將數據從生產系統中抽取出來,對這些數據進行結構化清洗、轉換、加載,用于數據分析和統計,更是一筆巨大的開銷。
對于絕大多數企業來說,能把生產數據處理好,就已經很不容易了,對于數據分析以及數據準確性的問題,即使有心,也是無力。
2003年開始,中國移動建設兩級數據倉庫體系,在生產系統之外,構建分析專用的經營分析系統。
雖然生產系統里的數據也是完整的,但很多數據只是紀錄并不會使用,比如用戶入網時登記的身份證信息和地址信息,經常出現錯漏。當把數據導入進經營分析系統時候,會對這些"無用"的數據進行稽核和過濾,在入口解決數據質量問題,及時發現,及時修復。
從那個時候起,數據質量問題就一直是IT部門的核心工作,隨著技術演進和業務拓展,以及分析主題的演化,數據質量問題也在不斷發展。
最初,數據倉庫里都是結構化數據,用戶的基礎數據、賬單、話單,以及各種業務的使用記錄,都按照統一的格式和標準進行存放和處理。
后來,數據的類型越來越多,很多非結構化的數據也進來了,包括用戶的詳細投訴記錄、瀏覽的網頁信息等等。所以,運營商要不斷嘗試采用新技術,來解決這些新數據的質量問題。
由于持續關注數據質量問題,又持續投入資源去解決質量問題,因此相對于眾多的數據提供者,運營商的數據在準確性方面也是有優勢的,這方面的價值,相信從事數據處理工作的人士會有更深的體會。
第三,運營商數據的持續性。
巧婦難為無米之炊,用這句話來描述數據分析工作,是再恰當不過。
如果沒有基礎數據,再牛的算法和專家也難有用武之地。相對于完整性和準確性,運營商數據的持續性更令人垂涎,因此能支持跨時間段的歷史分析,不管當時你有沒有想過做分析,那些數據當時產生了,同時也保留了下來。
前幾年,每個人都有過這樣的經歷,走在街上被攔住邀請參與問卷調查活動,填完表格之后給點兒小禮品;再有就是收集整理各種分析報告。許多咨詢公司的調查報告,都是這樣采集數據的。
這些方式的時效性非常差:數據來自某一個時間點,一旦時間點變了,就必須再次收集類似的信息,甚至要做場景重現,這樣做不僅成本高,而且數據的偏差也會比較大。
運營商在這方面擁有得天獨厚的優勢,可以用"取之不盡用之不竭"來形容:用戶隨時產生數據,數據隨時進行處理,處理結果可以自動化地周期性地展示出來。
也就是說,別人花很大力氣搞到的數據,只可以賣一次;而運營商只需要自動采集,數據就隨用隨取,源源不絕。
運營商的數據產生價值,不僅僅是管道商的先天優勢,也在于當年對于數據運營的先知先覺,以及十幾年來的不斷積累。
展望未來
在大數據越來越被重視,價值越來越大的今天,運營商在數據運營方面的價值空間反而下降了。這并不僅僅是運營商自身的問題,也受到很多其他因素影響。
第一,先發優勢逐漸喪失。
運營商在十幾年前就啟動了數據倉庫系統的建設,嘗試利用數據提高運營效率,降低運營成本。但在實際運營中,真正利用數據來確定工作目標和指導工作內容,是最近幾年才真正火起來。
究其原因,還是運營商的市場環境比較特殊。
電信運營商的市場規模超大,同時份額和實力又嚴重不均,強者衡強,弱者很難翻身。移動再強大就有被拆分的危險,聯通再弱小也不會消失。這樣的市場格局,用不用數據分析,都沒有實質區別。
曾經我們在一個地區,進行了一個對比試驗:A組聘請專業分析公司,結合數據制定精準營銷策略,然后去執行;B組采用傳統的營銷方式,花了A組聘請外部資源等量的錢,作為營銷資源投放出去。
事實表明:B組的實施效果優于A組。
這個試驗并不能說明數據分析沒有價值,但這樣的案例體現出,電信運營商的市場競爭還處于比較初級的階段,這樣的環境,導致數據分析工作的價值未能充分體現出來。
所以,這些年來,數據分析與應用更多只是出現在創新評獎的舞臺上,實際應用的情況并不好。
運營商對數據價值的利用進展緩慢,但別人卻在這方面突飛猛進,前期積累起來的經驗和優勢逐漸被消弭,被超越。
如今,運營商在這方面可真不敢說是領先者了。
第二,數據價值相對下降。
前面總結出完整性、準確性和連續性,是運營商數據價值的優勢所在;但此消彼長,如今這些優勢和價值也在削減。
比如,https的普及和推廣,讓運營商的管道價值大幅降低,這是很多人還沒有意識到的問題。運營商不能再合法地獲取用戶與應用之間的完整通信信息,傳輸加密后,只有通信的兩端(客戶和網站)知道做了什么事情,運營商則被屏蔽了。
舉個例子,運營商只知道什么時間段用戶登錄了淘寶,不能再獲取用戶瀏覽了哪個商品,下了哪些訂單。運營商斥巨資購買建設的DPI(深度包解析)工具和系統,有毫無用武之地的危險。
運營商的數據少了,可是其他家的數據卻越來越多。
一方面,以BAT為代表的互聯網公司,以終端為代表的入口企業,都在收集自身的數據和通過入口的數據;
另一方面,出現了很多第三方的大數據公司,比如通過給企業搭建大數據平臺和應用服務,來獲取數據的百分點,通過SDK讓APP們主動提供數據的Talking Data。此外,還有從廣告咨詢等領域做起,收集各方的數據的泰一指尚等等。
相對于運營商,這些公司對數據的追求更積極,意愿更強烈,收集數據的效果也更好。
第三是分析應用拓展有限。
雖然經過了十多年的發展,但運營商對大數據的理解仍然十分有限,數據分析能力不足,大量的工作還要依托外包合作。
這不僅是因為IT技術力量有限,或者對數學算法的掌控能力不足,更多還受限于對業務的理解和場景模型的設計能力。業務部門不懂技術,IT部門對業務理解不足,相互之間溝通不暢,又缺乏技術和業務合一的高手,這些都阻礙了運營商在大數據領域進一步的發展,守著金山挖不出寶藏。
如今,運營商也意識到了這個問題,因此大力倡導自主研發,希望自主掌控核心,著力培養自己的IT人員和技術能力。但運營商目前的技術體系和專業人才,多是基于網絡和通信的,對IT的理解有限,要在CT環境里,培養大量真正的IT人才,這談何容易。
還有一個問題,是信息安全。
直到現在,與大數據相關的法律問題仍存在較大的不確定因素。在開放數據和保護隱私的矛盾中,在合法與守法的邊界模糊的情況下,對個人隱私保護更加嚴苛的歐美國家,勢必比中國發展得慢;國企出身的中國運營商,勢必比互聯網公司規矩得多;如果安全方面出了問題,中國移動承擔的壓力一定比另外兩家更大。
因此,從短期來看,在大數據開放以及數據變現方面,運營商求穩求全的心態,還將持續限制其數據價值的社會化。