樹立五大觀念,挖掘大數據金礦

數位化時代來臨,大數據已成為企業經營的顯學,更是人工智慧的基礎。透過大量的資料運算,電腦可以統整和歸納出一些行為的法則,展現出接近人類的思考模式。

到底該如何發揮資料競爭力?台灣大數據專家們提醒,大數據本身絕非萬靈丹,必須具備正確的觀念,善加利用,才能將資料數據的價值極大化。

綜合專家建議,本土企業可以依據以下五項觀念,來引導大數據的發展。

觀念 1:
大數據遠比你想像的複雜

很多企業界朋友聽到大數據,腦海中想的可能是,「我全台灣有五百家分店,把這些客戶資料收集起來就好了。」但,真的是如此嗎?

91APP 產品長李昆謀表示,其實蒐集數據本身就是一個大工程。以零售業為例,交易是最常見的資料,大多透過「銷售時點管理系統」(Point of Sale,POS)把銷售、庫存、發票、帳務等資料回傳。

但零售業的通路複雜,除了門市,還有線上平台。線上可能還分官網和APP,這些數字長得都不一樣,機器無法分析或理解。尤其愈是龐大或歷史悠久的企業,數據的分歧性愈高,也愈難整合。

除了數據很難有一致性,大量的數位化資料也需要龐大儲存和維護成本。

李昆謀指出,以往企業可能只保留近一年的營業資料,舊的就封存起來。但大數據時代必須要有長期及大量的資料累積。但是,當數據愈來愈大,處理速度、搜尋速度就會愈慢。

不僅已經發生的交易行為,處理起來很費事,更麻煩的是含金量高的「行為資料」,怎麼蒐集與分析解讀?

所謂行為資料,是指消費者在買單前的所有動作,看了哪些商品?停留時間多久?有哪些東西他丟入了購物車,最後卻沒買?行為資料代表了消費者的「意圖」。背後潛藏著相關的消費力,是價值很高的數據,但複雜度遠遠超過交易資料,要拿來儲存和分析,挑戰更高。

富盈數據總經理薛閔如舉例,假設網路上有一篇滑雪的文章,有一百個人點閱,其中有十個人把文章讀完,接著開始搜尋滑雪的裝備;有三十個人讀完就離開了;剩下的六十個人可能只停留極短暫的時間就離開。這三群讀者,各代表什麼行為和消費意圖?如果要在文章中投放廣告,應該推什麼內容最適當?

總之,大數據說來容易,卻從一開始就存在許多門檻。

觀念 2:
以終為始,先訂策略
目標再搜數據

企業要蒐集什麼資料、用什麼方式處理,最終目的都是商業應用。但是商業應用沒有定義清楚,就會摸不到頭緒。

凱絡媒體商務長陳顯立比喻,就像走迷宮,從終點走回來比較容易,這叫以終為始。

因為每個企業的階段策略目標都不相同,有些可能期望營收成長,有些可能追求下個世代的技術發展,對於數據資料的處理原則和應用模式就會不一樣。

本期封面故事提到Google地圖(Google Map)就是一個很好例證。它的商用目的是「推薦使用者最佳路線」,而不是告訴我們地址。所以使用者可以選擇交通工具(甚至是步行),了解轉車方式和路徑等等,這個才是數據能造成的產品獨特性和競爭障礙。

陳顯立強調,把目的先想清楚,可以讓企業在蒐集數據時更精準。以Google 地圖來說,因為要做不同交通方式的建議,所以就要確認相關道路能不能騎機車?還是只能開車?可以走路嗎?如果不先想好這件事,把人或機車導上高速公路,除了造成很糟的消費者體驗外,還得重新蒐集資料,耗費大量成本。

曾任中華電信大數據總監、現任KPMG 安侯企管公司副總經理賴偉晏建議,數據的應用要先針對企業的策略目標,再往下看各部門如何配合,釐清各單位要解決的問題,將問題排序之後,再回頭看數據資料如何支持。

觀念 3:
大數據需要對的資料,一致性、正確性、可理解性是關鍵

大數據要在企業內生根,一定要做好內部管理。

例如很多零售業透過POS蒐集的數據十分雜亂。李昆謀建議可以從「資料源管理」做起,「如果沒有規範員工怎麼key in資料,怎麼能期望得到對的資料?」

所謂「對的資料」是指具備一致性、正確性,而且可以被機器理解。

「資料源管理」可以從兩個面向著手,其一是對員工的教育訓練,通常是門市第一線服務人員。這不是一件輕鬆的工作,很多服務人員會跳腳,因為要求變多、規範增加,自然會抗拒。但是主管必須堅持,因為這個關卡沒有做好,數據再多也沒有價值。

第二個面向是建立防錯機制(error-proof),讓機器來阻擋人為錯誤。舉例來說,行動電話必須是十碼;男性的身分證字號必須是1開頭,女性則是2開頭,如果不正確就會發出警示,而且無法繼續輸入,諸如此類。

賴偉晏則提出「共犯結構理論」。由於導入大數據是一項創新,很多企業甚至會成立新的部門,導致其他員工做壁上觀,或是被動承接別人交付的數據。但是,當多數人覺得事不關己,就很容易失敗。

因此最好直接把數據分析的工作連結在某一個部門,把數據和部門運作以及績效綁在一起,讓該部門理解,你未來的績效就是要靠數據產生。

觀念 4:
不同業態的大數據,重點完全不同

所有資料的蒐集、處理都需要時間,企業經理人必須思考,這些資料要花多少時間提供價值?

陳顯立舉例,若一家3C 通路商,想要了解筆記型電腦的銷售模式,蒐集了過去五年的銷售數據,再花一年時間訂定未來的策略,或許此時市場已由平板電腦取代,這些工夫就全白費了。

相對於3C 通路來說,居家裝潢的產業受時間的影響就小得多,因為未來十年,消費者還是會刷油漆、買家具、處理漏水問題等等。因此考量自身的產業特性與數據的關聯性也很重要。

那麼3C 通路該怎麼處理數據?陳顯立建議,可能要換個角度思考。如果蒐集產品發展的資料無效,何不嘗試蒐集產品的使用方法或使用習慣?例如大螢幕的手機,逐漸向平板靠攏了嗎?會不會需要鍵盤?

另外一個狀況是所謂的「精準行銷」。這可說是零售業的終極目標,最好是面對一萬個消費者能夠產生一萬種不同的推薦商品清單,達成完全的客製化。

但精準行銷換到另一個產業,就不一定適合。薛閔如表示,像富盈數據這種行銷科技(MarTech),就不希望掉進「一對一」的迷思。

因為過度的精準反而可能讓他們失去更多的機會。例如消費者在網路上閱讀某種內容時,背後可能有五花八門的動機,如果你的廣告類別不夠多,或許可以精準打中極少數人,卻丟失了大部分的潛在消費者。

賴偉晏則提醒,現在外界討論大數據,大多圍繞著B2C 的產業,但其實製造業的成本撙節、品質管理,或費用分析,一樣也可以用到大數據,不要誤以為B2B 的企業跟大數據不相干。

觀念 5:
大數據充滿雜訊與錯誤,需要整理和清洗

很多零售業常有「會員數=數據量」的誤解。李昆謀說,很多企業擁有數百萬的會員數,但實際的「含金量」卻很低,經常讓他們大吃一驚。原因有二。

第一,零售業在蒐集資料時,產生錯誤的比例非常高。不少會員資料,手機號碼缺碼、性別與身分證字號不符,還有一些不合乎常理的狀況,像是有人的出生日期填寫1900 年,或是家住台北市忠孝東路10 段,根本沒有這個地址,都是很明顯的亂填。

第二,號稱上百萬的會員數,可能已經累積了二、三十年,很大一部分是無效的「殭屍會員」;或是同一個人,卻在不同時間重覆加入會員,變成二個帳號,都必須剔除。

上百萬的會員,經過數據的「清洗」後,最後可能只剩下1%的有效資料。「很多品牌會員數都是虛的,企業必須認清這個現實,才能走下一步,」李昆謀說。

此外,許多數據也充滿「雜訊」,讓數據分析師傷透腦筋。薛閔如表示,這在社群網站裡很常見,像是大家常用的「XD」,一般認定這是代表「笑」的符號,但呈現的是正面或負面情緒?有沒有可能是諷刺或嘲笑?社群媒體中有很大比率是屬於這種不確定性的雜訊,真正有價值的資訊可能只有5%。

「大家都覺得社群媒體的數據很重要,其實社交訊號是最『髒』的一池,」薛閔如說。

資料該怎麼有效取得,整理後產生價值,已是目前各行各業共同的挑戰。就如同李昆謀所說的,「你知道山裡有金礦,但你要怎麼把它挖出來?」這顯然不是一個簡單的任務!

擁抱資料價值的五大觀念

觀念1
大數據遠比你想像的複雜
數據本身的歧異性極高,蒐集本就困難;尤其人類的行為多變,數據更難以解讀。

觀念2
以終為始,先訂策略目標再搜數據先訂出企業的商業應用和目標,以終為始,再定出數據的處理原則和應用模式。

觀念3
大數據需要對的資料,一致性、正確性、可理解性是關鍵
強化內部管理,增加資料數據的正確性和可信度,以及機器可解讀,否則不具價值。

觀念4
不同業態的大數據,重點完全不同
數據的蒐集和利用,需視市場的變動和產業的特性調整,同時應考量時間和產品週期的影響。

觀念5
大數據充滿雜訊與錯誤,需要整理和清洗
原始資料中常含有大量錯誤、無效,或是難以解讀的雜訊,必須整理後才能提高含金量。

更多內容請見2020年1月《哈佛商業評論》全球繁體中文版〈回答七大問題,驗證你的資料競爭力〉
https://www.hbrtaiwan.com/journal_content_HBR161.html