一次搞懂大數據/ 李欣宜

大數據十問

大數據十問

大數據(Big Data)充斥各種場合,從馬雲到釋昭慧都侃侃而談,你還能不懂什麼是大數據嗎?你也許已經聽過無數的大數據神話,但對於大數據仍停留在一知半解階段,《數位時代》專訪各大大數據專家,整理出你最應該知道的大數據十問。

1Q:大數據是什麼?
A:大數據(Big Data)又被稱為巨量資料,其概念其實就是過去10年廣泛用於企業內部的資料分析、商業智慧(Business Intelligence)和統計應用之大成。但大數據現在不只是資料處理工具,更是一種企業思維和商業模式,因為資料量急速成長、儲存設備成本下降、軟體技術進化和雲端環境成熟等種種客觀條件就位,方才讓資料分析從過去的洞悉歷史進化到預測未來,甚至是破舊立新,開創從所未見的商業模式。

一般而言,大數據的定義是Volume(容量)、Velocity(速度)和Variety(多樣性),但也有人另外加上Veracity(真實性)和Value(價值)兩個V。但其實不論是幾V,大數據的資料特質和傳統資料最大的不同是,資料來源多元、種類繁多,大多是非結構化資料,而且更新速度非常快,導致資料量大增。而要用大數據創造價值,不得不注意數據的真實性。

2Q:為什麼需要大數據?
A:因為當從人到機器都已經被數據解構,數據不僅僅是歐巴馬口中的石油或是黃金,它更是血液,貫穿每個人一生中每個生命階段。這並非危言聳聽,更不是科幻電影,而是正在逐步成真的現實。

例如有一款叫做Ovia Fertility的App,藉由分析30萬名會員的數據,開發演算法,精準計算排卵期,提高懷孕的機率,這個App已幫助5萬名會員成功懷孕。又比如Workday推出一套軟體,預測員工的薪水漲幅和可能跳槽時間,幫助企業決定每名員工的加薪幅度、時間點和轉職時機。理財也逃不過大數據的掌控,騰訊就於年初推出第一家用大數據決定借貸與否的銀行,微眾銀行結合辨識人臉和公安部門資料,決定借貸者的信用等級。

從懷孕生子、工作到理財,大數據將全面影響每個人與每家企業。對企業而言,大數據可望提升服務品質、增加管理效率、幫助決策和創造商業模式;對一般民眾而言,大數據是另一個自我,它可能比本人更了解本人,為你預先解決每個未知,當一切都開始數據化,你能夠不需要數據嗎?

3Q:大數據一定要很大嗎?
A:雖然大數據的狹義定義是,資料量要在100TB到PB之間,但其實絕大多數的企業,都不符合這個標準,大企業如eBay、亞馬遜或AT&T或許符合大數據的標準。但其實資料量只是大數據的其中一個面向,大數據揭示的是一種「資料經濟」的精神,而非只是「大」。

「大,是大數據中最無趣的部分。」天睿資訊(Teradata)首席技術長寶立明(Stephen Brobst)認為,企業真正要尋找的是非傳統的、而且未曾被挖掘過的資料,並且從這些資料中去提煉出價值,這才是對大數據應有的正確認知,而非只是執著於資料大小,只要能從看似毫無意義的數據礦坑中挖掘出金礦,有誰會在意那座礦坑原本是大得像座山還是小得像狗屋呢?和沛科技創辦人翟本喬就指出,大數據這個名字容易讓人誤導,因為真正重要的其實是大智慧。大數據不只是說資料量有多大,速度快和資料量大都可以用技術輕易解決,但種類(Variety)比較需要智慧。

4Q:沒有大數據就不能用大數據嗎?
A:非也,建置大數據架構與環境的確所費不貲,一般中小企業通常無法輕易投入鉅額成本,但大數據時代的精神在於如何妥善利用既有或非傳統資料,從中挖掘出新商機,因此即使是中小企業甚或者是新創企業,都能在大數據時代用「大數據」。

就技術面來說,現在有許多業者開始提供建置成本較低的大數據處理工具和雲端系統,有些甚至跟App一樣,只要根據自身需求挑選需要購買的功能即可,例如科智提供的工業化數據管理工具即為一例。另一方面,很多時候中小企業其實不需要建設大數據系統。

中研院資訊科學研究所研究員陳昇瑋即指出,在絕大多數情況下,大數據專案其實不需要建置Hadoop系統,特別是台灣的社群媒體沒那麼發達,而是直接採用國外的居多,資料都不在自己手上,與其盲目追求技術和工具,不如先用小量資料去驗證一個概念,是否能將資料轉換成商業機會,再來決定要不要建置大數據的作業環境。

大數據領域權威麥爾苟伯格(Viktor Mayer-Schönberger)在《大數據》一書中便提及,大公司有巨量資料的規模優勢,但小公司有成本及創新上的優勢,小公司因為速度夠快、靈活度高,就算維持小規模,還是能夠蓬勃發展。

5Q:我要怎麼開始進行大數據專案?
A:設置專門統籌大數據專案的部門和職銜是第一步,而且層級越高越好,企業領導人必須足夠正視大數據的力量,才能帶動整個組織重視數據的文化。Etu負責人蔣居裕便指出,大數據其實是管理問題,而非技術問題,缺少跨部門協作,大數據專案很難有個美好的開始。

第二步,切勿陷入大數據迷思,與其急著想用數據變現,不如先回頭看看自己企業內部的問題為何,先定義問題,再試圖用數據找解方。阿里巴巴集團副總裁車品覺建議,與其整天想著大數據,不如先整頓自己企業內部的數據,很多時候光是企業內部的數據就問題叢生,不同部門之間的數據無法相容,「整個數據在一個中小企業裡面也是四分五裂,在這個地方沒做好的情況下,居然說你想用大數據,其實是有點難以理解。」

6Q:大數據從哪來?
A:任何地方。隨著物聯網興起,任何以前不可能產生資料的東西或地方都可能「資料化」。天睿資訊(Teradata)首席技術長寶立明認為大數據的發展可以分成三階段,正說明了大數據的來源多樣化:.com時期、社群網路時期和物聯網時期。早在2000年初網路熱潮興起,人們就已經開始研究log資料,蒐集使用者的cookie和搜尋行為等。而社群網路如Facebook或Twitter將人們的互動關係數據化,這些社群數據創造了大量的商業價值。而第三階段物聯網時期,可能是最有趣的階段,無論是機器還是人都開始被數據解構,數據可能來自手錶、鞋墊甚至皮帶,這些物聯網數據將是接下來重要的數據分析對象。

7Q:大數據有什麼風險?
A:傳統商業分析會有的風險,大數據也都會有,這並非大數據才有的問題,「個資安全問題」一直都存在,只是隨著資料來源越來越多且資料量越來越大,資安問題更顯迫切罷了。市場研究機構Gartner研究副總裁布萊恩(Brian Prentice)指出,大數據本身並沒有資安問題,問題在企業應用資料的方式,Gartner預測2018年,企業違反商業倫理的案件中,有近50%都來自不當的大數據應用。

另一值得關切的是大數據可能帶來的「資料獨裁問題」,根據大數據領域權威麥爾苟伯格(Viktor Mayer-Schönberger)的說法,資料獨裁指的是任由資料來管控我們,盲目受到分析結果的制約,導致濫用或誤用資料。例如根據數據分析將人群分類,其實有可能會把個體給標籤化,甚至污名化某些族群,想像未來若我們用數據預先打擊犯罪,那會是什麼情景?

8Q:Big Data和Open Data有什麼不一樣?
A:開放資料(Open Data)是大數據的一種,但大數據不等同於開放資料。開放資料是指將原本受私人組織或公部門管理的原始資料無條件地開放出來,供任何人使用。近年來討論度較高的是公部門的原始資料,許多民間團體主張公部門資料本為民眾所有,除非涉及個人隱私,否則公部門應無條件開放資料,讓民間可以介接資料,除了瀏覽,還可以加值應用。

對新創企業而言,開放資料是非常好的資源,當創新遇上開放資料,很可能激起無盡想像。例如李慕約有限公司創辦人李慕約就利用政府開放的農產品即時價值資料,設計出果菜花終端機,用視覺化的圖表呈現農糧署累積近20年的資料。

9Q:什麼產業特別需要大數據解決方案?
A:根據Gartner的報告,媒體傳播業、銀行業和服務業最早導入大數據,保險業、零售業和醫療照護業預計在兩年內導入,但阿里巴巴副總裁車品覺指出,以後任何一種產品或服務都潛藏著巨大的「數據化」潛力,企業需要加強對數據的重視,更加注重數據的蒐集和整理工作。

根據《大數據@工作力》一書作者湯瑪斯.戴文波特(Thomas H. Davenport)的說法,他根據資料量、所有權和資料應用程度,將產業分成高成就者、資料劣勢者和低成就者。高成就者是那些擁有大量數據,而且已經展現出優異的數據分析成果的企業,例如消費性商品、保險業者、互聯網公司、旅遊、運輸和信用卡公司。在所有互聯網公司中,又以電子商務業者對數據的應用最直接和強烈。以全球最大的電商平台阿里巴巴為例,阿里巴巴假貨問題向來猖獗,但透過分析商品文字、圖片描述、權利人投訴,甚至是社交媒體等16種維度的數據,結合大數據打假貨,現在阿里巴巴有90%以上的下架商品都是大數據系統主動出擊發現的。

而低成就者是坐擁大量資料,但因法規限制或思維僵化等原因,還沒利用數據變現的產業,如媒體、電信、銀行和零售,但其中仍不乏已開始使用數據的例子。例如大型零售業者卡特琳娜行銷集團(Catalina Marketing)就藉由分析超過1億人的消費紀錄,結合旗下5萬5千家零售店舖的POS機資料,交叉比對顧客的消費紀錄,針對顧客的消費喜好發送優惠券,提高行銷效率。

資料劣勢者則是手邊資料不多,或是雖有足夠資料,卻缺乏完整結構的業者,也較缺乏資料分析能力,例如許多B2B公司沒有辦法接觸到第一線的消費者,而是提供服務給下游廠商,致其先天上就沒有第一手資料。值得注意的是,醫藥機構雖然被戴文波特列為資料劣勢者,但這是因為美國的病歷電子化程度低,不若台灣擁有全世界最完整的國民健保資料庫,因此台灣的醫療機構應是低成就者,而非資料劣勢者。

10Q:大數據的商業模式是什麼?
A:大數據的商業模式大概可分成幾種:一、從既有數據變現;二、以數據提升企業競爭力;三、以數據做為服務的基礎與核心,用數據顛覆傳統行業。

模式一,數據本身即為產品或根據數據制定行銷策略、改善產品。例如美國運通讓持卡人與自己的Facebook帳號連結,持卡人成為美國運通粉絲團粉絲後,美國運通會依據會員在Facebook上的活動,提供相應的優惠措施,結合社交數據和會員資料,就是為了提升消費者辦美國運通卡的誘因。

模式二是藉由數據提升競爭力,這類的大數據專案成效較無法直接反映在營收上,而是反映在提升內部工作效率或降低決策成本上。例如許多人都知道LinkedIn透過數據精準推薦職場人脈給用戶,卻不知道LinkedIn在公司內部推出數百款數據分析產品,幫助內部員工提升工作效率,其中Voices就是一款能將LinkedIn客服內容,在1分鐘內快速生成分析報告的數據分析工具。

無論是模式一還是模式二,其實都有掌握過去、預測未來和防患於未然的共同點,只是一個應用層面是對外,一個對內,這兩種模式常見於既有的企業。但模式三,也就是以數據做為業務核心的公司,這些公司生來就是要來顛覆傳統行業,它們打從開業的第一天起就把數據當做業務核心,叫車App Uber和防詐騙電話App Whoscall是最好的例子。

文章來源:《數位時代》

DBC執笠,告訴我們媒體是不可以這樣搞的!

DBC

DBC董事局決定把數碼廣播牌照交還政府,以目前的傳播環境,再過數年,就算是商業電台或是TVB決定交翻個牌出來,我也不會覺得很驚奇。

搞傳媒,為什麼還要攞牌照?

當然,DBC的個案有其獨特的脈絡,即所謂的「數碼廣播」政策,但我不打算在此長篇大論這個早已經看得出是明日黃花的議題。早於十年前,我與第一代科技人也是我的好友白頭孫已經曾撰文對談:將來究竟會是「無線」還是「流動電訊」上網勝出呢?我們都沒有料到,兩者同時勝出,也就是說,在智能手機內設有無線上網的功能。

前Google CEO施密特(Eric Emerson Schmidt) 曾揚言:「未來將是行動唯一的時代。」Forrester Research的Ted Schadler和Josh Bernoff寫了一本很難讀的書,叫做《行動思維時代》(The Mobile Mind Shift: Engineer Your Business to Win in the Mobile Moment) 。

我想要說什麼呢?從事傳播業為什麼還要向政府申請昂貴又限制多多的廣播牌照呢?!

「廣播」敵不過「行動」

DBC行政總裁羅燦說大部分汽車的收音機還是沒有數碼廣播裝置,這是事實,我卻認為未必是DBC董事局決定停止數碼廣播的主因。

大家乘坐計程車時不妨留意一下,很多司機在方向盤旁掛滿了「行動裝置」,有些是用來接生意的,有些是用來播放影視及聽覺娛樂的,我就曾試過不少次遇上聽網台的司機。

我們所稱為的「行動電話」(Mobile Phone),其實已經不足以描述這個裝置的功能。試問有多少人用這個裝置只是來通話的呢?!更多的時間我們是用來上網、發訊息、玩遊戲、看電視劇或電影,有愈來愈多人用來購物,這個「行動裝置」已經成為每個人的活動中心,而且這個趨勢只會愈來愈烈。

人們已經開始逐漸遠離電視機了,試問接收聲音廣播訊息的收音機又怎會不式微呢?!傳統廣播科技屬於「稀缺資源」,所以政府用牌照來規管及分配,但資訊科技卻是豐沛資源,數據傳輸速度愈來愈快,「行動媒體」才是投資媒體業的大方向。

都係嗰句,從事傳播業為什麼還要向政府申請昂貴又限制多多的廣播牌照呢?!

救亡方案加速死亡

好了!我們弄清楚了這個問題的第一部份,現在我們來看問題的第二部份。

有不少傳統媒體即使未「拉閘」,卻在「流血不止」之中,廣告收益每年以雙位數的比率下降,觀/聽眾/讀者的數字亦然。媒體管理層的救亡方案是把內容上網,然後收取網路廣告。這不但救不了亡,還會加速死亡,因為觀/聽眾/讀者去了網站看/聽你的內容,進一步拖低網下媒體的收視/聽率或是讀者人數,網路廣告又收不起錢。

請記著這句話:用傳統媒體營運思維去搞網媒是死路一條!

商戶自營媒體

為什麼香港商戶的廣告預算愈來愈少放在傳統媒體身上呢?是分了去網媒那裏嗎?這是其中一個原因,目前卻不是主因,因為大部分香港網媒仍然是未按著網路邏輯經營的,因此行銷效果不彰。真正的主因是商戶自己製作內容,成了傳統媒體的廣告預算競爭者!

曾擔任全球最大的公關顧問公司愛德曼資深副總裁的Michael Brito在2014年出版的《自己的品牌自己做》(Your brand, the next media company)一書中,就主張所有企業都應該轉化為媒體公司。

商戶轉向自己經營媒體,即所謂的「內容行銷」 (Content Marketing),這已經是不可逆轉的趨勢,Media Placement的預算急速下滑,商戶情願自製內容放在自家的媒體,再透過社交媒體平台推廣出去,與潛在客戶直接建立關係,再收集數據,作業務分析。傳統媒體那種沒有收集任何具體客戶數據的廣告形式根本無法競爭!

內容只是手段,關係和數據才是目標

紐約市立大學(City University of New York)新聞研究所教授,也是buzz machine.com站長的Jeff Jarvis在他的著作《媒體失效的年代》(Geeks Bearing Gifts)一書內這樣說:

「你會發現我在本書當中,將一再主張『關係』是媒體商業模式的必要元素,也就是說:將民眾視為個人以及社群,以便為他們提供更切合需求的服務、建構出更大的價值,這會是媒體追求存續和成功的關鍵。當然我們還是會繼續製造內容,但內容不是最終產品,只是我們用來為社群及其成員提供訊息和服務的其中一件工具而已。

內容也許還是會保有能夠販賣的內在價值。不過,現在內容又有了另一種價值,是一種用來瞭解一個人的方式:那個人對什麼感興趣;那個人知道什麼,又想要知道什麼;那個人住在哪裏,從事什麼工作等。以上這些信號(signals)都能夠促使新聞機構為那個人提供更大的價值,從而獲得忠誠度、投入和營收。是的,這就是谷歌、臉書與亞馬遜的營運方式。」

若果傳媒經營者明白並且掌握了這段話的意思,他就知道網媒不是以經營「內容」為目標,而且透過經營「內容」去建立「關係」並收集「數據」。換言之,用內容吸引人流,傳統媒體就止於此,但對網媒來說只是起步,之後與觀/聽眾/讀者建立忠誠的關係和在他們的同意之下收集數據,才是經營的重點。

內容工作者的出路

好了,現在讓我們來談論一下「DBC交還牌照事件」的第三部分問題。一棵大樹倒下,一批傳媒工作者頓時失去工作,在今天的傳媒環境,再找工作並不容易,即使是電台執牛耳者的商業電台在過去的日子也是不斷減磅。在社交媒體當道的今天,欲從事傳播工作的人必須有新的視野,進入傳媒機構獲得聘用已經不是唯一甚至不是最佳的進路。

經營「自媒體」養活自己

社交媒體平台賦予所有人免費的傳播平台,愈來愈多人成立「自媒體」(We Media),透過自製內容與社交媒體平台的廣告合作計劃分享利潤,能夠成功養活自己的,內地有《羅輯思維》的羅振宇,香港有提供遊戲攻略短片的大J,當然要舉例下去還有很多。最重要的 是你所「銷售」的是你的強項,並且定期有紀律地提供優質的內容。

提供「內容行銷」服務

內容工作者的另一條出路是自組公司向商界提供「內容行銷」(Content Marketing)的服務。在所有企業都是「媒體公司」的年代,內容製作的需求非常大,而懂得製作優質內容的市場推廣人員並不多。行這條路的內容工作者當然需要強化自己的市場推廣意識與知識。

我要説的是,世界已經完全不一樣了,與其抱殘守缺,不如迎接新時代,為自己創造機會。

在網路世代,所有經營者都必須謹記的四個關鍵詞:行動(Mobile)、關係(Relationship)、數據(Data)和內容(Content)。

撰文:徐少驊

「大數據」與媒體(四):用精準殺掉創意/ 徐少驊

big data and media

原本是第一篇的内容,沒料到最終要寫到第四篇才寫到。這篇會是終章,必須直入「數據亅如何進入了媒體的營運並且帶來所謂的「數據主導新聞學」(Data Driven Journalism),文末也會寫到我對數據主導下的網媒的憂慮 。

十數人經營的網媒,每月瀏覽量超越兩千萬

先來說一個經典個案,若果你經常留意網媒新聞,你必定聽過它,若果你仍未聽過它,我認為你必須花數分鐘讀完拙文。

它的名字叫做Lifehack,網址是 http://www.lifehack.org 。Hack有坎、劈的意思,另外,也有解作journalist、correspondent、newspaperman,即「僱傭文人」。Life就不用解釋了吧。先説一説它如何厲害,去年每月的瀏覽量已經超越2,000萬,訂戶超過20萬,目前的Facebook專頁的粉絲有867,000人,最厲害的是它只有十數人在經營,大部份是程式員,主力編輯一人,她叫Anna,並且不需要聘請大量寫手,最最厲害的是有錢賺,而且跟隨著閱聽人數的增加而不斷上升!不容易吧!就連香港No. 1網媒《壹傳媒》(可以這樣稱呼它吧,因為這個媒體集團正不斷收縮紙媒,並擴展網媒)也在虧蝕中,Lifehack是怎樣做到的呢?!很想知道吧!

「文章篩選閱讀神器」監視網絡文章

好了!讓我們從頭説起,2005年,二十五歲的香港留學澳洲青年何樂頌(Leon),業餘地創辦了Lifehack.org,內容主要圍繞人際關係、職場要訣,也就是説目標讀者群是上班一族,網媒定位清晰明確,容易操作及推廣,這是Leon行出正確的第一步。Leon一開始就選擇以英文作為網媒的語言,潛在的讀者就擴展至全球的英語人,這是他行出正確的第二步。以業餘時間經營了兩年,每月的瀏覽率達到100萬,廣告收入超過了正職薪資,看到了前景,Leon決定全身投入,並把這個網媒帶回香港擴展經營。

這是故事的上半部,現在進入故事的最重要部份,就是Leon如何利用「數據」不斷壯大Lifehack。Leon找電腦程式員寫了一個「文章篩選閱讀神器」(「神器」),監視著200多個全球最受歡迎的網媒上不斷更新的海量文章,透過運算程式計算出每篇文章的受歡迎程度,包括在Social Media獲得的Like和Share數,若是文章達到了指標,「神器」就會把有關的文章Highlight。

全球二千寫手按「寫作指南」寫文

之前提及的編輯Anna,她的其中一個主力工作就是透過解讀「神器」的結果,抓著最受歡迎的題材,硏究文章的結構、寫作風格、用字、配圖等等,然後編寫一份「稿單」,發給Lifehack的「特約寫手」,稿單內已列明寫作方向、風格、用字等的指導。Anna每天發出60至80篇(今時今日或許更多)稿單,Lifehack全球有超過2000名「寫手」(或稱為博客),當中有約500名是活躍寫手。這些寫手都獲得一份詳盡入微的「寫作指南」,按著來寫文章,就可以得到良好的Social Media表現(Social Media Optimization SMO)。這份「寫作指南」是如何得出來的呢?就是由Lifehack經過日積月累研究受歡迎的文章後歸納出來的。

Robot收集數據監視文章SMO表現

好了,有了「寫作指南」,也不代表每一名寫手都成為網文高手,Lifehack開發了一個名為「Robot」的數據收集及分析系統,監視著Lifehack每一篇文章的SMO表現,有多少個Like,有多少個Share。得到高SMO的寫手就可以留低,表現欠佳的就會被Out。

就是這樣,Lifehack彷彿成了一個「網文實驗室」,每一篇文章的表現都有客觀的數據作統計及分析。有時為了分析更加細緻準確,Lifehack開初時會將一篇文章作不同的處理,例如有不同的標題、不同的Infographic,即所謂的A/B題,網民會看到不同的版本,Robot再搜集Social Media的數據,看那一個版本會獲得更佳的SMO效果,下一步就是按著數據結果決定最終用那一個版本。

就是透過這種數據的收集和分析,Lifehack的文章得到了愈來愈多的like和share,網站的訂戶數和各種社交媒體專頁的粉絲數亦直線上升。

事實上,Lifehack也不算是創先河,赫芬頓郵報(Huffington Post)的創辦人之一Jonah Peretti,他也是BuzzFeed的創辦人,就是引用了上述的「數據搜集與分析」、「A/B題」等方法,將赫芬頓郵報與BuzzFeed推上成為最成功、最多人看、市值最高的網絡媒體。

數據主導下,「新聞價值」無人再提

這種「數據主導」(Data Driven)的經營手法也有不少爭議的,其中最大的爭議是新聞網絡媒體由「編輯主導」(Editor Driven)轉為「數據主導」。90年代初,壹傳媒將「市場主導新聞學」(Market Driven Journalism)引進香港,「數據主導新聞學」其實只是「市場主導新聞學」的極致落實,「新聞價值」(News Worthiness)這個詞彙在新聞房(News Room)已經消失,新聞寫作與標題都受到數據的影響。

以計算取代嘗試,以精準取代探索

網絡文章的創意也受到數據的限制,大家不妨去Lifehack看看:7 Simple Hacks To Make Your Days In The Kitchen Easier、10 Effective Leg Exercises You Can Do On The Couch、7 Easy Body Language Tricks to Help You Get Over Anger and Get You Back to Feeling Great……,文章的寫作方法和題目都很容易落到類近的格式中,這是因為數據會告訴你,怎樣的格式WORK,然後網媒編輯就會指引負責寫作的人怎樣寫和起怎樣的題目,正如前述,Lifehack給寫手一份詳盡的「寫作指南」,創意在網媒是不值錢的,甚至是浪費時間的。至於有人預測,數據科技會否發展至由電腦按著演算法寫文章,就連寫手也可以慳番,我真的不敢說!也就是說,今天我在這裡寫的東西,都會被輸進演算法的系統裡,電腦不斷學習寫文章,最後寫得比我更好,並且取代了我。若這一天真的來到,寫作這項活動也成為了一種運算,人類還有「創作」活動嗎?「洞見」如何產生?!

數據科技的演進是大幅地用電腦取代人類,以「計算」取代「嘗試」,以「精準」取代「探索」,人類的活動因此變得愈來愈規範化,難道這真的是我們想要的世界和生活方式嗎?!人類剩下的似乎就只有「反省」,確實是時候反省了!

「大數據」與媒體(三):從毛記電視說到Facebook Live,媒體生態大變易 / 徐少驊

萬千呃Like賀台慶 0 

毛記電視的「萬千呃Like賀台慶」,不能不欣賞三位自我定位為「廢青」的老闆匠心獨運,既能突破傳統,又能貼近「地氣」,捉緊市民/閱聽人喜怒哀愁的思緒,更難得的是找到一種商業模式讓創意有發揮的基地,殊實不容易。當然,這個騷在技術層面仍然有不少瑕疵,有甩轆,有冷場。不過,我相信這方面的執漏工作並不困難。

毛記電視締造三赢局面

毛記電視的「萬千呃Like賀台慶」能夠在入屋的免費電視網絡ViuTV同步直播,宣告了網絡媒體跟傳統媒體在内容及發行上的合作正式展開,也就是說,當香港的電視業出現了真正的競爭局面,電視網絡需求大量優質的電視節目內客,任何人也可以成立小規模的電視節目製作公司,既有自己的網絡頻道,也可以跟擁有入屋牌照的電視台合作,達成電視台、內容供應商和觀眾的三赢局面,亦令香港觀眾願意著回電視,確實是功德無量。

當然這不是什麽新模式,香港電台就一直有外判節目和外判時段的操作,數年前我也曾經被問到有否興趣交份Proposal玩吓,那時我正忙於發展我的「客戶關係管理」業務,雖有興趣,卻實在無暇兼顧。現在ViuTV跟毛記電視的合作卻是為這種合作模式産生更大的想像空間,我相信,電視生態又會有新一輪的變易。

42萬Facebook粉絲,其他網媒望塵莫及

明顯地,毛記電視的一班年青經營者除了創意非凡之外,他們目前最厚實的本錢是在Facebook Page到目前為止已經累積了超過42萬個Like(Follower),它每一個post經常有數千個Like和數百個share,短片的view數動輒就是數十萬,上百萬view數的亦經常出現。明顯地,他們亦很懂得玩網絡的viral effect,經常成功「呃like」,這是目前很多媒體包括網媒也是望塵莫及的。

毛記電視單憑它超過42萬的Facebook followers,已經可以開始為商戶提供「數據營銷」服務了,這個是毛記電視的一大資產,它要做的就是向粉絲取得一次性授權,容許它存取個人資訊,當然我不知道他們開始這樣做沒有。

Facebook Live推動直播

我觀察到的另一個會給影視網絡媒體帶來沖擊的是Facebook Live,之前有一個叫「17」的直播應用程式非常火,吸引了一眾港、台演藝人、嫩模用來直播自己吃飯、睡覺、聽歌、剪指甲,據説有人還玩脫衣騷。我也曾經觀摩了一會兒,但後來發現大部份內容實在太無聊了,所以就剷走這個App了。除了17,當然還有很多其他直播「鴨屎」。YouTube亦一早就有Live功能,香港不少網台用來直播節目,現在Facebook來分一杯羹,我相信對於推動網絡直播的效果會非同凡響。

過去給Facebook看上了的都會被發揚光大,最明顯的例子就當然是Instagram啦!Fookbook的強大之處是它的「網絡人口」是全球最多,而且engagement rate亦非常之大,它達至的規模效益令對手難於匹敵。

Facebook與YouTube雙雄爭霸

Facebook加入直播行列會給網絡尤其是媒體有什麼沖擊呢?我也不敢説得太死,不過「平台轉移」應該會出現,過去用開YouTube做直播的必須考慮是否要轉到Facebook去呢?在YouTube和Facebook直播各有優勢,當然不排除網媒可以同時用兩個平台直播啦!

目前YouTube做得比較好的是節目的channel archive,直播之後,頻道經營者可以將節目分類,影片也可以加入描述、標題、連結等等,方便觀眾隨時自選觀看。YouTube最強的當然是有一個「分潤分成」計劃,YouTuber用心拍片就可以有不錯的回報,首名香港YouTube頻道觀看次數過億、專門上載試玩電玩遊戲短片的大J,就間接承認他憑YouTuber這份工作,每年的收入就過百萬了!

Facebook用演算法排擠YouTube

至於Facebook的最大優勢當然是它的傳播潛力,由於Facebook使用者的engagement實在太強了,Facebook要用它的演算法來幫你推波助瀾,你的live show的傳播邊界將會很闊很廣,我相信這也是天皇黎明揀Facebook做他的演唱會直播的原因。

事實上,Facebook使用演算法鼓勵網友直接在Facebook上載短片已經有一段日子,而且不是秘密,很多網民都經驗過,一條片,上載至YouTube,再把連結在Facebook貼上,你會發現like、share和comment的數目都不多,你會懷疑難道短片內容真的如此差勁?!之後你把同一條片直接上載至Facebook,風景立時改變,網友的反應熱烈多了!點解?因為Facebook用演算法推post來獎勵你。Hank Green 就曾經寫過一篇叫做 "Theft, Lies, and Facebook Video" 的文章詳述Facebook這種對付YouTube的「那渣」手段。

Facebook利用演算法鼓勵網民直接在Facebook 上載短片,我相信這樣的手段會同樣應用至直播。另外,據說Facebook亦有計劃仿效YouTube的利潤分成計劃,若然如此,「平台轉移」的效果將會更大。當然,YouTube也不是省油的燈,它背後還有Google這個強大後台,Google亦著意藉著Google Plus在社交平台這個領域分一杯羹,所以這一場影視平台大戰,雙方確實是勢均力敵。

「個人電視台」開台只需一部智能手機

我想到的是,Facebook Live的出現令「個人電視台」在基建上再沒有障礙,任何人要開一間一人或是小型電視台,完全無須在傳播通路和影片存放作任何投資,基本上,數千元的一部智能手機就可以了,認真一些的就花數萬元添置攝影、燈光器材和剪片軟體,這個花費絕大部分人都付擔得起,「個人電視台」可以在Facebook或YouTube上載節目表,全球粉絲既可以據此欣賞直播,亦可以在archive自選影片。

當「個人電視台」愈來愈多,就會對入屋的電視台和網台構成影響。道理都是那一個,觀眾的「注意力」是當今商業世界千方百計努力爭取的稀缺資源,而且是定額的,一分鐘花了在你的媒體,就少了一分鐘花在別的媒體。

「大平台」加「大數據」兩大致勝關鍵

當然,這個網絡世界,最後的贏家不是毛記電視,不是「個人電視台」,而是像Facebook、YouTube這樣的大平台,它們無須挖空心思製作內容,給出一個平台,大家就無償的奉上內容,然後就可以把網民的「注意力」賣給商家。

Facebook和YouTube這樣的大平台還有一個利器是內容供應商所沒有的,就是「大數據」,它們憑著知道每一名網民曾經按下哪個連結觀賞過什麼內容而向你push對應的廣告訊息。譬如有一次我在Facebook按下一個網店的post並且進行購買活動,有一段時間,我的Facebook動態消息(Newsfeed) 就經常出現不同的網店推廣訊息,類近的經驗我相信大家都不缺吧!

其實網媒也可以經營「大數據」,以助內容發放的精準度,或是像Facebook和YouTube一樣把粉絲的「注意力」賣給商戶,這方面我會在另篇詳述。

「大數據」與媒體(二):觀眾喜歡看王宗堯拍什麽戲 / 徐少驊

王宗堯

維基在一個商業電台主辦的「在睛朗的一天搶收視電視擂台」上説過,他不相信「大數據」。我猜他的意思是不相信可以靠數據分析,能夠编出一套創意甚豐又高收視率的電視劇或電影來。不過,Netflix的《紙牌屋》(House of Cards)據説就是靠「大數據」編寫出來而大賣的電影劇。

當然,其實王維基沒有錯,說《紙牌屋》是靠「大數據」編寫出來的是誤傳,將來會否做得到,我不敢斷言。

「大數據」預知影視作品受不受歡迎
不過,《紙牌屋》確實跟「大數據」有密切關係,根據《Inside科技網誌》的報導:「早在一年前,Netflix就開始利用大數據分析,對節目的進行安排,透過對觀眾收看習慣的了解,Netflix發現, 那些喜歡看BBC舊版《紙牌屋》的觀眾,同樣也喜歡大衛芬奇導演的電視劇,或者凱文史貝西主演的電視劇。因此,對Netflix的高層來說, 購買這部由大衛芬奇導演,凱文史貝西主演的同名電視劇就是合理的。而這也最終也讓他們決定花一億美元來購買這個1990年BBC同名電視劇的重製版。」有興趣閱讀整篇報導的,可以按這個
連結: 。

所以,目前階段,「大數據」是有效協助影視製作管理層作決策,譬如説,周潤發或王宗堯夥拍什麽導演或男女演員飾演怎樣的角色拍什麽類型的電影就一定掂,以前電影票房是靠經驗老到的電影製片去估,現在不用估了,「大數據」分析可以告訴你。

我沒有出席前述的那個電視擂台,我不知道王維基是否連這一個作用也不相信。Well,若果王維基不相信而你也跟他一樣,我可以告訴你:「你很快就遇上困難了!」想知點解我咁講,請繼續讀下去。但我必須補充一句,我也不相信「大數據」可以取代創意,有一些新導演如翁子光新演員如白只、春夏有一些電影如《十年》 ,「大數據」是沒有足夠數據去分析的。

固有思維,難有作為
經營網絡媒體,最難的是改變固有思維,今天香港的網媒中,有不少的經營模式仍然是把文章、聲音、影片放上網,吸引最大量的讀者、聽眾、觀眾的眼球、以「收視率」、「收聽率」、「閱讀率」來説服商戶來下廣告。換言之,只是傳播的媒介改變了,經營模式其實一樣。

很多影視製作人或許仍然相信,只要有好橋,製作受歡迎的節目,就是媒體的致勝之道;TVB即使是一台獨大這麼多年,收視率仍然不停向下,是因為節目質素下降;ViuTV一出來就搶走了大量收視率是因為它的節目有新橋。

是否真的如此?

我認為節目質素和新意固之然重要,不過在今天這個「大數據」時代,欠缺了對客戶的深度了解,管你是ViuTV、TVB、HK01、端傳媒、壹傳媒、東方報業,你都很難走下去的。

「以客為本」不再是口號
互聯網對整個商業世界帶來了「典範式轉移」(Paradigm Shift) ,其中一個叫做「以客為主」,以前確實也喊過,但只是一個口號,沒有製造商或服務商take it seriously。說到底,都是以自己的方便為本,大量生産,然後用廣告為消費者洗腦,嘗試説服客戶,這個産品/服務就是你所需要的。

以下的内容有點悶,但我希望你可以堅持多一會。

有了網絡,更正確點説,有了「數據」(Data) ,再更正確點説,有了「客戶數據」(Customer Data) ,「以客為主」成為了在操作上一個可以實現的選項,落不落實就視乎經營者信不信每一個客人都是不同的,而你要爭取他/她過來,就必須聽他/她的話。

今天,不少超大企業也會不惜改變整個企業的人事組織結構、工作流程、銷售渠道、成效標準……,都是為了要落實「以客為本」的這個全新「典範」,最新的講法,這叫做C2B(Customer to Business),因為它們都相信,不足十年,若果你不落實這個全新典範,你就難以生存下去。

這就是我在之前的一篇文章所說的「換腦袋」的意思,剛去世不久的前Intel總裁安迪葛洛夫(Andy Grove) 在上世紀八十年代的企管名言是:「只有偏執狂才能生存!」(Only Paranoid Survive!) 在廿一世紀的今天我會説企業生存之道是:「只有落實以客為主的才可生存!」

視每一個客戶為獨特個體
什麽是「以客為主」呢?

首先這不是一個欠缺落實操作的口號,不是一個視客戶為「上帝」的專横意識,也不是視客戶為一個模糊整體的一種服務精神,請把上述陳舊觀念全部打上一個交叉。

什麼是「以客為主」呢?就是你必須視每一個客戶都是獨特的個體,你必須按著他這個人的獨特需要、按著他的意願和生活習慣提供服務!為什麼我在這裡不説提供產品?因為在「大數據」行銷世代,再沒有「産品」,所有商業活動都化為「貼身/貼心」的服務!

「以客為主」是:

「你必須視每一個客戶都是獨特的個體,你必須按著他這個人的獨特需要、按著他的意願和生活習慣提供服務!」

Believe it or not?!

好了!若果你已經開始半信半疑,你就讀下去吧!

香港網媒仍然不知道誰在看它們
好了,現在開始讓我們換腦袋來繼續聊下去吧!

過去,除了訂戶之外,我們不會知道誰在看我的媒體,而且訂戶訂了之後是否真的在看,我們也不能確定。給商戶的reader profile靠的也只是一些不盡不實的所謂「讀者調查」,對吧?你要知道每一個正在看你的媒體是誰,基本上是不可能的。

網絡媒體卻不一樣,網媒經營者要是真的想知道的話,是可以知道的,並且可以知道得非常透徹,你可以知道每一名來訪者是從那裏進來的,什麼時候進來,看了什麼,看了多久,停在哪裏、來訪的頻率和模式,透過智能手機、平板電腦還是桌上電腦來訪……,你想要知道什麼都可以。

不過,我並不相信目前有很多香港網絡媒體經營者知道誰在看它們。為什麼?從香港網媒的登錄設計就可以看出來了。絕大部份的香港網媒都採用開放式登錄,任何人都可以自由瀏覽,無須經過登入(login)手續。當然,來訪者是來自哪一台電腦仍是可以記錄下來的,但究竟是那一個人在看呢?每一次從這部電腦的來訪者是否同一個人?這就不可確定了!

這是一種沒有信心的表現,怕來訪者要登入才可瀏覽調頭就走,我同情這樣的顧慮,但我認為令來訪者使用真實身份登入是所有網媒都應該努力的方向。

首要是令來訪者login
你試想想,全球最大的網媒Facebook,它一開始就堅持你要登入才可以使用及瀏覽,它才可以成為今天擁有最多個人數據的巨擘。

即使你容許來訪者無須登入也可以看到你的內容,你也可以設定一些「誘因」鼓勵來訪者完成登入手續,譬如有不少中國大陸的線上影視媒體就以加快下載速度作為來訪者登入的誘因。而且一經登記鎖定,以後就無須再經過登入程序,對來訪者來說不算得上滋擾。

網媒可以給來訪者兩款登入的選擇,一是用電郵地址登記,另一是用社交媒體帳號登記,我認為應該設立誘因鼓勵來訪者以社交媒體帳號登記,因為來訪者一旦容許你掛扣到他們的社交媒體戶口,你就可以收集到大量有關他們個人甚具商業價值的數據,對於建立「以客為主」的商業模式非常有用。有了第一步關係的建立,就可以透過多種「優惠誘因」(Incentive Program) 讓來訪客戶願意跟你建立更深入的關係,留下更多真實的個人數據。

「辨識你的客戶」(Identify your customer) 是「大數據營銷」的起點,沒有這一步,就沒有之後的數據發掘(Data Mining)。

好了!這一篇就講到登入,如何令來訪者黏實你、花多些時間看你供應的節目?這是另一篇的題目。

「大數據」與媒體(一):給媒體消費者選擇「爛片」的自由 / 徐少驊

Viu TV

ViuTV甫一開台,就成功地從TVB手上搶佔了大量收視率,說明的不是ViuTV的勁,而是過去一台獨大之下的TVB是如何Hea做,就等於昔日國民黨不是被共產權打敗的,而是被自己的貪腐所蠶食。中國歷史就像一條迴轉壽司帶,今天的中共面臨著習近平、王岐山念茲在茲的「亡黨亡國」威脅,真正的敵人也是在黨內而不是什麼「外在勢力」!

網媒經營者必須換腦袋

先旨聲明,這不是一篇政論文章,講的是有關「數據科技」(Data Technology) 如何應用在媒體業上,所以若是對這方面沒興趣的你,請隨意轉台。

近年香港的媒體業有很多變化,遠的不說,近的除了有ViuTV開台,還有永恆的ATV終於落幕,由香港電台的RTHK31、32、33所取代、NetFlix和LeTV將線上隨選影片服務推來香港、《太陽報》宣佈完成歷史任務、同時《端傳媒》和《HK01》大手出擊,當然還有此起彼落不同規模的網媒,都在爭奪閱聽人有限的閱聽時間。

不過,似乎大部分的媒體經營者在經營「網絡媒體」上都沒有換腦袋,只是將內容擺上網,吸引「讀者/觀眾」來看,唔覺意睇埋網頁或影片上的廣告。

高收視率不再是Killer App

先用一個例子來表達一下線上影視媒體與傳統電視網絡媒體的差異吧!經營一家電視台,你的首要任務是製作高收視率的節目,然後就可以收到高價廣告費,這個道理不用傳理系老師告訴你,你也懂得,對吧?線上隨選影視媒體又如何?它們的Killer App是「選擇」,片庫當中有些是「爛片」、「爛節目」也沒所謂,因為「爛片」、「爛節目」也有人愛看,所以線上隨選影視媒體經營者最重要是給視聽者「選擇」,無論是節目/影片類型、量數、地域、語言、影片長度……,然後再按著視聽者的profile和往跡插播對應式廣告,這就涉及「大數據」的範疇,會在另一篇文章詳述。

《紙牌屋》不是Neflix食糊之作

所以,Netflix其實不用靠《紙牌屋》(House of Cards)食糊的,《紙牌屋》的高收視率和用數據來編劇對Netflix無疑在市場推廣方面幫助甚大,不過「高收視率」並不是它的經營模式,Netflix靠的是「片庫」,有點像總有一間喺左近的7-11,在Netflix你總會找到啱你口味的影片,所以在Netflix的片庫裏,按傳統定義的「爛片」、「爛節目」肯定是多於像《紙牌屋》這樣的高質影片,LeTV亦復如是。

靠「長尾」賺得更多

這跟最近的一個叫做「長尾理論」(Long Tail Theory)很有關係。這個理論值得所有經營者記在腦中,因為這是網絡營銷的一條黃金定律。

什麼是「長尾理論」呢?「長尾」或叫「長尾效應」是用來描述那些原本不受到重視的銷量小但種類多的產品累積起來的總收益超過主流產品的現象。簡單再說一遍,就是品種最緊要多,供客戶選擇!

「推薦神器」撮合視聽人與節目

這些「線上隨選影視媒體」的經營模式是盡量「促進」(facilitate)來訪者「找到」、「遇上」他們有興趣看的影片/節目,一個「個人化節目推薦系統」(Personalized Recommender System)就是那個「神器」,有了這個系統,就可以讓擁有不同喜好的觀眾「找到」或是「遇上」他們的心水影片/節目。「神器」如何知道來訪者的喜好呢?這涉及「大數據」的經營,這一篇文章我還是想stick to「選擇」這個關鍵概念。

myTV小家仍欲掌控觀眾

ViuTV成功搶走了TVB不少收視率,這個現象其實並不意外,若是再比對一下它們的App,ViuTV超越TVB可說是幾可成定局。

TVB的myTV處處顯露出它欲掌控觀眾的奢望,那些在archive的影片還要限時限刻的要來訪者按照大台定下的schedule來觀賞,視聽人不但不會按你的schedule行事,還會豪不留戀的跟你講聲拜拜!

「隨選」將主權交還觀眾

網絡時代的媒體消費必須是「隨選」的,什麼時候看什麼節目,決定權交回媒體消費者,myTV顯示出來的傲慢態度在今天這個「隨選時代」是不可思議的!

myTV除了反映出傲慢的態度,還有的一個死症就是跟媒體消費者斤斤計較。原本TVB擁有絕大的優勢,就是它的片庫,它卻不把它全部放上archive供來訪者隨意隨時隨選,而是要收收埋埋,又要付費。

有人立即會說,不是啊,Netflix、LeTV還有不少有線電視媒體也是收費的啊!是的,確實不是絕對不能收費,但免費才是網絡媒體的王道,如何賺錢,方法多的是,想要知道,就請繼續追看這系列的文章。

ViuTV的App又如何呢?驟眼看來,是比較大方,不過由於片庫的節目始終有限,仍然看不出可以有幾大方。

好了,這一次就講住咁多,歸結一句,「選擇」是網絡媒體的關鍵詞,而不再是「收視率」,而「隨選」則是所有網絡媒體必須奉行的天條,犯者必不會有好下場!

「差異化定價」與「大數據」


曾經係Pure Yoga的客戶,不過滿約之後我沒有續約。點解?不是它的服務不夠好,也不是瑜珈導師唔夠堅,只是因為我買了一年的合約,卻發現自己愈去愈疏,起初一星期三次,之後就一個月也去不到三次,於是計起上嚟每堂要成幾舊水,就覺得唔係好抵嘞!

係,無錯,我係計住啲「婆乸數」,而且去唔到係我的時間編配問題,不過,我相信好似我咁嘅客人,Pure應該為數不少。

Pure似乎沒有特別的對策撈回這樣的客人,還是全力以招收新客為主要經營策略。

我想跟大家分享一個數位營銷的新趨勢,叫做「差異化定價」,什麼是「差異化定價」?拋吓書包先,「差異化定價」是在充分考慮產品/服務差異、顧客需求差異、時間差異、地點差異等基礎上,以不反映成本費用的比例差異而制定不同的價格。

拋完書包!大家不妨試想想,若果Pure有一個按著客戶的需求、來訪模式而有不同的定價,會否撈回更多舊客呢?!而這些「懶惰的」舊客不會佔用大量資源,卻是錢照付,Pure何樂而不為?當然,跟「懶惰的」客人keep住關係,當他(我)們變得愈來愈積極,就可以逐步加碼。

要實現「差異化定價」就必須有「大數據」(Big Data)的幫助。任何「大數據分析」都必須首先確立一棵「決策樹」(Decision Tree),並據此來預測(Predict)每一名客人的下一個購買行為,之後就搜集每一名客人的來訪內容,包括時間、地點、頻率、參加的瑜珈班,還有過去購買的內容⋯⋯,然後在合約期滿之前預計他們的下一步行為,及時提供符合他們需求的新合約,成單的就會大大增加。

我的Pure Yoga合約已經過了兩個月,沒有收過任何來自它的聯繫,看來它不但沒有「差異化定價」的策略,還沒有data team去經營數據,這又是另一個大題目了。

我已經轉變了我的健身方法,就係行山、行山,再行山。

從「粉底」說數據行銷

天我派老公去旺角朗豪坊的Laura Mercier專門店買一瓶粉底,店員找了一陣子,說:「沒貨了!」在今天這個資訊科技發達的年代,專門店斷貨是難以想像的事!辦公室要知道店舖的inventory情況,按一下keyboard就是了。事實上,很多零售系統應該是有各分店的inventory alert的,若你的系統還沒有,我勸你深切考慮換過一個有的。
好了!店員說了一句沒貨,就放走了一個potential customer,更準確的說是放走了一個用了這個牌子足足十年的客人。店員當然是不知道的,但就連坐Laura Mercier 辦公室的人也不會知道,因為我不是它的會員,它有否會員制度,我也不知道。

老公send了一個Whatsapp 訊息告訴我這個情況,我正跟兩名女性朋友午餐,她們立即向我推介其他牌子的粉底。

對於Laura Mercier來說,我這個十年客戶走了,它也是完全不知不覺的,為什麼?因為它沒有有關我的數據。

試想,若果它有我的數據,它就會知道我的buying history,當中包括我對上一次購入粉底的時間,並按多次購買的數據,預測(Predict)得到我的NPT(Next Purchase Time),並按此給我發出對應的推廣訊息,例如買粉底加保濕面霜可獲優惠價格。由於我正需要購買粉底,這時候收到有關的推廣訊息,命中率會特別高,有效地使用bundle sales strategy,可以使我成為另一產品的新客戶。

這次經歷其實不但說出「數據」在今天的商業社會的必要性,其實那位店員只要在現場留下我老公的電話號碼,並告訴客人有貨就立刻通知,欠缺這種基本的客戶服務也是說明這家企業在今天「客戶關係」如此重要的商業環境之下,似乎對「客戶關係」還是欠缺了一點了解或著重。

美國股市「閃電崩盤」的一天告訴了我們什麼?/ 徐少驊

Flash Crash

前的一篇《從對的「問題」和對的「數據」開始》,我引用了一個發生在第二次世界大戰時的故事,說明要從數據中解讀出有意義的訊息,還得靠「人」。

人工智能全面取代人類?

2016年開始沒多久,由Google設計及開發的Alpha Go五盤四勝赢了南韓圍棋棋王李世乭,大家都說,「人工智能」、「演算法」、「大數據」這些由電腦運算的應用程式「全面取代」人腦已經是無可避免的現實,在不久的將來,大量的工作將由擁有人工智能的機械人所承擔,演變下去,甚至最後可能由發展出意識的電腦統治人類世界。

這個噩夢會否成真?!老實說,我不曉得!不過,科技的發展一直都是在取代人原本負責的工作,人就轉向更高價值產出的工作,這是任何一本科技史書籍都會告訴你的。當然,這一次來自數據科技的替代風潮,極可能是規模最大的一次,但人是否就真的會被「全面取代」呢?我對這樣的結論仍然是抱有懷疑的。

演算法導致美國股市狂瀉暴升的一天

在這裡,讓我用一個我最近讀到的故事來闡述我的觀點:

或許大家不會記得這個尋常的一天:2010年5月6日。這一天,發生了什麼事?

這一天踏入下午兩點四十七分,美國道瓊斯指數突然狂瀉九百九十八點五點,創下史上單日最大跌幅,不過下跌幅度不是最叫人吃驚的,而是下跌的速度,在短短的五分鐘之內,美國這個股票市場呈現了像跳樓般的自由下墜,近一兆美元的財富瞬間蒸發。沒有一個財金界的人知道發生了什麼事,有人甚至懷疑這是電視台搞出來的惡作劇。

沒有人知道發生什麼事,但是有專業投資人感覺到不對勁,開始大手買貨,他們衝出自己的辦公室,向著員工大喊:「買!買!買!」不用理會買什麼,總之就是買!股市反彈的速度比之前下跌的速度更快,平常一整天的漲跌幅度只有三百多點的道瓊斯工業指數,這一天在一分鐘之內就發生了!有些狂瀉至每股幾美分的股票,幾秒鐘之内又反彈至三十甚至四十美元,蘋果電腦就曾經一度從每股兩百五十美元暴漲至十萬美元!一些交易員或是投資者去一次厠所或是呷一口咖啡就隨時錯過了這次的發財機會。

究竟這一次「閃電崩盤」是如何造成?至今仍然未有定論。不過,最多人估計是目前在基金市場流行的「演算法」闖下的禍。什麼是演算法?即是由電腦程式決定股票買賣。有説這次的「閃電崩盤」是由於一名堪蕯斯市的貨幤經理用演算法太早地將價值四十億美元的股票期貨抛售而引爆其他演算法紛紛跟進。

再説一遍,沒有人知道這一次「閃電崩盤」是如何造成的,因為演算法的運作是按著程式設計無聲無色地進行買賣,當中無人監管,導致問題發生之後難以追究到底「誰」才是禍事之源頭。

人的思考方式才最重要

是的,有人會說,演算法是會不斷地演化和進步的,這種「禍事」會得到監控、限制和修正。我要說的其實也不是演算法的弊病,我真正要說的是,「人」才是數據最準確、最有效也是最有效率的詮釋者。我們既可以最快地從異常數據發現問題,不會被異常數據所愚弄,也可以用跟進的數據發挖找出表層數據無法表達出的訊息。

有「中國大數據教父」之稱的阿里巴巴集團副總裁車品覺在他的《勝算 大數據密碼》曾經這樣說:

「在大數據的商業環境裡,既要懂數據,又要懂商業,還要擁有一套好的思維方法,……我認為,人的思考方式在大數據充斥的商業時代尤為重要。」

我十分同意這個說法,今天數據比以前確實是容易獲取得到,以前我們的問題是欠缺數據,今天企業面對的問題明顯地是不一樣了,我們擁有很多數據,卻不曉得哪些數據才是真正有用。

不論是何種處境,其實基本還是「人」的問題,企業需要的是懂得問基本商業問題的管理人,而在這個所謂的大數據時代,這個管理人必須兼具數據科學的知識,懂得在數據的大海中暢泳,透過反覆的提問與數據發挖,為企業作出最佳決策。

所以,在大數據的時代,人,不但不會被取代,他們提出關鍵問題的功能更顯重要。

 

從對的「問題」和對的「數據」開始 / 徐少驊

  

天讀到一則有關「數據」(Data)的故事,覺得頗有趣,跟大家在此分享一下:

話說第二次世界大戰期間,同盟國和軸心國由陸地打到海上再打到上天,制空是任何戰役中非常重要的關鍵。

戰機身上的彈孔能告訴我們什麼

戰爭期間,一群科學家提出可憑戰機身上的彈孔數據分析來增強戰機和機師的安全。如何做到呢?就是將所有完成任務回來的飛機進行彈孔數據收集及統計,一張一張的圖表就這樣出來了。

科學家和工程師圍著數據討論,各抒己見。有人主張應該鞏固戰機受到攻擊密度最強的位置,也有人提議該從油箱和駕駛員所坐的位置著手改善戰機的設計。

大家都在引用著數據來闡述觀點。

沒有參考價值的數據

在大家彼此爭論不休的時候,有一個人緩緩的站起來,清一清喉嚨,以示他要發言,當大家都靜下來,看一看這名一直只是沉默不語、隔岸觀火的人要說些什麼,他劈頭第一句竟然是:

「這些數據都沒有參考價值!」

大家瞪大眼睛等待這個人對自己力排眾議的言論進一步的解釋。

「這些能夠安全飛回來停在停機坪等待維修的戰機,正說明了在它們機身上的彈孔落點都不是致命的,真正致命的彈孔數據已經隨著被打下的飛機沉在大海裡了!」

問對的問題,收對的數據

這個故事屬真屬假我不得而知。説這個故事的作者陳傑豪認為,這個故事的教訓是要「問對問題,才能找到答案」。

我不反對有關「問對問題」的主張,不過這則故事似乎是説收錯或是用錯「數據」的問題,數據無處不在,今天很多企業的系統内都儲存著一定數量的數據,有些是任由其存在而不作任何經營,有些則胡亂引用數據,浪費了大量人力物力,但得到的卻是沒有價值的甚至是錯誤的答案。

問對問題,確實是經營數據的起點,引用對的數據才可以得出正確並有用的答案,再進一步,就是如何詮釋這些「答案」對這盤生意的意義了。

所有這些都是「人」的工作,是電腦或什麽演算法取代不了的!