文/臺師大大傳所研究生 Arya
大數據的應用無所不在,舉凡機票、房地產、品牌、生活、政治、娛樂等,都能藉由大數據的分析找出網路討論的數量與風向。我待在大數據公司實習超過一年,我的工作就是學習利用大數據系統,致力於爬梳網路上各式各樣的資訊。而公司希望能運用較平易近人、娛樂性的內容,讓大眾能接近大數據。所以我的日常就是時事觀測,學習網友用語,以及發想流行題目。
鳳梨酥之亂
因應中秋佳節的到來,各大媒體總要做一些關於禮盒的排名,我利用大數據系統,製作有關於台灣鳳梨酥的排名,列出全台超過100多家的鳳梨酥廠商,計算他們的網路聲量,並參考其每家分店的Google評分綜合平均,列出表格,綜合評比出前20名的鳳梨酥廠商。原以為一篇具娛樂性質的文章已作業完成,卻引來一陣軒然大波。
文章發佈六天後,某家鳳梨酥公司(簡稱V)打電話到我的實習單位,質疑我方的數據與鳳梨酥排名,V公司表示,他們一直有在觀測網路,分數不可能如此低。對於客戶的疑問,我的實習單位有一套回應的標準流程(SOP),主要是提供足夠的數據,並提出解釋,但本次的數據因為是與Google評分有關,且Google評分有時效問題,我也只能盡力提出新的數據回應。
當時距離文章發佈已經過了六天,這六天的數據當中,V公司的網路聲量的確多了許多新的數據,這很有可能是用親朋好友的帳號上去評分,以增加自己的評價。我必需得推算、扣除掉這六天新增的數據,證明我的原始資料來源並無作假。
想當然爾,推算完畢之後,V公司還是不買帳。於是公司希望我能重新把所有鳳梨酥品牌的店家分數重新算一次,並且做出紀錄,再提交一份新的數據給V公司。
大數據的世界誰說了算?
待在大數據世界的這一年中,我做過非常多不同的數據分析,有時做完分析,會發現和自己認知不同,而有認識新世界的感受,有時也會因為某些情況難以使用大數據分析,而感到困擾。
大數據其實就是將各平台的資料統合成一個私有系統資料庫。假設我們想要查K品牌的聲量,就得將K品牌輸入後,觀察系統回饋資訊,刪除不符合的資訊,或包含同樣也是提及K品牌的別稱,找出網路上有多少人討論K品牌,進而做出分析。從鳳梨酥之亂中,我體會到的不僅是數據的來源多半受到搜集數據的人所影響,還有不管何時何地,應為自己留下工作上的證據,訓練專業度,也保障自己。最後,也就是職場的真相,說明了許多利用手段掩蓋事實,並扭曲真相的人在世界上是何其多。
大數據的應用與局限
近幾年來,無論是民生、消費,還是選舉政治,皆受網路風向以及網友的影響,大數據雖然能捕捉與我們生活息息相關的趨勢與資訊,但也有侷限;財團法人中華經濟研究院助研究員羅鈺珊就提到弱勢常常成為剝削的目標,像是某些議題關注的人若不多,或是關注的平台不在網路上等,大數據就無從觀測,進而造成弱勢聲音被消彌,或是政治利用網路操縱、假新聞帶風向,分裂社會等(90)。而在商業上,品牌不僅能根據大數據觀測自己的品牌形象、討論熱度等,訂定行銷方式,品牌也能利用網路製造虛假的討論熱度又或者是創造假的使用心得與討論,引導網路使用者的消費意向。
目前我還在這間公司實習中,這一年來實習工作讓我學習從「數據分析者」的角度看網路資料,不僅學習用不同的眼光看社會,也在爬梳網路資料的同時,了解到大數據可能受到數據分析者的操縱,而分析之數據也多少帶有數據分析者的主觀意識,在形成、整理、呈現資訊的過程中,更是受到許多不同層面的影響。
資料能用來觀察、預測現象,但也必須注意資料的限制與局限,避免人們完全利用資料理解社會,也須防範有心人利用資料操作、影響社會風向。
參考文獻
羅鈺珊。〈數據經濟下共融成長的挑戰:大數據的兩面刃〉。《經濟前瞻》178 (2018): 87-93。
共誌
Latest posts by 共誌 (see all)
- 敬,原住民族傳智權!── 反思運用傳統智慧的行銷爭議 - 2021-06-14
- 職棒應援與聲響的魅力:從日式應援到台式跨國電音 - 2021-04-19
- 投書:中天換照的聽證後應重新聚焦四項附帶條款 - 2020-10-29