2015年5月1日 星期五

大數據(Big Data)

Q:大數據是什麼?

A:大數據(Big Data)又被稱為巨量資料,其概念其實就是過去10年廣泛用於企業內部的資料分析、商業智慧(Business Intelligence)和統計應用之大成。但大數據現在不只是資料處理工具,更是一種企業思維和商業模式,因為資料量急速成長、儲存設備成本下降、軟體技術進化和雲端環境成熟等種種客觀條件就位,方才讓資料分析從過去的洞悉歷史進化到預測未來,甚至是破舊立新,開創從所未見的商業模式。

一般而言,大數據的定義是Volume(容量)、Velocity(速度)和Variety(多樣性),但也有人另外加上Veracity(真實性)和Value(價值)兩個V。但其實不論是幾V,大數據的資料特質和傳統資料最大的不同是,資料來源多元、種類繁多,大多是非結構化資料,而且更新速度非常快,導致資料量大增。而要用大數據創造價值,不得不注意數據的真實性。

Volume Velocity Variety + Veracity = Value

Q:大數據一定要很大嗎?

A:雖然大數據的狹義定義是,資料量要在100TB到PB之間,但其實絕大多數的企業,都不符合這個標準,大企業如eBay、亞馬遜或AT&T或許符合大數據的標準。但其實資料量只是大數據的其中一個面向,大數據揭示的是一種「資料經濟」的精神,而非只是「大」。

「大,是大數據中最無趣的部分。」天睿資訊(Teradata)首席技術長寶立明(Stephen Brobst)認為,企業真正要尋找的是非傳統的、而且未曾被挖掘過的資料,並且從這些資料中去提煉出價值,這才是對大數據應有的正確認知,而非只是執著於資料大小,只要能從看似毫無意義的數據礦坑中挖掘出金礦,有誰會在意那座礦坑原本是大得像座山還是小得像狗屋呢?

和沛科技創辦人翟本喬就指出,大數據這個名字容易讓人誤導,因為真正重要的其實是大智慧。大數據不只是說資料量有多大,速度快和資料量大都可以用技術輕易解決,但種類(Variety)比較需要智慧。

Q:Big Data和Open Data 有什麼不一樣?

A:開放資料(Open Data)是大數據的一種,但大數據不等同於開放資料。開放資料是指將原本受私人組織或公部門管理的原始資料無條件地開放出來,供任何人使用。近年來討論度較高的是公部門的原始資料,許多民間團體主張公部門資料本為民眾所有,除非涉及個人隱私,否則公部門應無條件開放資料,讓民間可以介接資料,除了瀏覽,還可以加值應用。

沒有留言:

張貼留言