大數據時代 人工智慧改變世界
科技不斷演進,雲端、大數據、工業4.0、金融3.0等正在帶動產業型態改變,人工智慧(AI)、機器學習(Machine Learning)也成為當紅炸子雞,科技大廠包括蘋果、google、臉書都積極投入,以電商起家的亞馬遜近期拋出未來消費體驗的「Amazon Go」,更是令人眼睛為之一亮。
當使用者走進「Amazon Go」,只要穿過閘門時,開啟手機讓其辨識,隨後不論拿起牛奶、水果還是三明治,系統都會自動協助記下商品,挑選完商品後,不用排隊也不必結帳,使用者可以大搖大擺地走出超市,亞馬遜的智慧科技就會自動結帳、扣款。
實體超市Amazon Go背後運用的就是AI,利用感應器、電腦視覺和深度學習演算法等技術,自動判斷消費者拿了哪些商品,再利用人臉辨識系統,辨別消費者身分,當走出商店時,「拿了就走技術(Just Walk Out Technology)」就會自動從消費者已經登錄的信用卡或提款卡扣款。
要讓機器更有「智慧」,關鍵就在於大量資料的匯入與訓練,但是,面對日益龐雜的數據,需要透過更有效率的方式去蕪存菁,進而提煉出有價值的資訊。新興行業「資料科學家」正是得以在各領域中發掘隱藏在巨量數據背後的可觀商機。
資料科學崛起 人才卻短缺
台灣Open Data資料開放指數在全球149個評比國家中名列第一,在政府、非營利團體與企業共同推動下,資料分析逐漸攀升為各大產業不約而同挹注資源的重點發展項目,台灣更是國際間相當看好的資料科學發展搖籃。然而,雖然台灣目前在資料科學方面有大量需求,卻面臨人才短缺的處境。
對此,微軟大中華區副總裁暨市場行銷兼營運事業部總經理康容表示,在數位轉型趨勢下,將促使雲端技術與大數據蓬勃發展,但是,隨著產業需求攀升,人才與技術的斷層問題也隨之浮上檯面。現今國際間對資料科學家的需求大量且迫切,預估2018年國內資料人才需求將達到10萬人,但目前全台資料科學家僅有1,092人,求職市場嚴重供需失衡。
《哈佛商業評論》將資料科學家譽為「21世紀最性感工作」,身為一名資料科學家,意味著將有機會獲得來自金融、零售、科技、教育等跨領域的工作,在美國,可獲得比整體平均薪資多出113%的薪資水準(Indeed.com調查)。為什麼資料科學家能在近幾年來成為企業眼中最炙手可熱的瑰寶呢?
資料科學家 21世紀最性感工作
被譽為R語言先驅、微軟亞太區資料科學總監格雷厄姆(Graham Williams)認為,資料科學家可為組織解析大數據當中所蘊含的規律,與可供商業決策的洞見,進行以實證數據基礎為導向的決策模式,將有助於減少片面資訊的誤導與人為判斷的失誤,加快決策的進行與決策品質。
格雷厄姆說,目前R語言是資料科學家最常用的分析工具,一來是因為R是開源且免費的工具,其次是由於來自世界各地的資料科學家、統計學家、機器學習工程師等開發人員,都會使用R,光是目前整個生態圈中,就有高達1萬450個套件可以使用,R也能夠與其他分析工具相容,這就是它為什麼強大的原因。
格雷厄姆建議,要成為資料科學家,首先需要擁有先進能力與技術,其次要能夠善用工具,例如:R語言或是開放資源Rattle。這是因為R語言在資料分析領域的功能完備且強大,但對使用者而言,可能較難上手,但Rattle藉由圖形化介面,可協助使用R語言的資料科學家快速地建立機器學習模型,也成為目前相當適合入門且被廣泛使用的工具,更重要的是,學習者可運用線上平台的開放課程資源自學,充實資料科學的基礎能力。
除了R語言外,Python目前也是在資料科學家中熱門的語言。格雷厄姆認為,這是很好的趨勢,這代表著資料科學家可以有更多選擇。R擁有豐富的統計與機器學習的生態圈,Python是一種通用語言,廣泛應用在許多領域,兩者結合起來,資料科學家就得以更快地分析大數據,更能夠自由使用雲端上的運算能力。
格雷厄姆強調,資料與AI的關係密切,資料科學家居中擔任協調的角色,面對的是從無到有的過程,所有開發出來的資料都可能成為驅動人工智慧的關鍵。身為資料科學家,一定要擁有創意及好奇心,嘗試著把觀察到的現象結合起來,資料就會更有價值。◇