揭開大數據面紗 考驗倫理與法律

記者 程沛茜、陳祈安/台北報導

現社會資訊大爆炸,大數據(Big Data)因此崛起。用3V來解釋大數據,分別是Volume(容量)、Velocity(速度)和Variety(多樣性),這正好呼應了大數據中的「大」代表著資訊數量多、價值高的涵義。不同於傳統數字,大數據資料來自四面八方:手機透過社群網站按讚、更新影片、文字以及聲音。

許多非結構性數據,經由雲端運算再透過分析師得出結果,而從大量資料中尋找有特殊關係資訊的過程,就稱作資料探勘(Data mining)。大數據使用的層面包含預測、醫療、疾病犯罪防治等。美國影集「紙牌屋」就是眾多使用大數據的成功案例之一,找來觀眾喜歡的大衛芬奇執導,以及凱文史貝西領銜主演,開播收視率果然亮眼。

一步錯步步錯 謝邦昌:專業知識很重要

大數據演算從數據庫(Databases)分類資料,至資料倉儲(Data warehouse)到相關任務資料(task-relevant data),經過資料探勘及評估模式(Pattern Evaluation),最後得出知識(Knowledge)。一連串過程會在各階段因為得出不合理的結果,而回到前幾個步驟。

台北醫學大學大數據研究中心主任謝邦昌指出:「蒐集資料、分析資料還有因果關係,大數據在這一方面的關鍵在於專業知識。」並舉例皮膚科醫師分析腦癌用藥,發現服用安眠藥的民眾,罹患腦癌的機率將近98%,後來神經科醫師發現有誤,應是罹患腦癌或腦病變的患者睡不好,故服用安眠藥。其中的因果弄錯,導致結果方向錯誤。但謝邦昌表示專業知識變成人工智慧,就是告訴電腦之間的關係,並在不斷嘗試錯誤的過程中,找到一個最適合的模式。

大數據進步快 法律跟緊腳步

大數據無孔不入,可以準確算出人們的消費行為,再延伸到精準行銷、醫療等等,但相對的「個人資料保護法」跟大數據間的界線,又該如何拿捏?謝邦昌提到上個月特斯拉(指配備自動駕駛系統的電動車)車禍:「結果還是駕駛的責任,但實際上是不是這個模型沒有判斷好?這是道德、倫理、法律在這方面還趕不上技術的進步,也是大數據跟人工智慧的盲點。」

他強調技術會隨時進步,我們要克服的是道德、倫理和法律。以手機遊戲Pokemon Go為例,此遊戲原意是希望玩家能走出戶外,卻因為過度抓寶,導致許多意外發生。這些都涉及到倫理道德和法律之間的衝突,未來看相關人士如何訂定相關措施來加以防範。

上圖為知識挖掘過程。 (圖片來源:http://hanj.cs.illinois.edu/bk3/bk3_slidesindex.htm)
上圖為知識挖掘過程。
圖片來源:Data Mining: Concepts and Techniques, 3rd ed.
製表/程沛茜。
製表/程沛茜。