2013年07月09日08:18 來源:人民網-人民日報
問題三:
大數據存多久?
維克托·邁爾·舍恩伯格:我們所處的時代之所以與眾不同,是因為數據的收集不再存在固有的局限性。技術已經發展到一定程度,大量信息可以被廉價地捕捉和記錄。數據收集往往是被動的,人們無須投入太多精力,甚至不需要認識這些數據。而且,由於存儲成本的大幅下降,保存數據比丟棄數據更加容易。這使得以較低成本獲得更多數據的可能性比以往任何時候都大。在過去50年中,數字存儲成本大約每兩年削減一半,而存儲密度則增加了5000萬倍。大部分數據的直接價值對收集者而言是顯而易見的。數據的基本用途為信息的收集和處理提供了依據。
隨著時間的推移,大多數數據都會失去一部分基本用途。在這種情況下,繼續依賴於舊的數據不僅不能增加價值,實際上還會破壞新數據的價值。然而,並非所有的數據都會貶值。有些公司提倡盡可能長時間地保存數據,即使監管部門或公眾要求它們短時間內刪除或隱匿這些信息。這就解釋了為什麼一直以來,谷歌都拒絕將互聯網協議地址從舊的搜索查詢中完全刪除。谷歌希望得到每年的同比數據,如假日購物搜索等。
黃智生:目前似乎沒有法規要求在一定的時限后銷毀數據。如銀行的個人財務信息等內容,反而要求一定期限內不准銷毀。而且現在存儲數據的成本很低,所以各公司都盡量將各自產生的數據儲存下來。雖然世界主要技術公司的總部大多在美國,但並非所有的數據都儲存在美國,世界各地都會有這些公司的服務器和存儲系統。不過這些技術公司的高級管理人員可以很容易地查閱到世界各地的數據。從這個方面來講,存放在哪裡並不重要,隻要網絡能連接就可以了。如美國政府搜集的所謂“事關國家安全”的信息,政府更不會將其銷毀,隻會越積越多。相對於較低的儲存成本,真正耗資的是篩選和運算成本。從山一樣的數據中挑選砂一樣的有用信息,實在很困難。
雖然目前WEB3.0系統已經能夠做到低智能、大數據量的篩選工作,但依然達不到實戰需要,代替不了人的作用。這如山一樣的數據,是政府的一種負擔,也是一個雞肋。但不能說這些數據就沒有用,比如警方確定了一個犯罪分子身份,就可以依法向網路服務商、手機服務商索取這個犯罪分子之前的所有信息,並通過這些積累的信息進行分析篩選。
法迪·謝哈德:互聯網名稱與數字地址分配機構(ICANN)成立之時完全由美國政府主導,招致許多非英語國家,特別是發展中國家人士的不滿。互聯網域名相當於網絡空間的門牌號,本來是一個全球性系統。ICANN在2009年與美國商務部簽署協議,此后不再對該部門負責,並使國際利益相關方在ICANN監管全球域名系統時擁有更多發言權。我們應該增加互聯網領域的透明度,而不讓某個國家或地區把互聯網控制起來,各國、各地區應該更加平等地分享網絡數據資源。
杜小勇:擁有數據的組織可以決定數據放在哪、如何存、存多久等。如果數據是企業的生命線,他自然會考慮安全、經濟、高效等多種因素。為了信息安全,企業一般會採取異地備份等成本更高的手段。據稱,“9·11”事件后,有些擁有更完善的數據備份體系的公司很快就恢復了業務,而另一些公司則由於數據損毀而走向破產。企業數據要存多久,也是一個需要權衡各種因素后的決策。這是企業自主的行為,除非建立在這些數據之上的業務還有其他法律上的要求。
我們可能關心的是另一個問題,即國家層面的信息安全。有人提出“信息疆域”的概念。也就是說,土地、海洋、空間都有國家的屬性(領地、領海、領空),數字空間中是否也有“主權”的概念?大型跨國公司,通過種種業務滲透到日常生活的方方面面,因此可以採集到一個國家方方面面的數據。於是,國外機構對一個國家情況的了解甚至有可能超過該國自身,這顯然會直接威脅到國家安全。
因此,國家對於跨國企業的數據傳輸、數據備份、數據使用等應有所限制,並進行監控,這十分必要。國家應該對此立法保障。有些數據有法律的保護,如測繪數據,其他更多種類的數據,目前還沒有類似的法律。
問題四:
大數據怎麼用?
維克托·邁爾·舍恩伯格:隨著世界開始邁向大數據時代,社會也將經歷類似的地殼運動。在改變我們生活和思維方式的同時,大數據早已在推動我們重新考慮最基本的准則,包括怎樣鼓勵其增長以及怎樣遏制其潛在威脅。然而,不同於印刷革命,我們沒有幾個世紀的時間去慢慢適應,我們也許隻有幾年時間。
在大數據時代,對原有規范的修修補補已經滿足不了需要,也不足以抑制大數據帶來的風險,我們需要全新的制度規范。我們需要設立一個不一樣的隱私保護模式,這個模式應該更著重於數據使用者為其行為承擔責任,而不是將重心放在收集數據之初取得個人認可上。
肯尼思·丘基爾:對大數據技術進行規范是問題的關鍵。首先,可以從強調監管大數據的收集,轉向重點監管大數據的實際使用。其次,可以讓大數據變得不那麼神秘,不再是個“黑箱”,增加大數據應用中的透明度和問責制。可創造一個被稱為“算法學家”的新職業,這些人接受計算機技術、統計學和數據處理方面的專門訓練,對大數據的應用進行評估,以確保公眾對大數據系統感到放心。
至於平衡隱私權和國家安全的問題,古希臘哲學家亞裡士多德早就提出這樣的問題:“我們如何監視守護者?”即使是在他那個年代,這個問題也沒有簡單的答案。
斯蒂夫·帕爾默:大數據給我們帶來的真正機遇是把許多信息碎片拼起來,為我們的決策服務。大數據時代最大的挑戰是如何從大數據中獲取“價值”。從大數據中獲取最大價值,需要探索式的研究方法。未來,數據科學家會很吃香,這種科學家既要熟悉商業環境,也要有操作層面的知識。
杜小勇:很多問題就出在數據使用上!數據作為資產,就涉及管理的問題,因此“數據治理”就顯得越發重要。信息世界同樣需要公約,將竊取他人數據視為犯罪,將攻擊他人系統視為犯罪,從刑法上加以明確規定,共同營造一個文明有序的數字生活,應該是我們的理想。大數據時代,我們需要盡快跟進這方面的工作,如開展國家間對話,形成公約。
企業利用數據挖掘技術,進行精准廣告投放,也涉及隱私問題。一個少女收到了嬰兒用品廣告,其父大怒,要告企業。事實卻是這位少女未婚先孕了。這個故事中,企業使用的是自己採集的客戶購物數據,使用的是自己開發的數據挖掘軟件,整個過程都沒有問題。但事實上卻侵犯了個人隱私,應堅決反對。這裡面應該有一些法律問題,需要認真研究。
朱揚勇:“大數據時代,數據作為資源,不被共享是趨勢。”這樣的話,數據運用一定需要價值交換。在確定數據權益的前提下,數據的運用就是有償使用。法律需要界定數據的權益,政府界定數據的類型(哪些是隱私,哪些涉及國家安全)等,這樣數據的流通就有法可依。
在現階段法律法規都還沒有明確之前,應從國家安全的角度高度關注數據資源的安全。而作為個人,要明白“有行動就可能產生數據”,所以當有些行為涉及隱私時,需要謹慎。
從更大的范圍來講,公共網絡中公開的數據應該屬於全人類,任何人都有權獲取、使用並獲益。這樣能夠更大程度地發揮數據資源的作用,讓數據給人類的生活生產帶來更多便利,對人類社會進步有重要的意義。
(記者吳成良、張杰、白陽、陳一鳴、崔寅採訪整理)
《 人民日報 》( 2013年07月09日 23 版)
上一頁 |
相關專題 |
· 熱點·視點·觀點 |
微信“掃一掃”添加“學習微平台”