IBM稱,全球所有計算機每天產生250億億個字節的數據。這相當于每人每天產生大約半張CD的數據量。無數激動人心的會議展示和咨詢報告都以“大數據”為主題。那么,它對經濟學可能有何幫助?
每個人所說的“大數據”含義不盡相同,但以下為一些共識。第一,如果不依賴某些可視化軟件的幫助,人類不可能理解如此大的數據量。用散點圖尋找規律或異常情況的傳統辦法,在這里毫無作用。第二,數據從產生到被利用往往只有很短的時間,至少對一些人如此。你的手機運營商能夠實時獲悉你手機所在位置。第三,數據可能高度互相關聯。理論上,谷歌(Google)可掌握你的電子郵箱和安卓(Android)手機位置信息,知道你在Google Plus社交網絡上有哪些好友,并了解你的搜索記錄。第四,數據是雜亂無章的:你儲存在手機上的視頻屬于“大數據”,但它與整齊有序的分類數據庫(按照生日、就業狀況、性別、收入等分類)還相去甚遠。
這可能給經濟學家帶來問題。經濟學家已經被慣壞了:20世紀30和40年代,西蒙?庫茲涅茨(Simon Kuznets)和理查德?斯通(Richard Stone)建立了清晰有序、邏輯連貫的國民賬戶系統。幾十億項個人交易一下子被概括為“英國2012年GDP”;幾十億次價格變動體現為通脹指數這么一項指標。數據整齊地排列成矩形,例如,橫排為若干個國家,豎排為年份,每個方格內的數據對應某個國家在某個年份的通脹率。