林納斯曾經就開源問題與微軟公司的高層展開過激烈的辯論。微軟公司批評開源運動嚴重地破壞了知識產權、擾亂了軟件市場,林納斯則反擊微軟是一人獨大、金錢障目,他后來解釋他的初衷說:
“一個人做事情的動機,可以分為三類:一是求生,二是社會生活,三是娛樂。當我們的動機上升到一個更高的階段時,我們才會取得進步:不是僅僅為了求生,更是為了改變社會,更理想的是——為了興趣和快樂!
這段話,是開源領袖們的價值宣言,也深刻地解釋了開源運動為什么能夠成功的原因,因為其經典,被稱為“林納斯第二定律”。
在軟件開源的運動當中,還有一個人占有歷史性的地位,他就是世界聞名的計算機書籍出版商蒂姆·奧萊理(Tim
O'Reilly)。奧萊理也是開源運動的堅定支持者,他常常自己掏腰包,贊助開源社區的活動和會議。1999年,他的出版社奧萊理媒體(O'Reilly
Media),推出了全世界第一本開源文集:《開源革命之聲》07。此后,“開源”的概念才開始慢慢走出程序員的群體,成為一個廣為人知的概念。
伴隨著他們的搖旗吶喊,越來越多的開發人員和軟件公司開始加入開源運動的行列。進入21世紀以后,開源軟件已經深入人心,幾乎整個軟件業都認識到了開放源代碼的重要性及其好處,開源軟件的產品也數不勝數、衍伸到各個領域,最早與開源勢不兩立的微軟公司,也開始擁抱開源的做法。時至今日,要想在任何一個行業,找到一個沒有開源軟件的例子,已經相當困難。本書第四章曾經談到,軟件是由代碼和數據共同組成的,“開源”,指的只是開放代碼,并不包括數據。但當開放代碼已經成為共識和現實的時候,新一代的創新者,自然又將眼光投向了數據。
雖然同為軟件的一部分,但開放數據(Open
Data)和開放代碼卻大不相同。開放代碼面向的對象僅僅是程序員,也就是說,它停留在技術的層面;但數據的開放,其涉及面卻廣得多,它不僅和技術人員相關,還與數據的來源、性質以及過去和未來的使用人員都息息相關。
開放數據也不僅僅意味著公開數據。要讓數據可以重復使用、自由加工,數據公開的格式至關重要。還有,數據不像代碼,代碼無關個人,數據卻可能涉及個人的隱私。
所以,什么樣的數據可以開放、應該開放?又以什么形式開放?誰來開放?這些,都是要在開放之前必須回答的問題。
也因為這種種不同,數據開放面臨更大的挑戰和阻力,數據開放也沒有像代碼開放一樣在商業領域興起,數據開放的訴求,首先直指公共領域的公共數據,也就是美國聯邦政府收集、擁有的數據。
當然,站在這個潮頭浪尖的,還是一批年青的技術精英。他們相信,在互聯網時代,無論是代碼還是數據,只有開放,才能集聚群體的智慧、激發創新的力量、放射出更大的價值,真正推動社會的進步。
2004年,普林斯頓大學的本科生喬舒亞·陶伯拉(Joshua
Tauberer)建立了美國民間首個公共數據的開放網站:TrackGov.us。
TrackGov.us是一個關于國會立法法案的數據開放網站。前文談到過美國國會的立法步驟,美國是一個法律大國,在美國國會,任何時候都有一萬多個法案處于討論狀態,每一個法案,都涉及千千萬萬公司和個人的利益。這些法案由誰發起、哪些議員支持、哪些議員反對,投票的結果、修改的次數、通過的時間、法案的內容以及當前的狀態等等記錄,不僅可以在這個網站上查詢,還可以通過RSS郵件跟蹤,所有的數據記錄,都可以下載、重復使用。