《大西洋月刊》特寫:谷歌如何「洗劫」圖書館?

2021-02-08 後現代郵報

《大西洋月刊》2017年4月20日


Torching the Modern-Day Library of Alexandria

「Somewhere at Google there is a database containing 25 million books and nobody is allowed to read them.」


作者︱James Somers

編譯︱上海書評 李靜雲(註:其標題《谷歌的圖書掃描計劃為何失敗?》不夠準確,谷歌圖書贏了官司,但暫停掃描更多圖書。)


你離讀到迄今為止出版過的所有書的電子版只有一步之遙。如果你想讀的是那些還沒出版的書,可能還是需要付一些錢,但是其他所有已經出版的書,都可能可以在每個地方圖書館裡的閱讀終端上免費閱讀。這個電子書庫的館藏會比美國國會圖書館、哈佛大學、密西根大學和歐洲任何一個國家的國家圖書館的館藏都要大。


在每個圖書館都即將會擁有的閱讀終端上,你能搜索千萬本的圖書,並且閱讀你能找到的圖書的每一頁。你可以高亮段落,做注釋和分享。人們還能第一次自由地在所有已經印刷出來的圖書中定位一個觀點之後直接把連結發給別人。很快圖書也能像網頁一樣可以在眨眼之間獲取、搜索和複製粘貼。


這曾是一個即將實現的夙願。牛津大學博德利圖書館的館長理察·歐文頓說,「千年以來一直有人在夢想一個世界級的圖書館,文藝復興的時候,就有人在幻想我們可以把當時世界上所有已經印刷在紙上的知識全部儲藏在一個房間或者一家機構裡。」在2011年春天的時候,我們已經做到把世界上所有的書籍都儲藏在一個能夠放在桌面上的小小終端裡。


當時有一位熱切關注此事的人這麼寫道:「這是一個裡程碑式的事件,它可以推動教育、研究和人們的智性生活的革新。」


但是,在那一年的3月22日,美國紐約南區地方法院依據聯邦民事訴訟規則的第23(e)(2)條款否定了這一項準備向世人開放這一個世紀以來出版的所有圖書,並且在所有圖書館安裝圖書閱讀終端的計劃。


當亞歷山大圖書館慘遭火災的時候,人們說這是「全世界的災難」。而那一年,當我們這個時代最重要的人文計劃被法院否決的時候,那些幫助阻止這一計劃的學者、檔案學家和圖書館員都鬆了一口氣,他們覺得恰恰是阻止了一個災難的發生。


谷歌決定掃描世界上所有圖書的秘密計劃開始於2002年,該項目的名字叫做「海洋計劃」(Project Ocean)。當時拉裡·佩吉和瑪麗莎·梅爾正坐在辦公室,手邊放著一本三百頁的書和一個節拍器。佩吉想知道如果要掃描一億本書需要花多長時間,所以他就從他手邊的這本開始試起。他和梅爾兩個人用計時器來保證速度,然後花了40分鐘時間把這本書從頭到尾一頁一頁地翻了一遍。


佩吉一直想實現圖書的數位化。早在1996年,當Google還只是一個學生項目,主要用來通過爬蟲分析文件並且根據用戶的請求進行相關度排名的時候,當時Google背後的設想就是要「發展技術,建立一個統一的世界數字圖書館。」當時的想法是,在未來圖書都實現電子化的時候,人們就能夠勾勒出每一本書的引用網絡,看看哪本書被引用的頻率最高,然後利用這些數據給圖書館的使用者提供更好的搜索結果。但是紙仍然是大多數書籍的載體。佩吉和他的研究夥伴謝爾蓋·布林一起利用全球資訊網中的網頁進行試驗,繼續充實他們根據引用量來判斷受歡迎程度的點子。


到2002年的時候,佩吉覺得重新關注書籍的時機已經成熟。在他頭腦中有了「40分鐘」這個大致概念的時候,他回到了他的母校,在圖書掃描領域領先世界的密西根大學,想看看批量數位化技術發展到了什麼程度。密西根大學告訴佩吉,按照當時的速度,如果想把密西根大學700萬冊的館藏全部數位化,需要大概一千年。如果是現在的佩吉,可能還會稍微遲疑一下,但是當時的佩吉回答說,谷歌只需要六年左右。

密西根大學圖書館


他給密西根大學圖書館提議:圖書館將所有的書借給谷歌,谷歌來替對方完成全部的掃描。最後你能得到你的全部館藏的電子版,而谷歌將獲得海量的還不曾被人問津的數據資源。布林如此描述谷歌對圖書館藏的渴望,「人類的知識有幾千年的歷史,而書籍中承載的可能是其中質量最高的部分。」試想如果所有被塵封在紙頁間的知識能夠進入搜尋引擎?


早在2004年之前,谷歌就開始了掃描工作。之後,谷歌和密西根大學、哈佛、斯坦福、牛津、紐約公共圖書館和許多其他圖書館系統都訂立了合約,並且以超過佩吉預言的速度,在十年多一點的時間裡掃描了大約2500萬冊圖書。圖書掃描工作花掉了谷歌大約4億美元。這項工作不僅僅依靠技術,還依靠強大的物流支持。


從周一到周五,裝滿圖書的半掛卡車都會停在谷歌掃描中心的門口。負責掃描斯坦福圖書館藏書的中心是一個改造的辦公大樓,位於谷歌的山景園區。圖書從卡車上卸下來之後會放在圖書館裡常見的那種小推車裡,然後被推給人工操作員。掃描中心大約有幾十臺掃描儀,一行一行地整齊排列,臺與臺之間間隔2米左右,操作員就坐在明亮的掃描儀前工作。


這些掃描儀是谷歌定製的,它們與其說是掃描,還不如說是給書拍照。每臺儀器一小時可以數位化1000頁左右的圖書。待掃描的書會被放在一個特別設計的自動支架上,支架可以適應不同的書脊,並且將圖書固定。儀器上方有一排燈,還有價值至少1000美元的光學器材,包括四個攝像頭,兩個分別照著攤開的書的左右兩半,還有一個負責確定掃描範圍的光學雷達,它會在圖書表面生成一層雷射網格,從而捕捉到紙頁的曲度。操作員負責手動翻頁,因為也沒有機器能比得上人手的快捷和輕柔了,然後腳踩踏板來觸發相機進行拍照,一系列動作仿佛是在彈一架奇怪的鋼琴。

可以自動翻頁的圖書掃描儀


這個掃描系統很高效的原因是軟體完成了大部分工作。在傳統的圖書掃描系統裡,在每次拍照之前確保每一頁都是放正、鋪展的是拖慢掃描進度的主要原因,而在谷歌的掃描系統中,每頁歪歪扭扭的圖書的照片會經過一個「去皺算法」的處理,該算法利用光學雷達的數據,最終使得書中每行文字回到正常的、看起來橫平豎直的高度。


該項目的巔峰時期曾僱傭了大約50個全職工程師。他們負責研發能把圖像轉化為文字的光學識別軟體,寫去皺、顏色校正和對比度調節的算法,以便更好地處理圖像,他們還研發了識別書中插圖和圖表的算法、提取頁碼的算法、把腳註轉換為引用的算法、甚至還有按照布林和佩吉早期研究的思路,把圖書按照相關度排序的算法。丹·克蘭西曾在該項目鼎盛時期擔任工程主管,他說,「書與書之間還沒有形成網絡。一個巨大的研究挑戰就是理解書與書之間的關係。」


在當時谷歌公司的其他部門都痴迷於讓各種app更社交化,比如在2011年發布的Google Plus,而負責圖書項目的人則將書籍掃描看作是像谷歌的搜索服務一樣老派傳統的東西,它們都呼應了谷歌公司的使命:「讓全世界的信息有序,並且跨越國界地流通和發揮作用。」


圖書掃描項目是有史以來第一個被谷歌稱作「探月」(moonshot)的項目。在谷歌開發無人汽車和通過高海拔氣球向非洲輸送網際網路的「瘋狂氣球計劃」之前,這個數位化圖書的計劃被外界認為是一個白日夢。甚至有些谷歌的員工也認為這個項目純粹是在浪費時間和金錢。克蘭西告訴我,「當時在我們做這個谷歌圖書搜索項目的時候,谷歌內部肯定有不少人想:『為什麼我們要在這個項目上投入這麼多錢?』一旦谷歌開始稍微精打細算起來,就會有人質疑,『等等,你每年有4000萬美元可以花,然後你居然砸了5000萬美元在圖書掃描上?然後這個項目總共要花掉我們3到4億美元?你在想什麼呢?』不過拉裡和謝爾蓋一直忠實地支持這個項目。」


在2010年8月,谷歌在博客上發了一條消息,說全世界總共有129864880冊圖書,而谷歌要把它們全部掃描完。


當然啦,事情後來的發展並不完全像他們說的那樣,這個探月項目大概比原計劃少掃描了1億本書。計劃失敗的整個經過很複雜,但是起因卻很簡單:谷歌做的這件事被認為是錯的,而沒有人願意寬恕。在得知谷歌從圖書館中拿走了百萬冊的圖書,一本一本地掃描完畢,還像沒事人一樣地把書還了回去之後,各路作家和出版商開始起訴谷歌,正如他們在一開始的抗議中寫道的,指控谷歌「大規模侵犯智慧財產權」。


谷歌掃描圖書的初衷不是為了建一個數字圖書館,讓大家能夠完整地閱讀電子書,這個點子是後來才有的。他們一開始的目標只是為了讓用戶能檢索圖書,對於那些有版權的書,谷歌只能顯示圖書的片段,搜索結果中只能顯示你搜索到的條目前後的幾句話。因此谷歌把他們的圖書搜索服務比喻成一個卡片式的索引目錄。


谷歌還以為建立一個卡片式的索引目錄是屬於「合理使用」的範疇,就像版權法允許學者可以引用別人的作品一樣。谷歌公司的律師大衛·杜蒙德說,「合理使用和不合理使用的區別在於是否有對原文的改變。沒錯,我們在數位化圖書的過程中是製作了一個副本,但是很顯然,讓用戶能夠在書中找到某個術語不等於讓用戶讀了這本書。這也是為什麼谷歌圖書提供的服務和圖書本身不一樣。」


杜蒙德必須得是對的,因為依照法律,故意侵犯支持產權的賠償金額是15萬美元/每本書。如果谷歌真的侵犯了千萬冊圖書的智慧財產權,那麼它需要賠償的數額將以萬億計。美國加州大學伯克利分校的法學教授帕梅拉·塞繆爾遜在2011年寫道:「谷歌的確有理由害怕他們是在孤注一擲地賭自己的行為是對智慧財產權的『合理使用』。」知識版權的擁有者們反撲了回去。


他們反撲的理由很充分。因為谷歌在沒有任何許可的情況下就洗劫了圖書館。這顯然是錯誤的。如果你想要複印一本書,首先你要有複印的權利(the right to copy it)——也就是作者和出版商老爺們才有的「版權」(the damn copyright)。如果放任谷歌成批成批地複印美國所有的圖書,對版權擁有者們無疑遺患無窮,這種行為說不定會導致他們失去「智慧財產權」本應給他們帶來的利益。「美國作家協會」和幾位作家代表全美所有的圖書版權受益者對谷歌提起了集體訴訟(有一些出版商已經單獨起訴了谷歌,但是之後很快就加入了美國作協的集體訴訟)。

2003年,美國國會圖書館的管理員(左);2013年, 北卡羅來納州立大學的圖書自助檢索系統


科技公司蔑視智慧財產權已經有很長的歷史了,因為它們發明了新的分發內容的方式。在20世紀初期,製造了自動鋼琴上的打洞紙卷(piano rolls)的人無視了樂譜的智慧財產權,後來遭到了音樂出版商的起訴。同樣的事也發生在了唱片製造商和早期的商業收音機供應商的身上。在上世紀60年代,有線電視在沒有授權的情況下轉播了無線電視的信號,隨即面臨著高額的訴訟。電影製作公司起訴錄像機製造商,音樂公司起訴了在線音樂共享服務KazaA和Napster。


……「歷史表明,時間和市場經濟總是能保證利益博弈的平衡。」


但是儘管每一方都獲得了好處,每次博弈版權方都會害怕他們會被新技術取代。當錄像帶出現的時候,電影製作人強烈抗議。大的電影製作公司起訴了索尼,認為它們的錄像帶生意完全是對智慧財產權的剽竊。但是美國索尼公司對環球影業製片廠的案子之所以為人所知,是因為它判定只要複製技術依然有從事「非侵權」活動的可能性,比如人們可以用在家裡看電影,所以錄像機的製造者並不承擔侵犯智慧財產權的責任。


所有起訴谷歌的作家和出版商只花了幾年時間就意識到,事實上還是存在一個讓各方都滿意的解決方案的,尤其是當你開始把注意力轉向一些已經絕版而不是還在銷售的圖書的時候。如果你發現了這個區別,你就會以不同的眼光來看待谷歌的整個項目。或許谷歌並沒有掠奪任何人的勞動成果,他們只是使舊書重獲新生。谷歌圖書之於絕版書籍就像錄影機之於已經下線的電影。


如果真是這樣,人們反而不想去阻止谷歌掃描絕版書籍了,而甚至想鼓勵這種行為。事實上,人們可能會希望不僅僅是只能搜索到圖書的片段,而是希望谷歌能夠出售這些絕版圖書的電子版。因為從本質上來說絕版圖書已經在商業上無利可圖,如果谷歌能通過大批量數位化為它們找到一個新的市場,這對於作者和出版商來說可能還是一種勝利。時任美國出版商協會主席的理察·薩諾夫在當時說道:「我們意識到現在有一個機會,可以對美國的讀者和學者做一件很有意義的事。我們意識到我們可以重新發現和消費圖書行業裡已經絕版的圖書。」


然而一旦你有了這個想法,谷歌到底能不能進行圖書掃描並且在搜索結果中展示章節片段的起訴似乎已經不重要了。如果作家協會一方贏了,他們除了法定的損失費之外並不能得到別的補償,而且阻止谷歌向用戶提供一些舊書的章節對他們又有什麼好處呢?說不定那些章節片段還會促使用戶去買書。如果谷歌贏了:作家和出版商什麼也得不到,所有的讀者則能得到絕版圖書的片段,但他們得不到全文。


原告已經使自己陷入了一個特殊的境地。他們既不想輸掉起訴,但也沒有贏的動力。


……


這個被稱為《谷歌圖書搜索修正協議》(Google Books Search Amended Settlement Agreement)的文件有十幾條附錄,共計165頁。確定各項細節前前後後花了兩年半時間。薩諾夫將談判過程比作一個在作者、出版商、圖書館和谷歌公司之間進行的「四維象棋」。「每個談判參與者,真的是每個人,當時都覺得如果我們真的把這事兒談成了,那就是每個人在自己的事業裡最大的成就。」最終,協議要求谷歌支付1億2500萬美元,其中包括一次性支付給它已經掃描過的圖書的版權方的4500萬美元(大約按每本書60美元計算),分別向出版商和作者支付的1550萬美元和3000萬美元訴訟費,以及用來創立圖書版權登記處的3450萬美元。


這項協議中也規定了到底應該如何展示和出售這些重獲新生的絕版圖書。按照協議,谷歌可以展示該書至多20%的部分來誘使用戶購買,谷歌可以出售可下載的電子版,價格則由算法或者版權所有者來確定,由1.99美元到29.99美元不等。所有絕版書都會被打包存進一個「機構訂閱資料庫」,大學可以買下這個資料庫,供全校師生免費搜索和閱讀裡面的全部書籍。協議的§4.8(a)項條款還用法律語言乾巴巴地宣布一項無與倫比的公共事業即將開始:美國所有的地方圖書館都會建造閱讀終端,向公眾開放該資料庫的資源。


年復一年的起訴和談判終於敲定了所有的細節。但是到了2011年的時候,終於出爐了一項看起來是共贏的計劃,正如伯克利的法學教授塞繆爾遜在當時說的,「這個解決方案像是一個三贏——圖書館可以得到成千上萬的圖書,谷歌在圖書搜索服務上的投資沒有白費,作者和出版商能夠從已經毫無商業價值的書中獲得一筆新的收入來源。法律沒有必要否定這樣一個圓滿的結果。」


因此,她寫道:「這可能是有史以來最有冒險精神的一個集體訴訟案。」但是按照她的思路,這也是為什麼這個方案最終會失敗。


《谷歌圖書搜索修正協議》的公布在當時上了頭條新聞。它真的是一件大事,大到足以撼動整個圖書出版行業。作家、出版商、谷歌的競爭對手、法律學者、圖書館員、美國政府還有感興趣的公眾都在熱切關注案件的每一部進展。當首席法官丹尼·秦向公眾徵集對此解決方案的意見時,回復如雪片般飛來。


參與這項協議的人們預感到可能會有一些反對意見,但沒想到迎接他們的是,用薩諾夫的話來說,「極端的反對和恐慌」,聲稱這項協議會產生無可估量的負面影響。反對意見各不相同,但是它們都仿佛感覺到這項協議會讓且僅讓谷歌獲得極大的權力。時任哈佛圖書館館長的羅伯特·達恩頓說:「難道我們想把最偉大的圖書館交給一個想向我們收多少錢就收多少錢的大公司嗎?」


其實達恩頓一開始是支持谷歌的圖書掃描計劃的,但是這個解決協議讓他開始焦慮了。他和很多其他人一樣都在擔心,發生在學術期刊市場上的事會在谷歌圖書的資料庫上重演。在一開始價格可能是合理的,然而一旦圖書館和學校對訂購谷歌的資料庫產生了依賴,訂購價格就會開始像高利貸一樣暴漲,最終漲得和各種學術期刊一樣高。拿2011年為例,訂閱《比較神經學刊》的年費高達25910美元。


儘管學者和圖書館愛好者對於開放所有絕版圖書的前景非常嚮往,他們卻將那份解決協議看作是與魔鬼的契約。沒錯,最終建成的的確是一個有史以來最大的圖書館,但很有可能同時也是一個被巨型壟斷公司控制的有史以來最大的圖書超市。這並不是最好的解決絕版圖書問題的辦法。伯克利的法學教授帕梅拉·塞繆爾遜寫道:「沒錯,這項協議的大部分看起來都會造福公眾,但它卻將這項交易的全部好處都劃給了谷歌。」


谷歌的競爭對手也覺得受到了這份協議的威脅。微軟就不出所料地聲稱,如果谷歌是唯一一個可以合法地檢索絕版圖書的搜尋引擎,這無疑會強化谷歌在全世界作為搜尋引擎霸主的地位。如果谷歌利用這些絕版圖書來滿足用戶的長尾需求,這將是一個對於其他公司來說很不公平的競爭優勢。谷歌的回覆很簡單:你有本事你也可以去掃描圖書然後在搜索結果中顯示,所以谷歌這樣做沒什麼不公平的。


針對谷歌擁有海量藏書這件事,克蘭西說:「確實有這樣一個假說,就是谷歌會擁有巨大的競爭優勢。」但是他說這項數據從來不在谷歌公司的任何一項計劃中佔據核心位置,因為這些書的數據量跟網際網路上現有的數據總量比起來真的是滄海一粟。他說:「你根本不需要在一本書中查伍德羅·威爾遜是什麼時候出生的。」圖書的數據是有用的,對研究者也很有吸引力,但是「反對者誇大了這些圖書數據對於谷歌整個項目的戰略性作用,這是沒有道理的」。


亞馬遜則擔心這項協議會讓谷歌建立一個無可匹敵的圖書商店。任何想要出售絕版圖書的人,都必須要一本一本地確認圖書版權,這是最好的,但是集體訴訟的協議卻讓谷歌一次性獲得了所有圖書的授權。


這項反對吸引了司法部,尤其是反壟斷部門的注意,他們開始介入此項協議的調查。在一項遞交給法院的聲明中,司法部認為該協議實際上是給了谷歌對絕版圖書的壟斷權。因為如果谷歌的競爭者也想像谷歌一樣得到這些書的掃描和展示權,他們就得經歷同樣詭異的步驟:批量掃描,遭到起訴,像谷歌一樣協商解決。司法部寫道:「哪怕我們認為歷史有那麼一點點可能會重演,我們也不應該鼓勵這種先故意侵犯版權,然後再通過訴訟解決的做法。」


對谷歌最好的辯護論點就是反壟斷法是用來保護消費者的。正如谷歌的一位律師所說:「從消費者的角度來說,能夠得到一件商品無論如何是比根本無法得到要好的。」絕版圖書完全是無法從網上獲得的,現在谷歌給消費者提供了一條路。這怎麼會傷害消費者呢?一位深度參與協議協商的人告訴我:「每個出版商都去和反壟斷部門說,你看亞馬遜可是佔了電子書市場的80%呢,谷歌佔的比重大概是0%到1%。所以這其實是允許一個公司在電子書市場和亞馬遜競爭呀。所以你們應該把谷歌的這件事看做是一件支持自由市場競爭、而不是壟斷的事。我也覺得他們說的很有道理,但是他們對反壟斷部就像對牛彈琴,最後的回應是非常令人遺憾的。」


司法部沒有讓步。從某種程度來說,協議的各方沒有什麼好的解決辦法:不管他們多想讓這個協議看起來不是排他的,但因為谷歌是此案唯一一個被告,所以事實上只有谷歌一人得利。但是如果要讓這個叫做「作家協會訴谷歌」的案子把除了谷歌之外的所有想販賣電子書的公司都包括進來,就會超過這一集體訴訟案的承載能力。


……法官丹尼·秦最終依據集體訴訟法規裁定《修正協議》「不公平、不充分、無據可依」,並引用了司法部的反對理由,建議將協議修改為一項自願加入的協議(雖然這樣會讓這項協議籤了也等於白籤),或者就是直接去說服國會。「儘管圖書的電子化和建立一個無國界的圖書館可以讓很多人收益,但是這個《修正協議》太過了。」


在討論《修正協議》的公平聽證會的尾聲,秦法官仿佛是單純出於好奇地問了一句,現在有多少個反對意見?又有多少人選擇退出這個集體訴訟中的集體?結果分別是500多個和6800多人。

FBI Warning:侵權會有嚴重的法律後果


諷刺之處在於許多反對這項協議的人從心底裡是信任谷歌的這項計劃的。帕梅拉·塞繆爾遜反對的主要原因是谷歌會「出售」她的書和別人的同類作品,而她覺得這些書應該向公眾免費開放。我們今天再回頭審視這件事的時候,我們會發現它的邏輯很弔詭:如果找不到一個完美的解決方案的話,不如放棄解決這個問題。哪怕最後谷歌標價出售那些孤兒作品,但是讓所有的書都能被公眾以某種方式獲得總比讓公眾什麼都看不到好吧。


很多反對者相信此事會有一個比集體訴訟協議更好的解決方案。在公平聽證會上反覆出現的一句話是說國會應該有授權數位化絕版作品的權利。當這項協議被否決的時候,他們指出,美國版權辦公室建議通過立法來規範類似行為的提案還有北歐國家在開放絕版圖書方面的努力實際上都印證了國會應該負責授權的觀點是對的,國會能夠做到這項協議做不到的地方。


當然了,在差不多十年之後,國會並沒有採取行動……


沒有誰願意在改變圖書的授權規則上花費政治資本,尤其是在今天,更何況是那些已經過時的書。克蘭西說:「對國會來說,改變版權法並不重要,這件事既不會讓誰贏得選舉,也不能創造大量就業崗位。」所以也無怪關於谷歌的集體訴訟案可能會是推動此方面改革的唯一契機:因為谷歌是唯一有動力的一方,而且也有財力讓它實現。出版商的內部法律顧問阿蘭·阿德勒說:「這件事說白了,就是一個私人公司要替一個人人都想要的東西買單,就是這麼簡單。」谷歌向這個項目傾注巨資,不單純只是想掃描,也是希望挖掘和數位化舊的智慧財產權資源,希望能和作者與出版商談判,希望能出錢建立一個圖書版權登記處。多年之後,版權辦公室除了提出了一個不僅毫無新意還需要國會撥款的提案之外沒有任何進展。


在谷歌圖書訴訟案期間時任哈佛圖書館館長的羅伯特·達恩頓,他當時反對《修正協議》,當被問是否後悔最後的結果,「如果說我後悔的話,一切其他試圖繞過谷歌的方法其實也都深受版權法的限制。」達恩頓在開展另一項圖書館圖書掃描項目,但是他只能夠掃描那些版權已經進入公有領域的書。「別會錯我的意思,我很支持版權,但是說實話,要等一百多年才能等到圖書進入公有領域,而且美國大多數的圖書館也都被攔在了版權的門檻之外,我覺得不可思議。」


在《修正協議》失敗之後,谷歌也「逐漸洩氣」。儘管谷歌贏了作協訴谷歌一案,法庭也宣布穀歌可以展示圖書的章節片段,公司也幾乎停止了它的圖書掃描項目。


一想到谷歌公司的某處有一個包含有2500萬本書但是卻沒有人有權利閱讀的資料庫,這個事實就讓人覺得無法理解。這就好像是《奪寶奇兵》第一部的結尾那裡,他們把珍貴的法櫃放到了架子上的某個地方,然後就湮沒在了一個巨大、混亂的倉庫裡。但它就在那裡。那些書就在那裡。多少年來,人們都夢想著建造一個這樣的圖書館,一旦成功,他們說這將會是有史以來最大的人文主義成就。現在我們付出了努力將它變成了現實,距離將它獻給全世界只有一步之遙——但是現在,它僅僅是硬碟上一個50或者60PB大小的文件,除了幾個負責把它們鎖起來的工程師之外沒有人能看到。


如果想把那些書全部開放給公眾需要做些什麼?開放這些資源有多困難,到底是什麼攔在了我們和一個藏有2500萬本書的數字圖書館之間?


一個曾任該工程工程師職位的人說,你會惹上很多麻煩的,但是從技術上來說只需要寫一個簡單的資料庫查詢。你需要把某些off按鈕點成on,當然等這個指令執行完畢可能還要幾分鐘。

相關焦點

  • 【每日外刊分享】1001更新大西洋月刊、國家地理月刊、CNN互動英語
    洛杉機時報、今日美國、每日電訊請回復0929免費獲取資源哦0930更新紐約時報、英國衛報、金融時報、華盛頓郵報、泰晤士報、華爾街日報、波士頓全球、洛杉磯時報、今日美國等請回復0930免費獲取資源哦1001更新大西洋月刊
  • 大西洋月刊精讀|Grandparents Could Ease the Burden of Homeschooling[5]完結
    大西洋月刊精讀|Grandparents Could Ease the Burden of Homeschooling[1]大西洋月刊精讀|Grandparents Could Ease the Burden of Homeschooling[2]大西洋月刊精讀|Grandparents Could Ease the Burden of Homeschooling
  • 大西洋月刊:美國共和黨拋棄了民主
    本文譯自《大西洋月刊》,作者David A. Graham, 譯者遠奇。原標題:《大西洋月刊:美國共和黨拋棄了民主》閱讀原文
  • 《大西洋月刊》深度:貝索斯足以載入美國商業奠基人史冊
    1 《大西洋月刊》認為,這位亞馬遜創始人兼執行長所建立的帝國涉及範圍比美國商界史上的諸多前輩更為廣泛,這在美國資本主義的漫長歷史上也是史無前例的。
  • 大西洋月刊:美國醫療系統已近崩潰
    美國大西洋月刊的報導指出,美國醫院的承受力已達到臨界點。自疫情以來,美國的公共衛生專家就曾提出過警告,新冠病人的數量有可能會超過各州立和市裡醫院所能承受的範圍。真要發生了,那無異於噩夢降臨。面對洶湧而來的重症患者,醫生和護士只好在走廊裡加設床位,醫護能分配在每位病人的時間更少,準許住院的條件也愈加嚴格。
  • 深度長文:谷歌巨資建造的大型數字圖書館,為什麼只能封存吃灰?
    編者按:這可能是谷歌成立以來最讓人無奈的項目了,前後耗時8年,花費了4億美元,將2500萬本書數位化,最後只能被封存起來。這背後到底有什麼故事?《大西洋月刊》發表了文章詳細地介紹了該項目的前因後果,以及其面臨的重重阻力。文章由36氪編譯。一、只需要點擊一下,你就能獲得幾乎每一本已出版的書的全文。除了正在印刷的書你必須付費購買。
  • 大西洋月刊:美國的噩夢不是迫在眉睫,而是已經降臨
    轉載請徵求許可,規範署名(公號名/ID/作者), 違者必究 編輯:SUN 來源:大西洋月刊 編譯:遠奇
  • 財會月刊 徵稿
    《財會月刊》文章被轉載篇數在全國會計類期刊中連年名列前茅。根據中南財經政法大學圖書館提供「檢索報告」統計,近十二年來,《財會月刊》發表文章被中國人民大學報刊複印資料等文摘報刊轉載篇數:2006年85篇、2007年82篇、2008年84篇、2009年78篇、2010年95篇、2011年98篇、2012年85篇、2013年108篇、2014年92篇、2015年109篇、2016年96篇、2017年109篇,在全國財政、稅務、會計、審計、金融等財經類刊物中排名
  • 【大西洋月刊】「在嗎?」 「不在!」
    譯者:朱星漢校對:朱小釗導讀筆記:泮海倫策劃:泮海倫&王瑞How It Became Normal to Ignore Texts and Emails無視簡訊和郵件是如何成為常態的你可能知道從常理上來說,不回信息/郵件確有無數種正當理由:忙、沒看到、在思考如何措辭,但現在幾乎所有人都圍著手機轉,這些理由未必總是站得住腳。皮尤研究中心的報告指出,90% 的手機用戶差不多走到哪都帶會著自己的手機,76%的人稱自己很少或從來不關閉手機。
  • 大西洋月刊 I 川普讓共和黨失去了一切
    川普離任之際,《大西洋月刊》刊發評論,標題為《川普讓共和黨失去了一切》,指出「四年來,川普帶領共和黨從統一控制華盛頓變成了一片荒野」。這篇評論從林賽·格雷厄姆四年前的一條推文(上圖)講起。這條推文,近日來重新被挖出來,在美國的社交媒體上重新病毒式傳播。
  • 美夫婦用谷歌搜索高壓鍋及背包遭反恐部隊搜查
    資料圖:波士頓爆炸案後美國警察轉移居民米歇爾•卡塔拉諾的Twitter帳戶【環球網報導 記者 烏元春】美國媒體日前報導,紐約薩克福馬縣一對夫妻因為妻子用谷歌搜索了「高壓鍋」,而丈夫在同一時段用谷歌搜索了「背包」,7月31日竟遭遇一個由六人組成的聯合反恐部隊上門「查水錶」,對方盤問這對夫妻「你們有炸彈嗎?
  • 《閱讀的未來》:谷歌圖書館計劃或將損害公眾利益
    我過去曾經在這裡面給大家介紹過兩三本他的書了,他曾經是美國普林斯頓大學的歷史學教授,後來則做了哈佛大學的圖書館館長,是個很重要的圖書館界以及歷史學界的一個重頭。他這本書的中文版背後就有一段我的推薦語,那麼這個推薦語首先他寫我的職銜叫學者,我老跟大家說千萬別叫我學者,我不是什麼學者,我只是個乾電視的人,另外一方面他有一段我講的話,我想想看,這段話的確是我說的,但是出版社好像也沒找過我要我推薦這本書,反正無論如何,他們就拿了我一段話來推薦這本書,好在這本書真的值得給大家推薦,因為這本書當初英文版一出來我馬上就買,馬上就看,應該這麼講,Robert  Darnton
  • 臺圖書館被谷歌地圖「正名」,綠媒又心塞了
    【環球網綜合報導】臺灣所謂的「國立臺灣圖書館」(下稱「國臺圖」)近日在網上被「正名」,其名稱在「谷歌地圖」上被改為「中國臺北圖書館」。谷歌地圖出現「中國臺北圖書館」(谷歌地圖截圖)島內民眾日前發現這一情況後,又有一些臺媒跳腳。例如親綠媒體《自由時報》12月12日稱這是「惡搞」,還援引所謂「獨派」議員稱大陸「咄咄逼人」。
  • 大西洋月刊:現在的火雞是1960年時的兩倍大
    原文地址:大西洋月刊原創翻譯:龍騰網  翻譯:飛雪似煬花
  • 谷歌的圖書掃描計劃為何失敗
    密西根大學圖書館他給密西根大學圖書館提議:圖書館將所有的書借給谷歌,谷歌來替對方完成全部的掃描。之後,谷歌和密西根大學、哈佛、斯坦福、牛津、紐約公共圖書館和許多其他圖書館系統都訂立了合約,並且以超過佩吉預言的速度,在十年多一點的時間裡掃描了大約2500萬冊圖書。圖書掃描工作花掉了谷歌大約4億美元。這項工作不僅僅依靠技術,還依靠強大的物流支持。從周一到周五,裝滿圖書的半掛卡車都會停在谷歌掃描中心的門口。
  • 臺圖書館被谷歌標「中國臺灣」 網友:世界只認一中
    谷歌地圖截圖海外網12月12日電最近有島內網友發現,谷歌地圖將「『國立』臺灣圖書館」的地標更名為「中國臺北圖書館」。這一消息,讓島內綠媒氣得「直跳腳」。據臺灣「中央社」報導,有島內網友在其社交媒體曝出,臺灣新北市一圖書館近日在谷歌地圖上被更名為「中國臺北圖書館」。報導還指出,在此之前,臺北大學臺北校區也曾在谷歌地圖上被改為「中國臺灣臺北大學臺北校區」,不過該校區隨後又換回原來的名稱。這一改,就把島內親綠媒體改急眼了。
  • 《大西洋月刊》:美國人也愛「海淘」電商 從中國直購低端商品
    本文來自《大西洋月刊》,作者ALANA SEMUELS,原文標題The Problem With Buying Cheap Stuff Online。Echaverria是一名退休的護士,她可不會花那麼多錢去買運動鞋,所以她在谷歌上搜索鞋子,看看是否能找到更便宜的。沒想到瞎貓撞上了死耗子,她如願以償地發現在Wish上,一款類似於Yeezy運動鞋的運動鞋售價僅為16美元。「我覺得這太好了,簡直不像是真的,」她告訴我。幾個星期後,鞋子送到了,她的孫子愛不釋手。但Echaverria把鞋子尺碼搞錯了,孫子穿不上,所以現在由她穿了。
  • 大西洋月刊:如果川普一直拒絕承認敗選,將發生什麼?
    ▲ 本文發表在2020年11月的《大西洋月刊》印刷版。 作者: 巴頓·格爾曼(Barton Gellman),《大西洋月刊》的特約撰稿人,著有《黑鏡:愛德華·斯諾登與美利堅監視國》(Dark Mirror:Edward Snowden and The American Surveillance State)和《垂釣者:副總統切尼》(
  • 大西洋月刊精讀|​Grandparents Could Ease the Burden of Homeschooling[2]
    大西洋月刊精讀|Grandparents Could Ease the Burden of Homeschooling[1]Elders have volunteered in the classroom for decades—for their own benefit as well as the children’s.
  • 大西洋月刊重磅報導全文翻譯:可能讓美國崩潰的選舉
    【編者按】美國知名雜誌《大西洋月刊》11月號的封面報導在9月末就在全國引起了轟動。原因是該雜誌考慮到這篇報導的重要性,提前在網上全文刊發了這篇題為《可能讓美國崩潰的選舉》的重磅報導。本文將出現在《大西洋月刊》2020年11月的印刷版上,鑑於茲事體大,文章於2020年9月23日首次在線上發表。文章原標題為《可能讓美國崩潰的大選》。文中配圖均來自《大西洋月刊》。