谷歌的圖書掃描計劃為何失敗

文史 05-10

谷歌的圖書掃描計劃為何失敗

2017-05-09 輕芒

谷歌的圖書掃描計劃為何失敗

美國國會圖書館

文︱James Somers

編譯︱李靜雲

你離讀到迄今為止出版過的所有書的電子版只有一步之遙。如果你想讀的是那些還沒出版的書，可能還是需要付一些錢，但是其他所有已經出版的書，都可能可以在每個地方圖書館裡的閱讀終端上免費閱讀。這個電子書庫的館藏會比美國國會圖書館、哈佛大學、密歇根大學和歐洲任何一個國家的國家圖書館的館藏都要大。

在每個圖書館都即將會擁有的閱讀終端上，你能搜索千萬本的圖書，並且閱讀你能找到的圖書的每一頁。你可以高亮段落，做注釋和分享。人們還能第一次自由地在所有已經印刷出來的圖書中定位一個觀點之後直接把鏈接發給別人。很快圖書也能像網頁一樣可以在眨眼之間獲取、搜索和複製粘貼。

這曾是一個即將實現的夙願。牛津大學博德利圖書館的館長理查德·歐文頓（Richard Ovenden）說，「千年以來一直有人在夢想一個世界級的圖書館，文藝復興的時候，就有人在幻想我們可以把當時世界上所有已經印刷在紙上的知識全部儲藏在一個房間或者一家機構里。」在2011年春天的時候，我們已經做到把世界上所有的書籍都儲藏在一個能夠放在桌面上的小小終端里。

谷歌的圖書掃描計劃為何失敗

2003年，美國國會圖書館的管理員（左）與2013年，美國羅利，北卡羅來納州立大學發明的圖書自助檢索系統。

當時有一位熱切關注此事的人這麼寫道：「這是一個里程碑式的事件，它可以推動教育、研究和人們的智性生活的革新。」

但是，在那一年的3月22日，美國紐約南區地方法院依據聯邦民事訴訟規則的第23(e)(2)條款否定了這一項準備向世人開放這一個世紀以來出版的所有圖書，並且在所有圖書館安裝圖書閱讀終端的計劃。

當亞歷山大圖書館慘遭火災的時候，人們說這是「全世界的災難」。而那一年，當我們這個時代最重要的人文計劃被法院否決的時候，那些幫助阻止這一計劃的學者、檔案學家和圖書館員都鬆了一口氣，因為他們覺得他們恰恰是阻止了一個災難的發生。

谷歌決定掃描世界上所有圖書的秘密計劃開始於2002年，該項目的名字叫做「海洋計劃」（Project Ocean）。當時拉里·佩吉（Larry Page）和瑪麗莎·梅爾（Marissa Mayer）正坐在辦公室，手邊放著一本三百頁的書和一個節拍器。佩吉想知道如果要掃描一億本書需要花多長時間，所以他就從他手邊的這本開始試起。他和梅爾兩個人用計時器來保證速度，然後花了40分鐘時間把這本書從頭到尾一頁一頁地翻了一遍。

佩吉一直想實現圖書的數字化。早在1996年，當Google還只是一個學生項目，主要用來通過爬蟲分析文件並且根據用戶的請求進行相關度排名的時候，當時Google背後的設想就是要「發展技術，建立一個統一的世界數字圖書館。」當時的想法是，在未來圖書都實現電子化的時候，人們就能夠勾勒出每一本書的引用網路，看看哪本書被引用的頻率最高，然後利用這些數據給圖書館的使用者提供更好的搜索結果。但是紙仍然是大多數書籍的載體。佩吉和他的研究夥伴謝爾蓋·布林（Sergey Brin）一起利用萬維網中的網頁進行試驗，繼續充實他們根據引用量來判斷受歡迎程度的點子。

到2002年的時候，佩吉覺得重新關注書籍的時機已經成熟。在他頭腦中有了「40分鐘」這個大致概念的時候，他回到了他的母校，在圖書掃描領域領先世界的密歇根大學，想看看批量數字化技術發展到了什麼程度。密歇根大學告訴佩吉，按照當時的速度，如果想把密歇根大學700萬冊的館藏全部數字化，需要大概一千年。如果是現在的佩吉，可能還會稍微遲疑一下，但是當時的佩吉回答說，谷歌只需要六年左右。

谷歌的圖書掃描計劃為何失敗

密歇根大學圖書館

他給密歇根大學圖書館提議：圖書館將所有的書借給谷歌，谷歌來替對方完成全部的掃描。最後你能得到你的全部館藏的電子版，而谷歌將獲得海量的還不曾被人問津的數據資源。布林如此描述谷歌對圖書館藏的渴望，「人類的知識有幾千年的歷史，而書籍中承載的可能是其中質量最高的部分。」試想如果所有被塵封在紙頁間的知識能夠進入搜索引擎？

早在2004年之前，谷歌就開始了掃描工作。之後，谷歌和密歇根大學、哈佛、斯坦福、牛津、紐約公共圖書館和許多其他圖書館系統都訂立了合約，並且以超過佩吉預言的速度，在十年多一點的時間裡掃描了大約2500萬冊圖書。圖書掃描工作花掉了谷歌大約4億美元。這項工作不僅僅依靠技術，還依靠強大的物流支持。

從周一到周五，裝滿圖書的半掛卡車都會停在谷歌掃描中心的門口。負責掃描斯坦福圖書館藏書的中心是一個改造的辦公大樓，位於谷歌的山景園區（Mountain View campus）。圖書從卡車上卸下來之後會放在圖書館裡常見的那種小推車裡，然後被推給人工操作員。掃描中心大約有幾十台掃描儀，一行一行地整齊排列，台與台之間間隔2米左右，操作員就坐在明亮的掃描儀前工作。

這些掃描儀是谷歌定製的，它們與其說是掃描，還不如說是給書拍照。每台儀器一小時可以數字化1000頁左右的圖書。待掃描的書會被放在一個特別設計的自動支架上，支架可以適應不同的書脊，並且將圖書固定。儀器上方有一排燈，還有價值至少1000美元的光學器材，包括四個攝像頭，兩個分別照著攤開的書的左右兩半，還有一個負責確定掃描範圍的光學雷達，它會在圖書表面生成一層激光網格，從而捕捉到紙頁的曲度。操作員負責手動翻頁，因為也沒有機器能比得上人手的快捷和輕柔了，然後腳踩踏板來觸發相機進行拍照，一系列動作彷彿是在彈一架奇怪的鋼琴。

這個掃描系統很高效的原因是軟體完成了大部分工作。在傳統的圖書掃描系統里，在每次拍照之前確保每一頁都是放正、鋪展的是拖慢掃描進度的主要原因，而在谷歌的掃描系統中，每頁歪歪扭扭的圖書的照片會經過一個「去皺演算法」的處理，該演算法利用光學雷達的數據，最終使得書中每行文字回到正常的、看起來橫平豎直的高度。

該項目的巔峰時期曾僱傭了大約50個全職工程師。他們負責研發能把圖像轉化為文字的光學識別軟體，寫去皺、顏色校正和對比度調節的演算法，以便更好地處理圖像，他們還研發了識別書中插圖和圖表的演算法、提取頁碼的演算法、把腳註轉換為引用的演算法、甚至還有按照布林和佩吉早期研究的思路，把圖書按照相關度排序的演算法。丹·克蘭西（Dan Clancy）曾在該項目鼎盛時期擔任工程主管，他說，「書與書之間還沒有形成網路。一個巨大的研究挑戰就是理解書與書之間的關係。」

在當時谷歌公司的其他部門都痴迷於讓各種app更社交化，比如在2011年發布的Google Plus，而負責圖書項目的人則將書籍掃描看作是像谷歌的搜索服務一樣老派傳統的東西，它們都呼應了谷歌公司的使命：「讓全世界的信息有序，並且跨越國界地流通和發揮作用。」

圖書掃描項目是有史以來第一個被谷歌稱作「探月」（moonshot）的項目。在谷歌開發無人汽車和通過高海拔氣球向非洲輸送互聯網的「瘋狂氣球計劃」（Project Loon）之前，這個數字化圖書的計劃被外界認為是一個白日夢。甚至有些谷歌的員工也認為這個項目純粹是在浪費時間和金錢。克蘭西告訴我，「當時在我們做這個谷歌圖書搜索項目的時候，谷歌內部肯定有不少人想：『為什麼我們要在這個項目上投入這麼多錢？』一旦谷歌開始稍微精打細算起來，就會有人質疑，『等等，你每年有4000萬美元可以花，然後你居然砸了5000萬美元在圖書掃描上？然後這個項目總共要花掉我們3到4億美元？你在想什麼呢？』不過拉里和謝爾蓋一直忠實地支持這個項目。」

當然啦，事情後來的發展並不完全像他們說的那樣，這個探月項目大概比原計劃少掃描了1億本書。計劃失敗的整個經過很複雜，但是起因卻很簡單：谷歌做的這件事被認為是錯的，而沒有人願意寬恕。在得知谷歌從圖書館中拿走了百萬冊的圖書，一本一本地掃描完畢，還像沒事人一樣地把書還了回去之後，各路作家和出版商開始起訴谷歌，正如他們在一開始的抗議中寫道的，指控谷歌「大規模侵犯知識產權」。

谷歌的圖書掃描計劃為何失敗

可以自動翻頁的圖書掃描儀

谷歌掃描圖書的初衷不是為了建一個數字圖書館，讓大家能夠完整地閱讀電子書，這個點子是後來才有的。他們一開始的目標只是為了讓用戶能檢索圖書，對於那些有版權的書，谷歌只能顯示圖書的片段，搜索結果中只能顯示你搜索到的條目前後的幾句話。因此谷歌把他們的圖書搜索服務比喻成一個卡片式的索引目錄。

谷歌還以為建立一個卡片式的索引目錄是屬於「合理使用」的範疇，就像版權法允許學者可以引用別人的作品一樣。谷歌公司的律師大衛·杜蒙德（David Drummond）說，「合理使用和不合理使用的區別在於是否有對原文的改變。沒錯，我們在數字化圖書的過程中是製作了一個副本，但是很顯然，讓用戶能夠在書中找到某個術語不等於讓用戶讀了這本書。這也是為什麼谷歌圖書提供的服務和圖書本身不一樣。」

杜蒙德必須得是對的，因為依照法律，故意侵犯支持產權的賠償金額是15萬美元/每本書。如果谷歌真的侵犯了千萬冊圖書的知識產權，那麼它需要賠償的數額將以萬億計。美國加州大學伯克利分校的法學教授帕梅拉·塞繆爾遜（Pamela Sameulson）在2011年寫道：「谷歌的確有理由害怕他們是在孤注一擲地賭自己的行為是對知識產權的『合理使用』。」知識版權的擁有者們反撲了回去。

他們反撲的理由很充分。因為谷歌在沒有任何許可的情況下就洗劫了圖書館。這顯然是錯誤的。如果你想要複印一本書，首先你要有複印的權利（the right to copy it）——也就是作者和出版商老爺們才有的「版權」（the damn copyright）。如果放任谷歌成批成批地複印美國所有的圖書，對版權擁有者們無疑遺患無窮，這種行為說不定會導致他們失去「知識產權」本應給他們帶來的利益。「美國作家協會」和幾位作家代表全美所有的圖書版權受益者對谷歌提起了集體訴訟（有一些出版商已經單獨起訴了谷歌，但是之後很快就加入了美國作協的集體訴訟）。

科技公司蔑視知識產權已經有很長的歷史了，因為它們發明了新的分發內容的方式。在20世紀初期，製造了自動鋼琴上的打洞紙卷（piano rolls）的人無視了樂譜的知識產權，後來遭到了音樂出版商的起訴。同樣的事也發生在了唱片製造商和早期的商業收音機供應商的身上。在上世紀60年代，有線電視在沒有授權的情況下轉播了無線電視的信號，隨即面臨著高額的訴訟。電影製作公司起訴錄像機製造商，音樂公司起訴了在線音樂共享服務KazaA和Napster。

正如蒂姆·吳（Tim Wu）在2003年一篇法律評論文章中指出的，發生在自動鋼琴的打洞紙卷、唱片、廣播和有線電視身上的事，並不是版權擁有者要打壓新技術。相反，他們要求從新技術中分一杯羹。通常的做法是頒發版權許可，比如音樂家必須要把他們的作品授權給打洞紙卷製造商，作為交換，製造商要為他們製作的不同歌曲的紙卷支付一筆固定數額的費用，比如一首歌兩分錢。音樂家因此擁有了一個新的收入來源，公眾也能在自動鋼琴上聽到他們喜歡的歌曲。吳寫道：「歷史表明，時間和市場經濟總是能保證利益博弈的平衡。」

但是儘管每一方都獲得了好處，每次博弈版權方都會害怕他們會被新技術取代。當錄像帶出現的時候，電影製作人強烈抗議。當時美國電影協會的主席傑克·瓦倫提（Jack Valenti）在法庭上陳詞：「我告訴你們，對美國的電影製片人和美國公眾來說，錄像機比在波士頓地區殺死了13名婦女的殺人犯對獨自在家的婦女的威脅還要大。」大的電影製作公司起訴了索尼，認為它們的錄像帶生意完全是對知識產權的剽竊。但是美國索尼公司對環球影業製片廠的案子之所以為人所知，是因為它判定只要複製技術依然有從事「非侵權」活動的可能性，比如人們可以用在家裡看電影，所以錄像機的製造者並不承擔侵犯知識產權的責任。

索尼的案件迫使電影行業接受了錄像機的存在。不久之後，他們開始把錄像機看成是一次契機。2000年的時候一個評論員這麼說：「錄像機後來成為了繼電影放映機之後對電影製片人和硬體生產商來說最有利可圖的發明。」

所有起訴谷歌的作家和出版商只花了幾年時間就意識到，事實上還是存在一個讓各方都滿意的解決方案的，尤其是當你開始把注意力轉向一些已經絕版而不是還在銷售的圖書的時候。如果你發現了這個區別，你就會以不同的眼光來看待谷歌的整個項目。或許谷歌並沒有掠奪任何人的勞動成果，他們只是使舊書重獲新生。谷歌圖書之於絕版書籍就像錄影機之於已經下線的電影。

谷歌的圖書掃描計劃為何失敗

谷歌圖書

如果真是這樣，人們反而不想去阻止谷歌掃描絕版書籍了，而甚至想鼓勵這種行為。事實上，人們可能會希望不僅僅是只能搜索到圖書的片段，而是希望谷歌能夠出售這些絕版圖書的電子版。因為從本質上來說絕版圖書已經在商業上無利可圖，如果谷歌能通過大批量數字化為它們找到一個新的市場，這對於作者和出版商來說可能還是一種勝利。時任美國出版商協會主席的理查德·薩諾夫（Richard Sarnoff）在當時說道：「我們意識到現在有一個機會，可以對美國的讀者和學者做一件很有意義的事。我們意識到我們可以重新發現和消費圖書行業里已經絕版的圖書。」

然而一旦你有了這個想法，谷歌到底能不能進行圖書掃描並且在搜索結果中展示章節片段的起訴似乎已經不重要了。如果作家協會一方贏了，他們除了法定的損失費之外並不能得到別的補償，而且阻止谷歌向用戶提供一些舊書的章節對他們又有什麼好處呢？說不定那些章節片段還會促使用戶去買書。如果谷歌贏了：作家和出版商什麼也得不到，所有的讀者則能得到絕版圖書的片段，但他們得不到全文。

原告已經使自己陷入了一個特殊的境地。他們既不想輸掉起訴，但也沒有贏的動力。關於絕版圖書的最根本問題是它們的所有權並不明晰。作家可能在40年前和出版商簽了合同，合同規定在圖書絕版之後權利又會回到作者的手裡，但是合同要求作者發布一個聲明宣布版權的回歸，而且合同中也沒有提到數字圖書版權的問題，而且所有的這些都記錄在幾張根本不知道在誰那裡的紙上。

據統計，1923年到1963年期間出版的大約半數圖書事實上都已經進入了公共領域，只是沒有人知道具體是哪些書。那時候生效的版權需要被更新，但是大多數情況下版權所有者懶得去再走一遍合同程序，即使他們更新了版權協議，合同可能也已經丟了。因此，弄清楚某本書的版權到底歸誰成了一件成本很高的事，甚至超過了這本書的市場價值。薩諾夫說：「要讓人們去弄清楚每一本書的歸宿，不光是一件如西西弗斯推石頭一樣徒勞的事，從經濟成本上來說它是沒有可行性的。」所以大部分絕版的圖書哪怕版權沒有問題，也會因為太麻煩而被塵封。

在美國作協對谷歌公司的案件中，人們意識到了上述問題有可能能被徹底避免，並且這推動了一項協議的誕生。美國作協的訴訟案是一項集體訴訟案件，這個集體包括美國所有的圖書版權擁有者。在集體訴訟行動中，原告是在代表整個集體提起法律訴訟（雖然任何人都有權利退出）。

作家協會一案的解決方案之一是為圖書館裡所有的書都找到它作家和出版社的歸屬。不過，你也可以與所有作家訂立一個集體協議：作家全體同意谷歌對他們的著作進行掃描並且可以在搜索結果中顯示，條件是與谷歌共同分享銷售這些書的收益。

德普律師事務所的傑夫·庫納德（Jeff Cunard）在案件中代表出版商一方，他這麼說道，「集體訴訟機制可以解決體制性的問題，因為集體訴訟放棄了先前的各種起訴，並且致力於找到一個面向未來的解決方案。在本案中，有些人將此看做是一個解決絕版圖書問題並將它們從塵封狀態中解救出來的契機，我認為這非常明智。」

這個想法真是太妙了。如果你能讓作家集體同意你的解決方案，並且能說服法官通過（這一步是必要的法律程序，因為要確保集體代表是在以最大化集體利益的方式行動），那你就可以快刀斬掉舊書所有權的亂麻。在集體訴訟案解決之後，所有屬於該集體的作者和出版商都必須得贊成谷歌的掃描計劃。

不過，很自然的，你必須要給作者和出版商一些好處。這也是這個案件最妙的地方。此案解決方案的核心在於要給絕版圖書進行授權。作者和出版商可以隨時帶著他們的書退出這個協議，但是對於那些沒有退出的，谷歌將擁有展示和銷售這些書的自由，但是作為回報，63%的收入將交由一個新成立的第三方機構「圖書版權登記處」（Book Rights Registry）保管。登記處的職責是在那些作者上門來認領某些圖書的版權的時候給他們分一筆錢；對於版權並不明晰的書，一部分的基金會用來追蹤書的版權歸屬。

庫納德說：「圖書出版業並不是世界上最完善的產業，作者作為獨立個體也不能從絕版書中獲得利益。也不是說現在他們就要從谷歌圖書和版權登記處那裡大撈一筆，只是說他們至少不是一無所得。而且，說實話大多數的作者是希望他們的作品是會有人去看的。」

這個被稱為《谷歌圖書搜索修正協議》（Google Books Search Amended Settlement Agreement）的文件有十幾條附錄，共計165頁。確定各項細節前前後後花了兩年半時間。薩諾夫將談判過程比作一個在作者、出版商、圖書館和谷歌公司之間進行的「四維象棋」。「每個談判參與者，真的是每個人，當時都覺得如果我們真的把這事兒談成了，那就是每個人在自己的事業里最大的成就。」最終，協議要求谷歌支付1億2500萬美元，其中包括一次性支付給它已經掃描過的圖書的版權方的4500萬美元（大約按每本書60美元計算），分別向出版商和作者支付的1550萬美元和3000萬美元訴訟費，以及用來創立圖書版權登記處的3450萬美元。

這項協議中也規定了到底應該如何展示和出售這些重獲新生的絕版圖書。按照協議，谷歌可以展示該書至多20%的部分來誘使用戶購買，谷歌可以出售可下載的電子版，價格則由演算法或者版權所有者來確定，由1.99美元到29.99美元不等。所有絕版書都會被打包存進一個「機構訂閱資料庫」，大學可以買下這個資料庫，供全校師生免費搜索和閱讀裡面的全部書籍。協議的§4.8(a)項條款還用法律語言乾巴巴地宣布一項無與倫比的公共事業即將開始：美國所有的地方圖書館都會建造閱讀終端，向公眾開放該資料庫的資源。

年復一年的起訴和談判終於敲定了所有的細節。但是到了2011年的時候，終於出爐了一項看起來是共贏的計劃，正如伯克利的法學教授塞繆爾遜在當時說的，「這個解決方案像是一個三贏——圖書館可以得到成千上萬的圖書，谷歌在圖書搜索服務上的投資沒有白費，作者和出版商能夠從已經毫無商業價值的書中獲得一筆新的收入來源。法律沒有必要否定這樣一個圓滿的結果。」

因此，她寫道：「這可能是有史以來最有冒險精神的一個集體訴訟案。」但是按照她的思路，這也是為什麼這個方案最終會失敗。

《谷歌圖書搜索修正協議》的公布在當時上了頭條新聞。它真的是一件大事，大到足以撼動整個圖書出版行業。作家、出版商、谷歌的競爭對手、法律學者、圖書館員、美國政府還有感興趣的公眾都在熱切關注案件的每一部進展。當首席法官丹尼·秦（Denny Chin）向公眾徵集對此解決方案的意見時，回復如雪片般飛來。

參與這項協議的人們預感到可能會有一些反對意見，但沒想到迎接他們的是，用薩諾夫的話來說，「極端的反對和恐慌」（parade of horribles）[譯註：即通過列舉某項行為可能會引發的所有極端負面後果來反對該行為]，聲稱這項協議會產生無可估量的負面影響。反對意見各不相同，但是它們都彷彿感覺到這項協議會讓且僅讓谷歌獲得極大的權力。時任哈佛圖書館館長的羅伯特·達恩頓（Robert Darnton）說：「難道我們想把最偉大的圖書館交給一個想向我們收多少錢就收多少錢的大公司嗎？」

其實達恩頓一開始是支持谷歌的圖書掃描計劃的，但是這個解決協議讓他開始焦慮了。他和很多其他人一樣都在擔心，發生在學術期刊市場上的事會在谷歌圖書的資料庫上重演。在一開始價格可能是合理的，然而一旦圖書館和學校對訂購谷歌的資料庫產生了依賴，訂購價格就會開始像高利貸一樣暴漲，最終漲得和各種學術期刊一樣高。拿2011年為例，訂閱《比較神經學刊》的年費高達25910美元。

儘管學者和圖書館愛好者對於開放所有絕版圖書的前景非常嚮往，他們卻將那份解決協議看作是與魔鬼的契約。沒錯，最終建成的的確是一個有史以來最大的圖書館，但很有可能同時也是一個被巨型壟斷公司控制的有史以來最大的圖書超市。在他們看來，這並不是最好的解決絕版圖書問題的辦法。伯克利的法學教授帕梅拉·塞繆爾遜寫道：「沒錯，這項協議的大部分看起來都會造福公眾，但它卻將這項交易的全部好處都劃給了谷歌。」

谷歌的競爭對手也覺得受到了這份協議的威脅。微軟公司就不出所料地聲稱，如果谷歌是唯一一個可以合法地檢索絕版圖書的搜索引擎，這無疑會強化谷歌在全世界作為搜索引擎霸主的地位。如果谷歌利用這些絕版圖書來滿足用戶的長尾需求，這將是一個對於其他公司來說很不公平的競爭優勢。谷歌的回復很簡單：你有本事你也可以去掃描圖書然後在搜索結果中顯示，所以谷歌這樣做沒什麼不公平的。（實際上在今年早些時候，第二巡迴法庭終於裁定認為谷歌的掃描圖書並在搜索結果中顯示片段的行為的確屬於合理使用。）

針對谷歌擁有海量藏書這件事，克蘭西說：「確實有這樣一個假說，就是谷歌會擁有巨大的競爭優勢。」但是他說這項數據從來不在谷歌公司的任何一項計劃中佔據核心位置，因為這些書的數據量跟互聯網上現有的數據總量比起來真的是滄海一粟。他說：「你根本不需要在一本書中查伍德羅·威爾遜（Woodrow Wilson）是什麼時候出生的。」圖書的數據是有用的，對研究者也很有吸引力，但是「反對者誇大了這些圖書數據對於谷歌整個項目的戰略性作用，這是沒有道理的」。

亞馬遜公司則擔心這項協議會讓谷歌建立一個無可匹敵的圖書商店。亞馬遜認為，任何想要出售絕版圖書的人，都必須要一本一本地確認圖書版權，這是最好的，但是集體訴訟的協議卻讓谷歌一次性獲得了所有圖書的授權。

這項反對吸引了司法部，尤其是反壟斷部門的注意，他們開始介入此項協議的調查。在一項遞交給法院的聲明中，司法部認為該協議實際上是給了谷歌對絕版圖書的壟斷權。因為如果谷歌的競爭者也想像谷歌一樣得到這些書的掃描和展示權，他們就得經歷同樣詭異的步驟：批量掃描，遭到起訴，像谷歌一樣協商解決。司法部寫道：「哪怕我們認為歷史有那麼一點點可能會重演，我們也不應該鼓勵這種先故意侵犯版權，然後再通過訴訟解決的做法。」

對谷歌最好的辯護論點就是反壟斷法是用來保護消費者的。正如谷歌的一位律師所說：「從消費者的角度來說，能夠得到一件商品無論如何是比根本無法得到要好的。」絕版圖書完全是無法從網上獲得的，現在谷歌給消費者提供了一條路。這怎麼會傷害消費者呢？一位深度參與協議協商的人告訴我：「每個出版商都去和反壟斷部門說，你看亞馬遜可是佔了電子書市場的80%呢，谷歌占的比重大概是0%到1%。所以這其實是允許一個公司在電子書市場和亞馬遜競爭呀。所以你們應該把谷歌的這件事看做是一件支持自由市場競爭、而不是壟斷的事。我也覺得他們說的很有道理，但是他們對反壟斷部就像對牛彈琴，最後的回應是非常令人遺憾的。」

司法部沒有讓步。從某種程度來說，協議的各方沒有什麼好的解決辦法：不管他們多想讓這個協議看起來不是排他的，但因為谷歌是此案唯一一個被告，所以事實上只有谷歌一人得利。但是如果要讓這個叫做「作家協會訴谷歌」的案子把除了谷歌之外的所有想販賣電子書的公司都包括進來，就會超過這一集體訴訟案的承載能力。

這也是司法部門不停地強調的一點。司法部認為，這個協議已經是超過該案原本的範疇了，本來的案子是關於谷歌有沒有展示它所掃描的圖書片段的權力，而現在這個解決協議卻在說要建立一個線上圖書市場。這個線上圖書市場的建立應該要獲得作者和出版商的永久授權，但問題你很難把每本書和它的作者和出版商對號入座，尤其是絕版書的。司法部寫道：「這項協議想利用集體訴訟機制來對未來進行商業部署，但是這已經遠超出本案原本的範疇了。」

司法部的反對導致這個協議進退兩難：如果這個協議只針對谷歌，就會被認為是支持壟斷；如果想擴大協議對象，又會被指控為超過了集體訴訟的範圍。

參與商討這項協議的律師們想努力尋找一個中間地帶。司法部也看到了他們的努力，因此這樣寫道：「美國官方已經察覺到了參與《修正協議》的各方在試圖利用集體訴訟機制來克服在建立一個豐富、有活力的電子書市場時遇到的法律和結構性的挑戰。雖然他們的目標很有價值，但是很遺憾，美國政府依然認為該協議是對集體訴訟機制的濫用。」

司法部的論點也很令人信服，但是這個協議有一個野心勃勃的目標並不等於說它是不合法的，只不過是沒有先例罷了。多年以後，另一個和此案非常相似的集體訴訟案協議卻得到了一個地方法院的批准，只不過後者的協議說明了該協議是一個可退出的、「面向未來的商業部署」。這個新的訴訟案是關於已經退役的全國橄欖球聯盟的運動員的形象權，最後的解決協議將所有肖像權都歸給了一個組織，該組織有權授權使用這些運動員的肖像權並且確定收益分成。同樣也參與了這個訴訟案的庫納德說：「此案的有趣之處在於，沒有任何一個反對者提過谷歌一案中導致秦法官反對的理由，或者提到任何此解決協議『超過了訴訟範圍』這一點。」庫納德表示，如果這個形象權的案件發生在十年之前，它將會成為一個「非常重要和實質性的先例，那麼關於《修正協議》『超出集體訴訟範圍』的這條反對理由就會站不住腳了。這其實說明了法律是一個非常易變的東西。總是要有第一個吃螃蟹的人。」

最後，很有可能是司法部門的介入導致協議無果而終。沒有人知道為什麼司法部要反對而不是保持中立。參與協議商定的谷歌圖書掃描項目工程師丹·克蘭西認為，最終說服司法部表明立場的並不是谷歌的競爭對手，而是那些你本來以為會站在你這邊的旁觀者，比如圖書館愛好者、學術作者這一類人。克蘭西對我說：「我不知道如果那些反對者的聲音沒有這麼大的話，這個案件的解決會有什麼不同。我不清楚如果那些圖書館和那些像羅伯特·達恩頓或者帕姆·塞繆爾遜一樣的人沒有那麼積極地採取行動的話，司法部到底會不會介入，因為如果沒有這些人的話，那麼就只會剩下亞馬遜和微軟在對谷歌發牢騷，而這人們已經見怪不怪了。」

不管是什麼原因，司法部把想說的話都說了，並且吸引了公眾的注意。法官丹尼·秦最終依據集體訴訟法規裁定《修正協議》「不公平、不充分、無據可依」，並引用了司法部的反對理由，建議將協議修改為一項自願加入的協議（雖然這樣會讓這項協議簽了也等於白簽），或者就是直接去說服國會。

秦在他的決定中寫道：「儘管圖書的電子化和建立一個無國界的圖書館可以讓很多人收益，但是這個《修正協議》太過了。」

在討論《修正協議》的公平聽證會的尾聲，秦法官彷彿是單純出於好奇地問了一句，現在有多少個反對意見？又有多少人選擇退出這個集體訴訟中的集體？結果分別是500多個和6800多人。

谷歌的圖書掃描計劃為何失敗

FBI Warning：侵權會有嚴重的法律後果。

反對《修正協議》也沒什麼不合理的。雙方都很有道理，沒有人知道秦法官最後會傾向哪邊。最後導致這個協議被否決的是集體訴訟中的作家和出版社集體的反對行為本身。代表作家集體的主要談判人邁克爾·伯尼（Michael Boni）說：「在我參與各種集體訴訟案的25年以來，我從來沒有見過哪個解決協議有這麼多的反對者。」作家集體的強烈反對很有可能也是導致司法部介入的原因，是導致公眾也開始反對《修正協議》的原因，並且是導致秦法官開始尋找否決這項協議的辦法的原因。畢竟，對法官來說最關鍵的問題是這項協議對訴訟集體的成員來說是否公平。站出來對協議表示不滿的訴訟集體成員越多，法官越有理由相信這項協議不符合他們的利益。

諷刺之處在於許多反對這項協議的人從心底里是信任谷歌的這項計劃的。帕梅拉·塞繆爾遜反對的主要原因是谷歌會「出售」她的書和別人的同類作品，而她覺得這些書應該向公眾免費開放。（她和其他受到協議約束的作者一樣，並不僅僅滿足於只把自己的作品免費開放，因為那些找不到作者的「孤兒作品」仍然會被標價出售。）我們今天再回頭審視這件事的時候，我們會發現它的邏輯很弔詭：如果找不到一個完美的解決方案的話，不如放棄解決這個問題。哪怕最後谷歌標價出售那些孤兒作品，但是讓所有的書都能被公眾以某種方式獲得總比讓公眾什麼都看不到好吧。在她的論文中，她雖然得出結論認為《修正協議》太過了，但她仍然寫道：「這個（開放電子圖書資源的）美好願景不能變為現實真是太令人難過了，因為現在看來它是如此的近在咫尺。」

事實上很多反對者相信此事會有一個比集體訴訟協議更好的解決方案。在公平聽證會上反覆出現的一句話是說國會應該有授權數字化絕版作品的權利。當這項協議被否決的時候，他們指出，美國版權辦公室建議通過立法來規範類似行為的提案還有北歐國家在開放絕版圖書方面的努力實際上都印證了國會應該負責授權的觀點是對的，國會能夠做到這項協議做不到的地方。

當然了，在差不多十年之後，國會並沒有採取行動。庫納德講了版權辦公室的提案：「這件事沒有進展，我也不覺得它現在會有什麼進展。」那些支持《修正協議》的人都說那些反對者的想法很不現實，他們好像都不懂社會到底是怎麼運轉的。「他們覺得如果我們這次訴訟不能解決圖書問題，未來還會有機會的，因為國會可能會立法什麼的。然後……但是這件事一塵埃落定，就再也沒有半個人關心它了。」克蘭西說。

很顯然，沒有誰願意在改變圖書的授權規則上花費政治資本，尤其是在今天，更何況是那些已經過時的書。克蘭西說：「對國會來說，改變版權法並不重要，這件事既不會讓誰贏得選舉，也不能創造大量就業崗位。」所以也無怪關於谷歌的集體訴訟案可能會是推動此方面改革的唯一契機：因為谷歌是唯一有動力的一方，而且也有財力讓它實現。出版商的內部法律顧問阿蘭·阿德勒說：「這件事說白了，就是一個私人公司要替一個人人都想要的東西買單，就是這麼簡單。」谷歌向這個項目傾注巨資，不單純只是想掃描，也是希望挖掘和數字化舊的知識產權資源，希望能和作者與出版商談判，希望能出錢建立一個圖書版權登記處。多年之後，版權辦公室除了提出了一個不僅毫無新意還需要國會撥款的提案之外沒有任何進展。

在谷歌圖書訴訟案期間時任哈佛圖書館館長的羅伯特·達恩頓，他當時反對《修正協議》，當被問是否後悔最後的結果，「如果說我後悔的話，一切其他試圖繞過谷歌的方法其實也都深受版權法的限制。」達恩頓在開展另一項圖書館圖書掃描項目，但是他只能夠掃描那些版權已經進入公有領域的書。「別會錯我的意思，我很支持版權，但是說實話，要等一百多年才能等到圖書進入公有領域，而且美國大多數的圖書館也都被攔在了版權的門檻之外，我覺得不可思議。」

在1790年通過的美國第一個版權章程叫做《一項鼓勵學習的法案》（An Act for the Encouragement of Learning）。當時版權的期限為14年，如果作者在第一期版權結束時還健在，可以選擇再延長14年。當時的想法是要在作者和閱讀公眾之間取得一個合理的平衡。作者可以有限地壟斷他們的作品並以此謀生，但是他們的作品也會很快進入公共領域。

在歐洲，版權的期限是作者的壽命再加50年。為了和歐洲保持一致，美國的版權期限也快速提高。但是歐洲「依據的是自然法而不是實在法」，霍華德大學法學院的版權研究學者拉蒂夫·穆提瑪（Lateef Mtima）說：「他們的思維方式源於法國，源於雨果，他們那些人的想法是『我的作品就是我的孩子』，國家沒有權利對我的作品做任何事，這有點像洛克的觀點。」在全球化的進程中，版權法律也相互融合，大家都怕如果一個國家先開放了自己的知識產權之後就會被別的國家利用，從而處於劣勢。所以把版權當做一個「傳播科學進步和實用藝術」工具的美國法律就漸漸轉變成一個把1923年之後出版的幾乎所有書都禁錮起來以保護作者的版權法律體系。

穆提瑪說：「在孤兒作品的問題上我們還在原地踏步，這是最大的悲劇。除了少數例外，大部分孤兒作品現在就只是在不知道哪個角落積灰和腐爛。沒有人有權利用它們，所有人都輸了，沒有人是贏家。」

在《修正協議》失敗之後，谷歌也「逐漸泄氣」。儘管谷歌贏了作協訴谷歌一案，法庭也宣布穀歌可以展示圖書的章節片段，公司也幾乎停止了它的圖書掃描項目。

一想到谷歌公司的某處有一個包含有2500萬本書但是卻沒有人有權利閱讀的資料庫，這個事實就讓人覺得無法理解。這就好像是《奪寶奇兵》第一部的結尾那裡，他們把珍貴的法櫃放到了架子上的某個地方，然後就湮沒在了一個巨大、混亂的倉庫里。但它就在那裡。那些書就在那裡。多少年來，人們都夢想著建造一個這樣的圖書館，一旦成功，他們說這將會是有史以來最大的人文主義成就。現在我們付出了努力將它變成了現實，距離將它獻給全世界只有一步之遙——但是現在，它僅僅是硬碟上一個50或者60PB大小的文件，除了幾個負責把它們鎖起來的工程師之外沒有人能看到。

如果想把那些書全部開放給公眾需要做些什麼？開放這些資源有多困難，到底是什麼攔在了我們和一個藏有2500萬本書的數字圖書館之間？

一個曾任該工程工程師職位的人說，你會惹上很多麻煩的，但是從技術上來說只需要寫一個簡單的資料庫查詢。你需要把某些off按鈕點成on，當然等這個指令執行完畢可能還要幾分鐘。

本文編譯自《大西洋月刊》2017年4月20日Torching the Modern-Day Library of Alexandria一文。

END·

谷歌的圖書掃描計劃為何失敗

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自
的精彩文章:

※美國300斤胖子短跑速度驚人，被美媒譽為：橄欖球屆的博爾特！
※如何看待：印度變性人、中國剩女、未成年新娘、同性戀？
※中國功夫巨星真實戰力排名，李小龍竟然不是第一
※陪著爸媽去旅行之——新加坡
※彩雲之南-昆明、大理、麗江 7日游

TAG:
|

您可能感興趣

※我的書單和讀書計劃
※如何撰寫商業計劃書
※「悅讀樂寫」計劃之讀書筆記
※繪畫寫實計劃
※藝趣談「掃盲計劃」
※《殺手古德》情節＆計劃
※演繹與基因圖譜——邱志傑上元燈彩計劃終結篇
※《日本旅行計劃》讀書筆記
※《艾琳》小說計劃詳覽
※《亮劍》錢伯鈞被殺，平田一郎的策反計劃失敗了嗎？其實他贏了！
※「物鏡——繪畫研究計劃」不同藝見藝術中心開幕
※《破冰者》靳遠精心設計計劃失敗，這個穿幫鏡頭成最大敗筆
※《異形》大熒幕失敗之後何去何從？業內人士：正計劃劇版的製作
※《亮劍》山本精心策劃的夜襲計劃，為何會留下破綻？他太大意了！
※觸手炸裂！《幻想計劃》同人美圖賞析
※《奧特怪獸擬人化計劃》新作動畫《怪獸娘黑》製作決定
※能力提升秘籍——項目計劃書如何撰寫？
※日本侵華計劃《田中奏摺》為什麼被盜了？
※如何使用模板寫研究計劃
※科幻遊戲計劃C概念圖前《半條命2》設計師打造