Google图书搜索的是与非

阅读时间 11 分钟,快速阅读仅需 4 分钟。

最近“Google图书搜索”成了热门的话题,在过去的10多天里,“谷歌图书”、“Google图书”等词的搜索频率大大提高。原因是中国一些作家、作协和CCTV联合起来,认为Google擅自将有著作权的图书扫描上网侵犯了作家们的权利。和李彦宏出现在春晚之前CCTV对百度发起猛烈攻势一样,这次CCTV再次联合新华网等官媒对Google进行谴责。一些不明真相的记者也随之附和。

Google图书搜索本来并不引人注意,这回CCTV又给Google带来流量了。

Google图书搜索概况

Google图书搜索是Google一个非常有特色的服务,Google通过与图书馆、出版社、作家合作,将图书扫描存档,然后在网上提供搜索和预览。

前面这句话说得这么啰嗦是因为“扫描”、“上网”、“预览”是3个不同的概念。在没有得到出版社或作者许可,Google不会大面积提供图书的预览,甚至不会提供预览,即便它已经将一本图书扫描存档。

Google图书搜索的数据来源:

(1)图书馆

Google和一些知名的图书馆合作,将其收藏的图书索引在图书搜索中。

对于受版权保护的图书,Google图书搜索里会提供片段预览或不提供预览,比如王小峰这本书、张抗抗这本书。而对于不受版权保护的图书,搜索者可以阅读和下载整本图书。

(2)出版商

同时,Google还与一些出版商和作者达成协议,他们的图书也会出现在Google图书搜索上。和图书馆计划中受版权保护的图书一样,这些图书会提供很小的片段预览,以帮助搜索者决定是否购买该书。

Google图书搜索提供预览的方式:

1、无预览

在出版者或作者明确要求不允许提供任何预览的情况下,Google图书搜索只提供图书的书评、作者、ISBN等周边信息。如《Harry Potter》。

2、摘录预览

对于有版权的图书,Google提供图书的片段预览,这些预览由两三行字组成,而且是不可复制的图片。例如抗议声很大的张抗抗老师的这本书

3、有限预览

在得到出版社或作者许可的情况下,Google会提供一本书的有限预览,有限预览比摘录预览提供更多公开的内容,比如徐静蕾这本书,至少一半的页面是可以预览的。但这些预览材料是pdf文件,无法复制

4、全书预览

如果一本书没有版权、版权已经失效、出版社或作者允许公开,Google会提供这本书的全书预览,比如《论语》。

抄袭内容满天飞的中国互联网不一样,Google提供的每种预览方式都会包括书籍的出版社、作者等权利信息。

世界图书馆

Google之所以要扫描图书无非有2个目的:

增强自身的数据,让其搜索立于不败之地

商业公司当然要首先考虑自己的利益,图书里包含的信息比互联网上的更专业可靠。

让图书检索变得更简单,构建世界图书馆

写过论文的朋友肯定知道翻查资料的痛苦,如果所有的图书都能在网上检索,事情会变得轻松很多。即便不能下载,知道某条信息位于某本书的哪一页也极大地方便了后续查找。

大学图书馆一般都有书目检索系统,里面可能会包含维普数据库、万方数据库等,但这些数据库是远远不够的,同时因为技术原因,搜索结果并不理想,甚至搜索缓慢。

因此,构建一个世界性的、资料大而全的数字图书馆是有必要的,这不但可以让知识永久保存下来(试想纸质图书什么时候会湮灭掉,但电子数据几乎不会丢失),更重要的是,人们可以更方便地查找资料。如果人们愿意,可以以一定的价格购买检索出来的纸质图书或电子文档。

而要构建这样一个数字图书馆,要么由联合国来筹划,要么就是由利益驱动的商业公司来构建。明白到这一点,就不难理解为什么Google要推出图书搜索。

纠纷

前面说到,Google图书搜索里的内容的其中一个来源是合作图书馆。前些年,数位作家和出版社联合起诉Google,他们认为Google在没有获得他们授权的情况下擅自制作电子版图书是侵权的。

Google之所以这么做,因为Google认为根据美国版权法“公平使用(Fair Use)”的信条是允许的。于是Google提供了从图书馆扫描出来的版权图书的片段预览。

图:图书片段预览

这场关于版权的诉讼一直到了今年才有了结,双方同意和解,正是这一和解协议引起了国内一些好事的人注意,从而掀起了“反对谷歌侵权”的风暴。中国似乎一夜之间就变得十分尊重版权。

和解协议

Google与作家、出版社达成了和解协议,协议仅在美国生效,根据和解协议,作家或出版社可以要求Google不扫描特定著作,或将已经扫描的书籍从Google图书搜索里移除。而如果作家和出版社不提出排除或除外请求,Google将享有以下权利:

1、继续数字化图书

2、向公共机构出售对电子书籍数据库的订阅

3、出售对个别书籍的网上查阅

4、出售在书籍的插页做广告

5、显示书籍预览或片段

6、显示书籍的简介、目录等周边信息

或许我们会有疑问,这不是霸王条约么?为什么作家和出版社愿意和Google达成这样的霸王条约?

因为根据和解协议,作家和出版社将会获得较大的利益

1、作家和出版社可以决定版权图书以何种方式展示:全书预览、收费预览(价格也是可以自行决定的)。

2、Google图书搜索收入63%将支付给版权所有人,这些收入包括前面提到的广告、出售等。

3、在一定程度上增加销量。

4、获得至少60美元的赔偿。

其实60美元的赔偿不算什么,基本上可以忽略,作家和出版社愿意达成协议,很大程度上是看中了收入的分成,用过Google Adsense的人肯定知道,Adsense广告收入是很可观的

如果你身在美国,你将能看到Google图书上的收费阅读功能,因为这个和解协议适用于美国境内。

中国作家的抗议

《新京报》2009年10月15日报道中国“文著协抗议谷歌侵权”,报道的主要内容如下:

中国文字著作权协会常务副总干事张洪波表示,有570位中国权利人的17922部图书未经授权就被谷歌使用。文著协将代表作者,维护中国版权合法权益。张洪波称,文著协也是今年才知道谷歌数字化图书馆中收录了未经授权的中国图书。

在报道中,《新京报》的记者强调Google只会对版权所有人支付至少60美元的赔偿,而只字不提63%的收入分成。其它媒体的报道也几乎没有提及收入分成这一点,甚至有媒体断章取义称Google仅支付60美元的赔偿。

CCTV2的《今日观察》也跟进了这一事件,报道视频如下:

看不到视频可以点击这里

节目开始时,评论员刘戈做了一个荒唐的比喻,大家可以重点注意一下。

中国作家的抗议其实和当年美国作家的抗议如出一辙,不同的是,中国的媒体将问题扩大化,我甚至认为很多作家根本没有用过Google图书搜索就跟着其他人一起抗议,他们是真正的不明真相、被煽动群众。

默多克式的叫嚷

互联网提高图书销量

传媒大亨默多克经常谴责Google免费在网络上提供新闻搜索,认为那样损害了自己的利益,但新闻集团旗下的所有网站却没有一个在robots.txt里禁止Google,因为默多克即便已经白发满头,他依然能明白,没有了搜索引擎,他旗下的媒体更不好过。所以默多克叫叫也罢了,根本不需要理会。

叫嚷着被侵权的作家也是一样的。在互联网时代,试想如果一部图书在网上无法搜索到任何片段、没有任何介绍,谁会去买?现代人谁有大量的时间到图书馆或书店去翻阅图书?单靠口碑图书就能有很好的销量?

扫描不等于商业用途

Google图书搜索没有提供有著作权的图书的全书预览,反而提供其中的片段和简介,方便搜索者决定是否购买,如果这种做法也是侵权,那提供图书目录的当当网、提供书籍简介的豆瓣网是否也有侵权之嫌?

图:当当网上的张抗抗老师的图书《你是先锋吗

是的,Google和当当网不同,Google还将图书扫描存档了。但是,就像个人购买图书一样,我们可以私下扫描图书、将图书存档到电脑里,这都是允许的,因为我们没有将这些资料用于商业行为。

同样的,Google也没有这样做,它做的事情和图书馆、和我们做的是一样的,它扫描了有著作权的图书,但并没有将这些内容在网上公开,也没有用于商业行为,在权利人没有允许的情况下,提供比当当网还少的图书简介和预览。

既然不能用于商业用途,那么Google扫描图书的用意何在?

长远来看,被扫描的图书肯定是要放到网上的,Google是在等待权利人的允许。

合作才是最好的出路

图书数字化是时代的趋势,纸质媒介终将被淘汰。与其进行诉讼,不如选择合作,作家、出版商与Google进行合作对于双方,乃至于全球网民都是有益的。因为:

1、Google可以极大其数据库,提供更好的搜索服务,获得更大的竞争优势。

2、作家、出版商可以通过Google图书搜索平台促进作品的销量,同时参与广告分成,获得额外的收入。

3、网民能免费获得更多的信息。同时,支付一定的费用后在网上就能获得资料,免除奔波图书馆的烦恼。

很多音乐网站都提供30秒试听服务,这个试听服务侵权了么?版权所有人为什么没有意见?因为这是一种双赢的策略。

图书预览也可以效仿音乐试听,盈利前景是可以预测的。

阴谋?

谷歌今年年初被CCTV整了一次,我现在还记忆犹新。谷歌因为在搜索框里提供关键词提示,而这些关键词提示不加人工干涉,被CCTV的专家们认为谷歌是故意为了吸引流量而做的“违背道德”行为。当时,在谷歌搜索框里输入“儿子”,就会出现“儿子和妈妈好爽啊”等关键词提示。

不知道是专家装傻还是真傻,这些关键词提示都是根据搜索频率决定的,中国网民爱搜索这些东西,责任却在Google身上去了。

CCTV2的《谷歌的无礼颠覆了什么》专题里,其中一位评论员对Google图书搜索表示担忧,他担心Google会故意挑选符合美国价值观的图书进行扫描。这个“担忧”到底暗示了什么,稍微动脑就能想到了。

同时,新华网人民网(该网站可能含有恶意软件,有可能会危害您的电脑)相继出现抨击谷歌的舆论,醉翁之意在哪里,也是稍微动脑就能想到的。

(更新)人民网的无耻反击

2009年10月23日下午17:47分补充更新:

新华网刚刚发布一篇题为《谷歌标明"人民网读书频道可能含有恶意软件"? 》的新闻,内容主要认为Google不满人民网大面积报道Google图书搜索侵权行为,从而将人民网读书频道标记为“该网站可能含有恶意软件,有可能会危害您的电脑。”,摘录部分内容:

从谷歌已经无法直接点击进入人民网读书频道了。记者随后向人民网了解情况,据读书频道负责人介绍,这个情况他们也 发现了,已经有不少读者反映此事。但通过技术部门诊断,人民网读书频道页面完全正常,没有任何相关恶意软件。“况且读书频道与其他频道共用一台服务器,为 何只有读书频道被注明含有恶意软件?谷歌的检索结果里还有一个是繁体的人民网读书频道,点击去其实还是简体版本,就没有提醒含有恶意软件。”

但如何解释谷歌的检索结果?“原因很简单,我们从20日开始关注了谷歌数字图书馆涉嫌侵权中国作家的事情,并且做了相关专题。21日就被如此恶意封杀了”,读书频道的负责人解释到。

众所周知,Google搜索结果对恶意链接的判断,数据是来自第三方的StopBadware,Google将一个网站标示为可能含有恶意软件是因为发现了该网站里确实存在恶意代码,为了保护搜索者的安全,它就加上了那样一句标识。

那么,人民网读书频道的负责人的回答是无耻还是无知,相信大家可以有一个非常清晰的判断。

附:Google对人民网读书频道页面的安全诊断报告

247 条评论

  1. 不好意思Jason,有三点我想指出:
    第一,你说“扫描不等于商业用途”,但是谷歌确实将这些书籍用于商业用途了,这包括建立谷歌自己的全文搜索数据库以及提供了部分仍受版权保护的图书的部分预览,同时谷歌在预览的网页上投放了赞助商链接。实际上即使没有投放赞助商链接,谷歌建立全文搜索数据库这件事本身也是很值得争议的。
    第二、你说构建一个世界性的数字图书馆,“要么由联合国来筹划,要么就是由利益驱动的商业公司来构建”,这点也有失偏颇。谷歌不是第一个将公共领域的图书数字化的组织,事实上你很可能听说过OCA以及archive.org,他们所做的工作有一点类似于开源社区。
    第三、谷歌在和美国的图书馆的合作过程中并不是“不作恶”的,谷歌和与其合作的图书馆签订有协约,根据它们的约定,这些图书馆不能与第三方进行类似的将图书数字化的合作,换句话说谷歌想买断这些图书馆的资源,不过正因此有一些图书馆不愿意和谷歌合作而转而与OCA合作。
    最后还想加一点,谷歌将其与美国出版商协会等所达成的协议放到google.cn的网站上,我个人觉得是很可笑的,因为美国的在线购买图书的市场和中国根本就不具备可比性,其次谷歌这么做也根本是对中国司法的藐视,好像有“我在美国达成的协议照搬到中国你也就从了吧”之意,再其次,谷歌在中国其盈利能力与其在美国又不具可比性,凭什么让中国的作家接受它的63%的利润呢?

    • > 第一,你说“扫描不等于商业用途”,但是谷歌确实将这些书籍用于商业用途了,这包括建立谷歌自己的全文搜索数据库以及提供了部分仍受版权保护的图书的部分预览,同时谷歌在预览的网页上投放了赞助商链接。实际上即使没有投放赞助商链接,谷歌建立全文搜索数据库这件事本身也是很值得争议的。

      “提供了部分仍受版权保护的图书的部分预览”
      提供预览的图书并不是由Google随意选择,而是要经过著作权人同意开放预览,这样没有侵犯谁的权利。
      “谷歌在预览的网页上投放了赞助商链接”
      投放赞助商链接的收入,Google已经向著作权人给出一个offer愿意将这些收入与他们分成。著作权人如果自己不想要这个收入,也可以拒绝和解协议,让Google把自己的作品撤出搜索结果。

  2. 本文写得很好哟,读起来很畅快淋漓,
    就可惜还是该看的人都不看不想也不听,
    不明真相的作家们高举XX的旗帜,被人当了枪使,
    谷歌这么下去不行啊,它们控制了大部分的舆论啊。
    除非等到新人换旧人,谷歌该怎么翻身啊?

  3. 图书馆数字化首先绝对是一件有利于人类发展的事情
    我义务整理过一次图书馆。。。。。深有感触

    对于版权问题,我觉的那帮人言过其实,可能主要目的就是炒作一下,要不然大多数人都不知道原来中国有这么多作家。。。

    如果一个图书馆,所有书籍都要考虑版权问题,21世纪建成?没戏
    有人提供你一条买书的渠道,63%的分成,我想这很多作家求之不得
    Google也没有公开你的书籍,仅是很小的一部分
    自我感觉侵权,你怎么不去问问中国的音乐和游戏的版权/。。

    而且作为一个写书人,而不是商人
    传播思想,寻找知己是主要的目的,如果连这样的胸襟都没有,谈何写书

    就算这次作协赢了,所有提及书籍都撤下,想再放上去的时候看你怎么求Google

    • 本就是时代的潮流。

      那帮作家,一是想炒作,二是想赚点赔偿,然后把赔偿款拿去到百度做竞价排名做宣传。。。。

      这么有意义的事其实本来应该我们国家自己来做的,文化的传承和推广。

      假手于外人,悲剧啊。

      我想看论语,去书店一看,好几百块呢。TMD,凭啥那么贵?论语的版权貌似不属于任何人吧。凭啥那么贵?

  4. 去死吧 为什么都骂CCTV你谷歌那么做真合理吗!?我不这么认为谷歌这么做确实有侵犯版权的嫌疑好不好 Google不是什么都好 就像中国有不好可就不可以说她都不好吧 你说我是托也罢 我就不认为Google 这次做对了

  5. 现在正在和导师一起折腾开放性设计,真没想到世界上竟然还有如此奇观。设计都能开放,何谈图文。现有版权法规的确是要作出相应的修改来适应时代的变革了。

  6. 这群SB一夜之间怎么就这么讲版权了?中国还有真正的作家吗?除了献媚就是歌功颂德,书里面的东西除了署名其他都是别处“借鉴”来的。让人想起阿娇反对婚前性行为。

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注