Google图书搜索的是与非

阅读时间 11 分钟,快速阅读仅需 4 分钟。

最近“Google图书搜索”成了热门的话题,在过去的10多天里,“谷歌图书”、“Google图书”等词的搜索频率大大提高。原因是中国一些作家、作协和CCTV联合起来,认为Google擅自将有著作权的图书扫描上网侵犯了作家们的权利。和李彦宏出现在春晚之前CCTV对百度发起猛烈攻势一样,这次CCTV再次联合新华网等官媒对Google进行谴责。一些不明真相的记者也随之附和。

Google图书搜索本来并不引人注意,这回CCTV又给Google带来流量了。

Google图书搜索概况

Google图书搜索是Google一个非常有特色的服务,Google通过与图书馆、出版社、作家合作,将图书扫描存档,然后在网上提供搜索和预览。

前面这句话说得这么啰嗦是因为“扫描”、“上网”、“预览”是3个不同的概念。在没有得到出版社或作者许可,Google不会大面积提供图书的预览,甚至不会提供预览,即便它已经将一本图书扫描存档。

Google图书搜索的数据来源:

(1)图书馆

Google和一些知名的图书馆合作,将其收藏的图书索引在图书搜索中。

对于受版权保护的图书,Google图书搜索里会提供片段预览或不提供预览,比如王小峰这本书、张抗抗这本书。而对于不受版权保护的图书,搜索者可以阅读和下载整本图书。

(2)出版商

同时,Google还与一些出版商和作者达成协议,他们的图书也会出现在Google图书搜索上。和图书馆计划中受版权保护的图书一样,这些图书会提供很小的片段预览,以帮助搜索者决定是否购买该书。

Google图书搜索提供预览的方式:

1、无预览

在出版者或作者明确要求不允许提供任何预览的情况下,Google图书搜索只提供图书的书评、作者、ISBN等周边信息。如《Harry Potter》。

2、摘录预览

对于有版权的图书,Google提供图书的片段预览,这些预览由两三行字组成,而且是不可复制的图片。例如抗议声很大的张抗抗老师的这本书

3、有限预览

在得到出版社或作者许可的情况下,Google会提供一本书的有限预览,有限预览比摘录预览提供更多公开的内容,比如徐静蕾这本书,至少一半的页面是可以预览的。但这些预览材料是pdf文件,无法复制

4、全书预览

如果一本书没有版权、版权已经失效、出版社或作者允许公开,Google会提供这本书的全书预览,比如《论语》。

抄袭内容满天飞的中国互联网不一样,Google提供的每种预览方式都会包括书籍的出版社、作者等权利信息。

世界图书馆

Google之所以要扫描图书无非有2个目的:

增强自身的数据,让其搜索立于不败之地

商业公司当然要首先考虑自己的利益,图书里包含的信息比互联网上的更专业可靠。

让图书检索变得更简单,构建世界图书馆

写过论文的朋友肯定知道翻查资料的痛苦,如果所有的图书都能在网上检索,事情会变得轻松很多。即便不能下载,知道某条信息位于某本书的哪一页也极大地方便了后续查找。

大学图书馆一般都有书目检索系统,里面可能会包含维普数据库、万方数据库等,但这些数据库是远远不够的,同时因为技术原因,搜索结果并不理想,甚至搜索缓慢。

因此,构建一个世界性的、资料大而全的数字图书馆是有必要的,这不但可以让知识永久保存下来(试想纸质图书什么时候会湮灭掉,但电子数据几乎不会丢失),更重要的是,人们可以更方便地查找资料。如果人们愿意,可以以一定的价格购买检索出来的纸质图书或电子文档。

而要构建这样一个数字图书馆,要么由联合国来筹划,要么就是由利益驱动的商业公司来构建。明白到这一点,就不难理解为什么Google要推出图书搜索。

纠纷

前面说到,Google图书搜索里的内容的其中一个来源是合作图书馆。前些年,数位作家和出版社联合起诉Google,他们认为Google在没有获得他们授权的情况下擅自制作电子版图书是侵权的。

Google之所以这么做,因为Google认为根据美国版权法“公平使用(Fair Use)”的信条是允许的。于是Google提供了从图书馆扫描出来的版权图书的片段预览。

图:图书片段预览

这场关于版权的诉讼一直到了今年才有了结,双方同意和解,正是这一和解协议引起了国内一些好事的人注意,从而掀起了“反对谷歌侵权”的风暴。中国似乎一夜之间就变得十分尊重版权。

和解协议

Google与作家、出版社达成了和解协议,协议仅在美国生效,根据和解协议,作家或出版社可以要求Google不扫描特定著作,或将已经扫描的书籍从Google图书搜索里移除。而如果作家和出版社不提出排除或除外请求,Google将享有以下权利:

1、继续数字化图书

2、向公共机构出售对电子书籍数据库的订阅

3、出售对个别书籍的网上查阅

4、出售在书籍的插页做广告

5、显示书籍预览或片段

6、显示书籍的简介、目录等周边信息

或许我们会有疑问,这不是霸王条约么?为什么作家和出版社愿意和Google达成这样的霸王条约?

因为根据和解协议,作家和出版社将会获得较大的利益

1、作家和出版社可以决定版权图书以何种方式展示:全书预览、收费预览(价格也是可以自行决定的)。

2、Google图书搜索收入63%将支付给版权所有人,这些收入包括前面提到的广告、出售等。

3、在一定程度上增加销量。

4、获得至少60美元的赔偿。

其实60美元的赔偿不算什么,基本上可以忽略,作家和出版社愿意达成协议,很大程度上是看中了收入的分成,用过Google Adsense的人肯定知道,Adsense广告收入是很可观的

如果你身在美国,你将能看到Google图书上的收费阅读功能,因为这个和解协议适用于美国境内。

中国作家的抗议

《新京报》2009年10月15日报道中国“文著协抗议谷歌侵权”,报道的主要内容如下:

中国文字著作权协会常务副总干事张洪波表示,有570位中国权利人的17922部图书未经授权就被谷歌使用。文著协将代表作者,维护中国版权合法权益。张洪波称,文著协也是今年才知道谷歌数字化图书馆中收录了未经授权的中国图书。

在报道中,《新京报》的记者强调Google只会对版权所有人支付至少60美元的赔偿,而只字不提63%的收入分成。其它媒体的报道也几乎没有提及收入分成这一点,甚至有媒体断章取义称Google仅支付60美元的赔偿。

CCTV2的《今日观察》也跟进了这一事件,报道视频如下:

看不到视频可以点击这里

节目开始时,评论员刘戈做了一个荒唐的比喻,大家可以重点注意一下。

中国作家的抗议其实和当年美国作家的抗议如出一辙,不同的是,中国的媒体将问题扩大化,我甚至认为很多作家根本没有用过Google图书搜索就跟着其他人一起抗议,他们是真正的不明真相、被煽动群众。

默多克式的叫嚷

互联网提高图书销量

传媒大亨默多克经常谴责Google免费在网络上提供新闻搜索,认为那样损害了自己的利益,但新闻集团旗下的所有网站却没有一个在robots.txt里禁止Google,因为默多克即便已经白发满头,他依然能明白,没有了搜索引擎,他旗下的媒体更不好过。所以默多克叫叫也罢了,根本不需要理会。

叫嚷着被侵权的作家也是一样的。在互联网时代,试想如果一部图书在网上无法搜索到任何片段、没有任何介绍,谁会去买?现代人谁有大量的时间到图书馆或书店去翻阅图书?单靠口碑图书就能有很好的销量?

扫描不等于商业用途

Google图书搜索没有提供有著作权的图书的全书预览,反而提供其中的片段和简介,方便搜索者决定是否购买,如果这种做法也是侵权,那提供图书目录的当当网、提供书籍简介的豆瓣网是否也有侵权之嫌?

图:当当网上的张抗抗老师的图书《你是先锋吗

是的,Google和当当网不同,Google还将图书扫描存档了。但是,就像个人购买图书一样,我们可以私下扫描图书、将图书存档到电脑里,这都是允许的,因为我们没有将这些资料用于商业行为。

同样的,Google也没有这样做,它做的事情和图书馆、和我们做的是一样的,它扫描了有著作权的图书,但并没有将这些内容在网上公开,也没有用于商业行为,在权利人没有允许的情况下,提供比当当网还少的图书简介和预览。

既然不能用于商业用途,那么Google扫描图书的用意何在?

长远来看,被扫描的图书肯定是要放到网上的,Google是在等待权利人的允许。

合作才是最好的出路

图书数字化是时代的趋势,纸质媒介终将被淘汰。与其进行诉讼,不如选择合作,作家、出版商与Google进行合作对于双方,乃至于全球网民都是有益的。因为:

1、Google可以极大其数据库,提供更好的搜索服务,获得更大的竞争优势。

2、作家、出版商可以通过Google图书搜索平台促进作品的销量,同时参与广告分成,获得额外的收入。

3、网民能免费获得更多的信息。同时,支付一定的费用后在网上就能获得资料,免除奔波图书馆的烦恼。

很多音乐网站都提供30秒试听服务,这个试听服务侵权了么?版权所有人为什么没有意见?因为这是一种双赢的策略。

图书预览也可以效仿音乐试听,盈利前景是可以预测的。

阴谋?

谷歌今年年初被CCTV整了一次,我现在还记忆犹新。谷歌因为在搜索框里提供关键词提示,而这些关键词提示不加人工干涉,被CCTV的专家们认为谷歌是故意为了吸引流量而做的“违背道德”行为。当时,在谷歌搜索框里输入“儿子”,就会出现“儿子和妈妈好爽啊”等关键词提示。

不知道是专家装傻还是真傻,这些关键词提示都是根据搜索频率决定的,中国网民爱搜索这些东西,责任却在Google身上去了。

CCTV2的《谷歌的无礼颠覆了什么》专题里,其中一位评论员对Google图书搜索表示担忧,他担心Google会故意挑选符合美国价值观的图书进行扫描。这个“担忧”到底暗示了什么,稍微动脑就能想到了。

同时,新华网人民网(该网站可能含有恶意软件,有可能会危害您的电脑)相继出现抨击谷歌的舆论,醉翁之意在哪里,也是稍微动脑就能想到的。

(更新)人民网的无耻反击

2009年10月23日下午17:47分补充更新:

新华网刚刚发布一篇题为《谷歌标明"人民网读书频道可能含有恶意软件"? 》的新闻,内容主要认为Google不满人民网大面积报道Google图书搜索侵权行为,从而将人民网读书频道标记为“该网站可能含有恶意软件,有可能会危害您的电脑。”,摘录部分内容:

从谷歌已经无法直接点击进入人民网读书频道了。记者随后向人民网了解情况,据读书频道负责人介绍,这个情况他们也 发现了,已经有不少读者反映此事。但通过技术部门诊断,人民网读书频道页面完全正常,没有任何相关恶意软件。“况且读书频道与其他频道共用一台服务器,为 何只有读书频道被注明含有恶意软件?谷歌的检索结果里还有一个是繁体的人民网读书频道,点击去其实还是简体版本,就没有提醒含有恶意软件。”

但如何解释谷歌的检索结果?“原因很简单,我们从20日开始关注了谷歌数字图书馆涉嫌侵权中国作家的事情,并且做了相关专题。21日就被如此恶意封杀了”,读书频道的负责人解释到。

众所周知,Google搜索结果对恶意链接的判断,数据是来自第三方的StopBadware,Google将一个网站标示为可能含有恶意软件是因为发现了该网站里确实存在恶意代码,为了保护搜索者的安全,它就加上了那样一句标识。

那么,人民网读书频道的负责人的回答是无耻还是无知,相信大家可以有一个非常清晰的判断。

附:Google对人民网读书频道页面的安全诊断报告

247 条评论

  1. ……我觉得Google还是先应该同中国作家商量过之后再扫描,毕竟这方面在中国国内没有相关协议或者法律法规,所以无论Google的协议再合理,也不能自作主张啊……

  2. […] 不知道是专家装傻还是真傻,这些关键词提示都是根据搜索频率决定的,中国网民爱搜索这些东西,责任却在Google身上去了。   CCTV2的《谷歌的无礼颠覆了什么》专题里,其中一位评论员对Google图书搜索表示担忧,他担心Google会故意挑选符合美国价值观的图书进行扫描。这个“担忧”到底暗示了什么,稍微动脑就能想到了。   同时,新华网、人民网(该网站可能含有恶意软件,有可能会危害您的电脑)相继出现抨击谷歌的舆论,醉翁之意在哪里,也是稍微动脑就能想到的。   原文链接:http://www.kenengba.com/post/1926.html […]

  3. 其实王小峰那篇也算说明了为什么要有霸王条款了。
    你要是一家一家的谈,估计等几百年后才能谈好。
    那时候google就没有任何优势可言了。
    所以他们要搞霸王条款,这个很眼熟吧?记得以前看报纸,郑百文重组,公告里搞了个默示原则,你不来,就算你同意。
    Google的条款跟那个公告类似,只不过允许随时退出而已。
    不管这事情结果如何,我都要说,发明这个霸王条款的是个天才。

      • 像少年啦飞驰‎ –无预览可用;三重门–无预览可用;长安乱–无预览可用;光荣日–无预览可用;通稿–无预览可用;零下一度–无预览可用;毒–无预览可用;韩寒五年文集–无预览可用;韩寒–无语了可以!

          • 最近经常有记者问我关于谷歌图书馆将包括我在内的几百名作家的图书扫描以后免费放在网络上阅读一事,做何感想。我当时对记者的回应是,这是不可以的,这不是一个大企业的态度。

            后来我仔细查了一下新闻和报纸摘要,发现我自己也不知道我得到的资讯是否全面,所以,这个问题的答案是分成两种的。

            第一种,假设谷歌的确扫描了全书,并在网络上提供免费阅读和下载,那么毫无疑问的,这是非法的。管你事后事前给钱这不重要,这尤其对传统图书作家有巨大的伤害。

            第二种,假设谷歌扫描和摘录了图书的一个部分或者一些段落,并没有提供全文阅读,可显示和阅读的字数控制在一个很小的比例内,我个人并不认为这个行为违法。

            我并不知道谷歌属于哪一种行为,如果是前者,严惩不贷,如果是后者,被人陷害。
            –韩寒

          • 韩寒说的没有错。
            但是google图书的有限预览的比例已经达到了全书的80%-90%,和全书可读已经没有实质差别了。我认为这已经达到了破坏版权的程度了。
            顺便,“但这些预览材料是pdf文件,无法复制。”–>”这些材料是ePub、图片文件,不可复制,可以下载”。
            这网站真是奇了,一帮人都在叫嚣google是个奇站,做啥事都为人类为社会做出贡献,自己国家的搜索引擎、zf、官员都是垃圾。敢情这是个汉奸网站吧?我还真是来错地方了,百度应该把你们网站完全封锁才好,真是看了让人来气。

  4. 其实 Google 数字图书馆的涉及四种人的利益:一是作家,二是出版社,三是竞争对手,四是我等普通网民。对普通网民来讲,谷歌数字图书馆降低了读书成本,是好事;对竞争对手(例如Amozon)来讲,谷歌数字图书馆会影响 Kindle 的销量;对出版社来讲,谷歌图书馆会影响他们图书的销量,尽管有可能提高当当的销量;对作家来讲,不服的可能是嫌谷歌开的价太低。而这四种人中,只有作家和出版社的版权问题妨碍谷歌图书馆的进展,但这些最后都会通过钱解决,所以我们还是等待谷歌数字图书馆明年正式开张吧。

  5. “中国似乎一夜之间就变得十分尊重版权。”
    这句话真够犀利的!
    我们或许早该拿版权问题开开刀了,但是偏偏开刀的对象是最让人抓不住把柄的一方。

    中国的媒体和政府,今年我们闹的笑话够了。
    不要再闹笑话了!
    这样下去,中国网民何以有脸面立足于世界网民之林??

  6. 嘿,我就奇了怪了,说Google盗版的又不是只有中国,又不只有朝廷台,您老对国外的那一大堆诉讼选择性忽视,合着中国人的版权就不是版权了?中国人保护版权就是别有用心了?中国人用个盗版就罪该万死,Google盗版就是理所当然?所以我早就说GFans都有被害妄想症外加装B综合症,凡事Google的都是正确的,凡事质疑Google的都该去死,好了,在下明白了

    还好留言里还有个把脑袋没被驴踢过的兄弟,万幸

    谷歌这么难干脆从中国滚蛋了吧,洋大人怎么过的惯这种童养媳的日子哟,而且我超想知道GFans会不会真的集体移民美利坚,或者悬梁自尽拔剑自刎剪了网线退掉宽带,谷歌如果退出中国,上网还有什么用?楼上有人这么说

     (17)       (134)

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注