Google图书搜索的是与非

阅读时间 11 分钟,快速阅读仅需 4 分钟。

最近“Google图书搜索”成了热门的话题,在过去的10多天里,“谷歌图书”、“Google图书”等词的搜索频率大大提高。原因是中国一些作家、作协和CCTV联合起来,认为Google擅自将有著作权的图书扫描上网侵犯了作家们的权利。和李彦宏出现在春晚之前CCTV对百度发起猛烈攻势一样,这次CCTV再次联合新华网等官媒对Google进行谴责。一些不明真相的记者也随之附和。

Google图书搜索本来并不引人注意,这回CCTV又给Google带来流量了。

Google图书搜索概况

Google图书搜索是Google一个非常有特色的服务,Google通过与图书馆、出版社、作家合作,将图书扫描存档,然后在网上提供搜索和预览。

前面这句话说得这么啰嗦是因为“扫描”、“上网”、“预览”是3个不同的概念。在没有得到出版社或作者许可,Google不会大面积提供图书的预览,甚至不会提供预览,即便它已经将一本图书扫描存档。

Google图书搜索的数据来源:

(1)图书馆

Google和一些知名的图书馆合作,将其收藏的图书索引在图书搜索中。

对于受版权保护的图书,Google图书搜索里会提供片段预览或不提供预览,比如王小峰这本书、张抗抗这本书。而对于不受版权保护的图书,搜索者可以阅读和下载整本图书。

(2)出版商

同时,Google还与一些出版商和作者达成协议,他们的图书也会出现在Google图书搜索上。和图书馆计划中受版权保护的图书一样,这些图书会提供很小的片段预览,以帮助搜索者决定是否购买该书。

Google图书搜索提供预览的方式:

1、无预览

在出版者或作者明确要求不允许提供任何预览的情况下,Google图书搜索只提供图书的书评、作者、ISBN等周边信息。如《Harry Potter》。

2、摘录预览

对于有版权的图书,Google提供图书的片段预览,这些预览由两三行字组成,而且是不可复制的图片。例如抗议声很大的张抗抗老师的这本书

3、有限预览

在得到出版社或作者许可的情况下,Google会提供一本书的有限预览,有限预览比摘录预览提供更多公开的内容,比如徐静蕾这本书,至少一半的页面是可以预览的。但这些预览材料是pdf文件,无法复制

4、全书预览

如果一本书没有版权、版权已经失效、出版社或作者允许公开,Google会提供这本书的全书预览,比如《论语》。

抄袭内容满天飞的中国互联网不一样,Google提供的每种预览方式都会包括书籍的出版社、作者等权利信息。

世界图书馆

Google之所以要扫描图书无非有2个目的:

增强自身的数据,让其搜索立于不败之地

商业公司当然要首先考虑自己的利益,图书里包含的信息比互联网上的更专业可靠。

让图书检索变得更简单,构建世界图书馆

写过论文的朋友肯定知道翻查资料的痛苦,如果所有的图书都能在网上检索,事情会变得轻松很多。即便不能下载,知道某条信息位于某本书的哪一页也极大地方便了后续查找。

大学图书馆一般都有书目检索系统,里面可能会包含维普数据库、万方数据库等,但这些数据库是远远不够的,同时因为技术原因,搜索结果并不理想,甚至搜索缓慢。

因此,构建一个世界性的、资料大而全的数字图书馆是有必要的,这不但可以让知识永久保存下来(试想纸质图书什么时候会湮灭掉,但电子数据几乎不会丢失),更重要的是,人们可以更方便地查找资料。如果人们愿意,可以以一定的价格购买检索出来的纸质图书或电子文档。

而要构建这样一个数字图书馆,要么由联合国来筹划,要么就是由利益驱动的商业公司来构建。明白到这一点,就不难理解为什么Google要推出图书搜索。

纠纷

前面说到,Google图书搜索里的内容的其中一个来源是合作图书馆。前些年,数位作家和出版社联合起诉Google,他们认为Google在没有获得他们授权的情况下擅自制作电子版图书是侵权的。

Google之所以这么做,因为Google认为根据美国版权法“公平使用(Fair Use)”的信条是允许的。于是Google提供了从图书馆扫描出来的版权图书的片段预览。

图:图书片段预览

这场关于版权的诉讼一直到了今年才有了结,双方同意和解,正是这一和解协议引起了国内一些好事的人注意,从而掀起了“反对谷歌侵权”的风暴。中国似乎一夜之间就变得十分尊重版权。

和解协议

Google与作家、出版社达成了和解协议,协议仅在美国生效,根据和解协议,作家或出版社可以要求Google不扫描特定著作,或将已经扫描的书籍从Google图书搜索里移除。而如果作家和出版社不提出排除或除外请求,Google将享有以下权利:

1、继续数字化图书

2、向公共机构出售对电子书籍数据库的订阅

3、出售对个别书籍的网上查阅

4、出售在书籍的插页做广告

5、显示书籍预览或片段

6、显示书籍的简介、目录等周边信息

或许我们会有疑问,这不是霸王条约么?为什么作家和出版社愿意和Google达成这样的霸王条约?

因为根据和解协议,作家和出版社将会获得较大的利益

1、作家和出版社可以决定版权图书以何种方式展示:全书预览、收费预览(价格也是可以自行决定的)。

2、Google图书搜索收入63%将支付给版权所有人,这些收入包括前面提到的广告、出售等。

3、在一定程度上增加销量。

4、获得至少60美元的赔偿。

其实60美元的赔偿不算什么,基本上可以忽略,作家和出版社愿意达成协议,很大程度上是看中了收入的分成,用过Google Adsense的人肯定知道,Adsense广告收入是很可观的

如果你身在美国,你将能看到Google图书上的收费阅读功能,因为这个和解协议适用于美国境内。

中国作家的抗议

《新京报》2009年10月15日报道中国“文著协抗议谷歌侵权”,报道的主要内容如下:

中国文字著作权协会常务副总干事张洪波表示,有570位中国权利人的17922部图书未经授权就被谷歌使用。文著协将代表作者,维护中国版权合法权益。张洪波称,文著协也是今年才知道谷歌数字化图书馆中收录了未经授权的中国图书。

在报道中,《新京报》的记者强调Google只会对版权所有人支付至少60美元的赔偿,而只字不提63%的收入分成。其它媒体的报道也几乎没有提及收入分成这一点,甚至有媒体断章取义称Google仅支付60美元的赔偿。

CCTV2的《今日观察》也跟进了这一事件,报道视频如下:

看不到视频可以点击这里

节目开始时,评论员刘戈做了一个荒唐的比喻,大家可以重点注意一下。

中国作家的抗议其实和当年美国作家的抗议如出一辙,不同的是,中国的媒体将问题扩大化,我甚至认为很多作家根本没有用过Google图书搜索就跟着其他人一起抗议,他们是真正的不明真相、被煽动群众。

默多克式的叫嚷

互联网提高图书销量

传媒大亨默多克经常谴责Google免费在网络上提供新闻搜索,认为那样损害了自己的利益,但新闻集团旗下的所有网站却没有一个在robots.txt里禁止Google,因为默多克即便已经白发满头,他依然能明白,没有了搜索引擎,他旗下的媒体更不好过。所以默多克叫叫也罢了,根本不需要理会。

叫嚷着被侵权的作家也是一样的。在互联网时代,试想如果一部图书在网上无法搜索到任何片段、没有任何介绍,谁会去买?现代人谁有大量的时间到图书馆或书店去翻阅图书?单靠口碑图书就能有很好的销量?

扫描不等于商业用途

Google图书搜索没有提供有著作权的图书的全书预览,反而提供其中的片段和简介,方便搜索者决定是否购买,如果这种做法也是侵权,那提供图书目录的当当网、提供书籍简介的豆瓣网是否也有侵权之嫌?

图:当当网上的张抗抗老师的图书《你是先锋吗

是的,Google和当当网不同,Google还将图书扫描存档了。但是,就像个人购买图书一样,我们可以私下扫描图书、将图书存档到电脑里,这都是允许的,因为我们没有将这些资料用于商业行为。

同样的,Google也没有这样做,它做的事情和图书馆、和我们做的是一样的,它扫描了有著作权的图书,但并没有将这些内容在网上公开,也没有用于商业行为,在权利人没有允许的情况下,提供比当当网还少的图书简介和预览。

既然不能用于商业用途,那么Google扫描图书的用意何在?

长远来看,被扫描的图书肯定是要放到网上的,Google是在等待权利人的允许。

合作才是最好的出路

图书数字化是时代的趋势,纸质媒介终将被淘汰。与其进行诉讼,不如选择合作,作家、出版商与Google进行合作对于双方,乃至于全球网民都是有益的。因为:

1、Google可以极大其数据库,提供更好的搜索服务,获得更大的竞争优势。

2、作家、出版商可以通过Google图书搜索平台促进作品的销量,同时参与广告分成,获得额外的收入。

3、网民能免费获得更多的信息。同时,支付一定的费用后在网上就能获得资料,免除奔波图书馆的烦恼。

很多音乐网站都提供30秒试听服务,这个试听服务侵权了么?版权所有人为什么没有意见?因为这是一种双赢的策略。

图书预览也可以效仿音乐试听,盈利前景是可以预测的。

阴谋?

谷歌今年年初被CCTV整了一次,我现在还记忆犹新。谷歌因为在搜索框里提供关键词提示,而这些关键词提示不加人工干涉,被CCTV的专家们认为谷歌是故意为了吸引流量而做的“违背道德”行为。当时,在谷歌搜索框里输入“儿子”,就会出现“儿子和妈妈好爽啊”等关键词提示。

不知道是专家装傻还是真傻,这些关键词提示都是根据搜索频率决定的,中国网民爱搜索这些东西,责任却在Google身上去了。

CCTV2的《谷歌的无礼颠覆了什么》专题里,其中一位评论员对Google图书搜索表示担忧,他担心Google会故意挑选符合美国价值观的图书进行扫描。这个“担忧”到底暗示了什么,稍微动脑就能想到了。

同时,新华网人民网(该网站可能含有恶意软件,有可能会危害您的电脑)相继出现抨击谷歌的舆论,醉翁之意在哪里,也是稍微动脑就能想到的。

(更新)人民网的无耻反击

2009年10月23日下午17:47分补充更新:

新华网刚刚发布一篇题为《谷歌标明"人民网读书频道可能含有恶意软件"? 》的新闻,内容主要认为Google不满人民网大面积报道Google图书搜索侵权行为,从而将人民网读书频道标记为“该网站可能含有恶意软件,有可能会危害您的电脑。”,摘录部分内容:

从谷歌已经无法直接点击进入人民网读书频道了。记者随后向人民网了解情况,据读书频道负责人介绍,这个情况他们也 发现了,已经有不少读者反映此事。但通过技术部门诊断,人民网读书频道页面完全正常,没有任何相关恶意软件。“况且读书频道与其他频道共用一台服务器,为 何只有读书频道被注明含有恶意软件?谷歌的检索结果里还有一个是繁体的人民网读书频道,点击去其实还是简体版本,就没有提醒含有恶意软件。”

但如何解释谷歌的检索结果?“原因很简单,我们从20日开始关注了谷歌数字图书馆涉嫌侵权中国作家的事情,并且做了相关专题。21日就被如此恶意封杀了”,读书频道的负责人解释到。

众所周知,Google搜索结果对恶意链接的判断,数据是来自第三方的StopBadware,Google将一个网站标示为可能含有恶意软件是因为发现了该网站里确实存在恶意代码,为了保护搜索者的安全,它就加上了那样一句标识。

那么,人民网读书频道的负责人的回答是无耻还是无知,相信大家可以有一个非常清晰的判断。

附:Google对人民网读书频道页面的安全诊断报告

247 条评论

  1. 其实做过电子政务系统的话就会明白gogole在中国的难处。部分局长啥都不懂,但是年底的时候又要写年总结,要政绩。于是就会随便找一两个东西来开火。同理在季报月报甚至周报也会有这种情况,所以见怪不怪。畸形的用户+强势甚至无脑式的监管造就了让人哭笑不得的应用。

    • 这个我曾经做过甲方,折腾了不少你这样的人。
      深有感触。
      最后我自己都受不了辞职了。

      其实,有些电子政务什么的,乙方也不见得比那些个局长专业,我曾经就见过连html都不会的所谓 “架构工程师”。

      跟他们一说话,我就崩溃了。

      感情我在跟一群二百五一起工作。。囧。

      • 这个肯定有,第一,在政府部门做的人,有很多都是靠关系进去的,起码在我接触过的客户里面(某省某局信xx合处尤甚);此外,能做政府项目的公司,没有一定关系也是搞不到的。因此,两方结合就产生出一堆政绩工程。小弟之前的那个就是,偌大的投入,但实际上是没用的。验收的时候还提出几个概念上就不靠谱的东西。

        还好,准备离了,受不了。

        • 没错没错。
          就说我以前那个地方,某某局。

          他们工作的时候,桌上都有两台电脑。
          一台是内网,号称是保密的;另一台是外网,号称是极度危险的。
          但实际情况是,内网里边系统和杀毒软件得不到升级,病毒木马最多;外网电脑虽然也可以号称是病毒库,但总比内网情况好一些,问题很容易上网解决。

        • 这个局里的网络速度非常快,下载什么的基本上都是1m/s的,看电影不用下载直接点开就看。有人上班,非常忙,上班第一件事打开电脑,然后打开播放器。。。然后到点儿吃饭,一天过去了,然后下班,还说很疲惫。

        • 虽说这某局里网络环境非常好,但是大多数领导的电脑都是闲置不用的,甚至有些电脑直接摆在地上作为文件架子。

          为什么呢?

          原因有2个:
          1、会多。大领导们天天开会,用疲于奔命来形容一点都不为过。有时候开会一直开到第二天4-5点钟,然后第二天早上起来接着还有乱七八糟的、让人晕头转向的、昏昏欲睡的会,根本无暇顾及上网或者网上办公。所以,大领导办公室里边肯定有床,有卧室的。基本上都会有。确实忙。
          2、他们根本不知道如何使用电脑。甚至不知道什么是开机按钮、电源线。更别提什么上网了。

        • 说完领导,再说小兵们。
          我没有认真总结过,只是大致的分一下,大概分成那么几类吧。

          1、确实做点事的,这种人确实有,不过或多或少都有一些老好人倾向,善于左右逢源,协调各方利益,夹缝中求生存。
          2、什么事都不做的,很简单,就是刚才说的那些个上班看电影的那些。
          3、巴结领导的。这种人是危害最大的,人人都不喜欢,但人人都怕遇到这种人。这种人,一方面讨好上级,上级的指示言听计从,无论什么直接说:”没问题,保证完成任务“。另一方面打压下级,因为事情反正不必自己亲自去做,任何上级下达的指示,都交由下级完成,让下级想办法,他坐享其成。
          任何下级有什么不满情况,他会恶人先告状,先把这个不听话的下级搞死再说。然后对上级封锁消息,不让上级知道任何他工作上的失误。还对下级威胁:”你先股不想干了?“。

  2. 我认为是故意找茬,一直搞到google认为在中国无法生存,主动离开,这样封杀就顺理成章了。因为google总是提供先进的技术,让信息的交流和获取更加的容易,而这,,在天朝是很危险的。CCAV只是帮凶,顺便刮点油,虽然它不差钱。

    • 没这么说,只是这件事Google是对的。
      Google办事很严苛的,早先Google日本出了乱子胡搞,Google就把日本公司的网页排名PR值给降了下去,算是严于自律吧!跟《三国》里诸葛先生的自贬有一拼!我也是年轻人,没见过外面世界,不过还是不要把外面想太好。上面不见得就是危言耸听的。

回复 摸奶摸屄 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注