Google图书搜索的是与非

阅读时间 11 分钟,快速阅读仅需 4 分钟。

最近“Google图书搜索”成了热门的话题,在过去的10多天里,“谷歌图书”、“Google图书”等词的搜索频率大大提高。原因是中国一些作家、作协和CCTV联合起来,认为Google擅自将有著作权的图书扫描上网侵犯了作家们的权利。和李彦宏出现在春晚之前CCTV对百度发起猛烈攻势一样,这次CCTV再次联合新华网等官媒对Google进行谴责。一些不明真相的记者也随之附和。

Google图书搜索本来并不引人注意,这回CCTV又给Google带来流量了。

Google图书搜索概况

Google图书搜索是Google一个非常有特色的服务,Google通过与图书馆、出版社、作家合作,将图书扫描存档,然后在网上提供搜索和预览。

前面这句话说得这么啰嗦是因为“扫描”、“上网”、“预览”是3个不同的概念。在没有得到出版社或作者许可,Google不会大面积提供图书的预览,甚至不会提供预览,即便它已经将一本图书扫描存档。

Google图书搜索的数据来源:

(1)图书馆

Google和一些知名的图书馆合作,将其收藏的图书索引在图书搜索中。

对于受版权保护的图书,Google图书搜索里会提供片段预览或不提供预览,比如王小峰这本书、张抗抗这本书。而对于不受版权保护的图书,搜索者可以阅读和下载整本图书。

(2)出版商

同时,Google还与一些出版商和作者达成协议,他们的图书也会出现在Google图书搜索上。和图书馆计划中受版权保护的图书一样,这些图书会提供很小的片段预览,以帮助搜索者决定是否购买该书。

Google图书搜索提供预览的方式:

1、无预览

在出版者或作者明确要求不允许提供任何预览的情况下,Google图书搜索只提供图书的书评、作者、ISBN等周边信息。如《Harry Potter》。

2、摘录预览

对于有版权的图书,Google提供图书的片段预览,这些预览由两三行字组成,而且是不可复制的图片。例如抗议声很大的张抗抗老师的这本书

3、有限预览

在得到出版社或作者许可的情况下,Google会提供一本书的有限预览,有限预览比摘录预览提供更多公开的内容,比如徐静蕾这本书,至少一半的页面是可以预览的。但这些预览材料是pdf文件,无法复制

4、全书预览

如果一本书没有版权、版权已经失效、出版社或作者允许公开,Google会提供这本书的全书预览,比如《论语》。

抄袭内容满天飞的中国互联网不一样,Google提供的每种预览方式都会包括书籍的出版社、作者等权利信息。

世界图书馆

Google之所以要扫描图书无非有2个目的:

增强自身的数据,让其搜索立于不败之地

商业公司当然要首先考虑自己的利益,图书里包含的信息比互联网上的更专业可靠。

让图书检索变得更简单,构建世界图书馆

写过论文的朋友肯定知道翻查资料的痛苦,如果所有的图书都能在网上检索,事情会变得轻松很多。即便不能下载,知道某条信息位于某本书的哪一页也极大地方便了后续查找。

大学图书馆一般都有书目检索系统,里面可能会包含维普数据库、万方数据库等,但这些数据库是远远不够的,同时因为技术原因,搜索结果并不理想,甚至搜索缓慢。

因此,构建一个世界性的、资料大而全的数字图书馆是有必要的,这不但可以让知识永久保存下来(试想纸质图书什么时候会湮灭掉,但电子数据几乎不会丢失),更重要的是,人们可以更方便地查找资料。如果人们愿意,可以以一定的价格购买检索出来的纸质图书或电子文档。

而要构建这样一个数字图书馆,要么由联合国来筹划,要么就是由利益驱动的商业公司来构建。明白到这一点,就不难理解为什么Google要推出图书搜索。

纠纷

前面说到,Google图书搜索里的内容的其中一个来源是合作图书馆。前些年,数位作家和出版社联合起诉Google,他们认为Google在没有获得他们授权的情况下擅自制作电子版图书是侵权的。

Google之所以这么做,因为Google认为根据美国版权法“公平使用(Fair Use)”的信条是允许的。于是Google提供了从图书馆扫描出来的版权图书的片段预览。

图:图书片段预览

这场关于版权的诉讼一直到了今年才有了结,双方同意和解,正是这一和解协议引起了国内一些好事的人注意,从而掀起了“反对谷歌侵权”的风暴。中国似乎一夜之间就变得十分尊重版权。

和解协议

Google与作家、出版社达成了和解协议,协议仅在美国生效,根据和解协议,作家或出版社可以要求Google不扫描特定著作,或将已经扫描的书籍从Google图书搜索里移除。而如果作家和出版社不提出排除或除外请求,Google将享有以下权利:

1、继续数字化图书

2、向公共机构出售对电子书籍数据库的订阅

3、出售对个别书籍的网上查阅

4、出售在书籍的插页做广告

5、显示书籍预览或片段

6、显示书籍的简介、目录等周边信息

或许我们会有疑问,这不是霸王条约么?为什么作家和出版社愿意和Google达成这样的霸王条约?

因为根据和解协议,作家和出版社将会获得较大的利益

1、作家和出版社可以决定版权图书以何种方式展示:全书预览、收费预览(价格也是可以自行决定的)。

2、Google图书搜索收入63%将支付给版权所有人,这些收入包括前面提到的广告、出售等。

3、在一定程度上增加销量。

4、获得至少60美元的赔偿。

其实60美元的赔偿不算什么,基本上可以忽略,作家和出版社愿意达成协议,很大程度上是看中了收入的分成,用过Google Adsense的人肯定知道,Adsense广告收入是很可观的

如果你身在美国,你将能看到Google图书上的收费阅读功能,因为这个和解协议适用于美国境内。

中国作家的抗议

《新京报》2009年10月15日报道中国“文著协抗议谷歌侵权”,报道的主要内容如下:

中国文字著作权协会常务副总干事张洪波表示,有570位中国权利人的17922部图书未经授权就被谷歌使用。文著协将代表作者,维护中国版权合法权益。张洪波称,文著协也是今年才知道谷歌数字化图书馆中收录了未经授权的中国图书。

在报道中,《新京报》的记者强调Google只会对版权所有人支付至少60美元的赔偿,而只字不提63%的收入分成。其它媒体的报道也几乎没有提及收入分成这一点,甚至有媒体断章取义称Google仅支付60美元的赔偿。

CCTV2的《今日观察》也跟进了这一事件,报道视频如下:

看不到视频可以点击这里

节目开始时,评论员刘戈做了一个荒唐的比喻,大家可以重点注意一下。

中国作家的抗议其实和当年美国作家的抗议如出一辙,不同的是,中国的媒体将问题扩大化,我甚至认为很多作家根本没有用过Google图书搜索就跟着其他人一起抗议,他们是真正的不明真相、被煽动群众。

默多克式的叫嚷

互联网提高图书销量

传媒大亨默多克经常谴责Google免费在网络上提供新闻搜索,认为那样损害了自己的利益,但新闻集团旗下的所有网站却没有一个在robots.txt里禁止Google,因为默多克即便已经白发满头,他依然能明白,没有了搜索引擎,他旗下的媒体更不好过。所以默多克叫叫也罢了,根本不需要理会。

叫嚷着被侵权的作家也是一样的。在互联网时代,试想如果一部图书在网上无法搜索到任何片段、没有任何介绍,谁会去买?现代人谁有大量的时间到图书馆或书店去翻阅图书?单靠口碑图书就能有很好的销量?

扫描不等于商业用途

Google图书搜索没有提供有著作权的图书的全书预览,反而提供其中的片段和简介,方便搜索者决定是否购买,如果这种做法也是侵权,那提供图书目录的当当网、提供书籍简介的豆瓣网是否也有侵权之嫌?

图:当当网上的张抗抗老师的图书《你是先锋吗

是的,Google和当当网不同,Google还将图书扫描存档了。但是,就像个人购买图书一样,我们可以私下扫描图书、将图书存档到电脑里,这都是允许的,因为我们没有将这些资料用于商业行为。

同样的,Google也没有这样做,它做的事情和图书馆、和我们做的是一样的,它扫描了有著作权的图书,但并没有将这些内容在网上公开,也没有用于商业行为,在权利人没有允许的情况下,提供比当当网还少的图书简介和预览。

既然不能用于商业用途,那么Google扫描图书的用意何在?

长远来看,被扫描的图书肯定是要放到网上的,Google是在等待权利人的允许。

合作才是最好的出路

图书数字化是时代的趋势,纸质媒介终将被淘汰。与其进行诉讼,不如选择合作,作家、出版商与Google进行合作对于双方,乃至于全球网民都是有益的。因为:

1、Google可以极大其数据库,提供更好的搜索服务,获得更大的竞争优势。

2、作家、出版商可以通过Google图书搜索平台促进作品的销量,同时参与广告分成,获得额外的收入。

3、网民能免费获得更多的信息。同时,支付一定的费用后在网上就能获得资料,免除奔波图书馆的烦恼。

很多音乐网站都提供30秒试听服务,这个试听服务侵权了么?版权所有人为什么没有意见?因为这是一种双赢的策略。

图书预览也可以效仿音乐试听,盈利前景是可以预测的。

阴谋?

谷歌今年年初被CCTV整了一次,我现在还记忆犹新。谷歌因为在搜索框里提供关键词提示,而这些关键词提示不加人工干涉,被CCTV的专家们认为谷歌是故意为了吸引流量而做的“违背道德”行为。当时,在谷歌搜索框里输入“儿子”,就会出现“儿子和妈妈好爽啊”等关键词提示。

不知道是专家装傻还是真傻,这些关键词提示都是根据搜索频率决定的,中国网民爱搜索这些东西,责任却在Google身上去了。

CCTV2的《谷歌的无礼颠覆了什么》专题里,其中一位评论员对Google图书搜索表示担忧,他担心Google会故意挑选符合美国价值观的图书进行扫描。这个“担忧”到底暗示了什么,稍微动脑就能想到了。

同时,新华网人民网(该网站可能含有恶意软件,有可能会危害您的电脑)相继出现抨击谷歌的舆论,醉翁之意在哪里,也是稍微动脑就能想到的。

(更新)人民网的无耻反击

2009年10月23日下午17:47分补充更新:

新华网刚刚发布一篇题为《谷歌标明"人民网读书频道可能含有恶意软件"? 》的新闻,内容主要认为Google不满人民网大面积报道Google图书搜索侵权行为,从而将人民网读书频道标记为“该网站可能含有恶意软件,有可能会危害您的电脑。”,摘录部分内容:

从谷歌已经无法直接点击进入人民网读书频道了。记者随后向人民网了解情况,据读书频道负责人介绍,这个情况他们也 发现了,已经有不少读者反映此事。但通过技术部门诊断,人民网读书频道页面完全正常,没有任何相关恶意软件。“况且读书频道与其他频道共用一台服务器,为 何只有读书频道被注明含有恶意软件?谷歌的检索结果里还有一个是繁体的人民网读书频道,点击去其实还是简体版本,就没有提醒含有恶意软件。”

但如何解释谷歌的检索结果?“原因很简单,我们从20日开始关注了谷歌数字图书馆涉嫌侵权中国作家的事情,并且做了相关专题。21日就被如此恶意封杀了”,读书频道的负责人解释到。

众所周知,Google搜索结果对恶意链接的判断,数据是来自第三方的StopBadware,Google将一个网站标示为可能含有恶意软件是因为发现了该网站里确实存在恶意代码,为了保护搜索者的安全,它就加上了那样一句标识。

那么,人民网读书频道的负责人的回答是无耻还是无知,相信大家可以有一个非常清晰的判断。

附:Google对人民网读书频道页面的安全诊断报告

247 条评论

  1. 他们应该不是不明真相,而是不得不装作不明真相,要不CCTV这场戏还怎么演下去,CCTV还怎么吠下去?至于那些媒体,纯粹是CCTV的狗腿子。
    中青报?一个样,要不它咋活。

  2. 中华人民共和国著作权法第四十七条
    有下列侵权行为的,应当根据情况,承担停止侵害、消除影响、赔礼道歉、赔偿损失等民事责任;同时损害公共利益的,可以由著作权行政管理部门责令停止侵权行为,没收违法所得,没收、销毁侵权复制品,并可处以罚款;情节严重的,著作权行政管理部门还可以没收主要用于制作侵权复制品的材料、工具、设备等;构成犯罪的,依法追究刑事责任:
    (一)未经著作权人许可,复制、发行、表演、放映、广播、汇编、通过信息网络向公众传播其作品的,本法另有规定的除外;

    从法律规定看,复制也是需要许可的,不论是否用于商业目的。“另有规定”里面有个人使用和图书馆少量复制的例外,但是谷歌图书还是和图书馆有差别的。

      • 谷歌图书已经将很多图书扫描为电子版,这不是复制么?60美元的赔偿就是针对这个 未经许可复制 的。至于在网上提供多少内容,是属于 通过信息网络向公众传播 的范畴吧……

        • “在美国,我们最近与图书作者和出版社达成了一项和解协议:向美国读者开放这些未超过版权保护期的图书馆藏书。但这个协议不会影响中文图书在中国的呈现,除非这些图书的著作权人授权我们更多的用途。” “国际用户 因为该协议解决的是发生在美国的诉讼,所以它只对在美国境内访问图书搜索的用户产生直接影响;在其他任何地方,图书搜索体验不会改变。今后,我们希望能与国际行业组织和个人权利持有者合作,让该协议能为全世界用户带来更多好处。”这是GOOGLE公告板上的信息。60美元的赔偿与中国无关,google也没有开放这些未超过版权保护期的中文图书。如果仅因为提供了一句话就要赔偿,那卓越网就得关门歇业了。

          • 对于非中文图书,应该是和中国无关。但是对于中文图书,按照我找到的信息,谷歌对中国的赔偿也采用该和解协议,也即至少60美元+63%分成。
            提供一句话就要赔偿当然是夸张了,但是赔偿的是数字化行为。
            赔偿协议FAQ29:“谷歌在2009年5月5日之前未经同意扫描的作品的权利持有者,有资格获得现金支付,对每一主要作品将支付至少60美元,完整插入内容15 美元以及部分插入内容5美元。“主要作品”是书籍的主要部分(即不包括前言、后记、脚注和其他材料)。”
            张洪波:很多作家认为不是说赔多少钱的问题,应该是谷歌数字图书馆在未经中国权利人的同意和许可的情况下,没有支付著作权使用费这种情况下,就先期擅自扫描使用了中国众多权利人的作品,这种行为本身是一种侵权行为,公然挑战了美国的版权法或者是中美之间的一个知识产权公报。

          • 这是google帮助里面的内容,应该不违反版权法。既然扯不清那就上法院打官司好了,希望google能赢,因为此举可以促进人类文化的保存和进步。
            图书扫描符合版权法吗?
            是的。Google 对图书的使用完全符合版权法的”公平使用”原则以及版权法本身所依据的所有基本准则。版权法的主旨在于确保作者愿意继续写书而出版商愿意继续卖书。通过使图书更容易查找、购买或从图书馆借阅,Google 图书搜索有助于增加作者写书和出版商售书的积极性。为了实现便于读者获得图书这一目标,我们需要制作版权法所允许的图书的数字版本。
            该计划实际上与网络搜索服务非常相似。要为某个网页编制电子索引,就需要为其制作一个副本。要为一本图书编制电子索引,我们就必须为该书制作一个数字版本。与网络搜索服务一样,我们制作副本的目的在于引导人们寻找原始文件本身。
            另外作者可以删除图书。http://tinyurl.com/yff7mbh

          • 我怎么这么愤怒对于那些叫嚣着世界一体化的人呢?
            还促进人类文化的保存和进步
            一整就来两句我爱我的祖国却不爱不爱我们的党
            反动啊
            GFANS我觉得快和那帮东方神起的粉丝一个德行了
            滚吧
            中国不需要你们这帮崇洋媚外的人
            还有这个网站

          • 没地方回复了……
            谷歌图书自己认为扫描没有违反版权法而已,但实际上诉讼与和解的主要目的就是解决未经许可的扫描行为的赔偿问题。
            著作权法全文里面没有找到 公平使用 字眼,大概帮助里提到的是美国 版权法吧……
            赔偿协议FAQ31″权利持有者可以要求谷歌移除他们的一本或多本书籍,如果它们早已被数字化了,或者要求谷歌根本不要对其书籍进行数字化。权利持有者有权将其书籍从谷歌图书馆项目中移除,只要该要求在2011年4月5日当日或之前收到即可。2011年4月5日以后,谷歌将尊重“不数字化”的要求,如果该书在提出要求之日尚未被数字化。”也就是说协议默认规定2011年4月5日之后就不能要求谷歌删除自己作品的数字化版本。
            赔偿协议FAQ65何谓“搜索库”?
            搜索库是一整套全部书籍的图书馆数字副本,与谷歌图书馆项目有关,然而不像图书馆数字副本那样可以被权利持有者移除或撤消。谷歌向宿主网站提供这些数字副本。

        • “谷歌图书已经将很多图书扫描为电子版,这不是复制么?60美元的赔偿就是针对这个 未经许可复制 的。至于在网上提供多少内容,是属于 通过信息网络向公众传播 的范畴吧……”你这是从字面上理解法条,法律上的复制权和信息网络传播权,属于著作财产权,不是著作人身权。判断谷歌行为是否侵权,关键在于是否损害作者的财产权益。目前谷歌的行为首先不是商业行为,其次单纯的扫描,提供图书摘录和基本信息给公众根本无损作者财产权益。我用谷歌图书搜索了韩寒和张抗抗的书,这两位的书根本没法看。这件事肯定和解,打官司根本不行。

  3. 他担心Google会故意挑选符合美国价值观的图书进行扫描
    ===============
    难道意味着google会被进一步水产。。。。。
    在中国太多不明真相却跟着一起疯的群众。。。
    =========
    刚12520发短信过来说我的飞信“多次尝试登录失败”,大家还是小心点吧。。。

  4. 其实我觉得,两方都有点问题。不过做为一个从十六岁就能说是见怪不怪官 僚XX的人,我以为,作协可能还是比较惨的,也许不胡搞瞎搞,就和军 械 所 乐队一样了…

  5. Google图书搜索的是与非…

    最近“Google图书搜索”成了热门的话题,在过去的10多天里,“谷歌图书”、“Google图书”等词的搜索频率大大提高。原因是中国一些作家、作协和CCTV联合起来,认为Google擅自将有著作权的图书扫描上网侵犯了作家们的权利。和李彦宏出现在春晚之前CCTV对百度发起猛烈攻势一样,这次CCTV再次联合新华网等官媒对Google进行谴责。一些不明真相的记者也随之附和。
    Google图书搜索本来并不引人注意,这回CCTV又给Google带来流量了。

     
    一、Google图书搜索概况

    Google图…

  6. 不得不说,Google“用数字形式保存文化”的理想主义口号容易让人想到版权问题

    如果Google books低调一点,商业一点,先学Amazon以图书搜索目录的形式出现,然后提供古籍和经作者授权的电子书,一模一样的事做下来可能什么麻烦都没有。

    另外那个60美元简直就是此地无银三百两
    版权的价值远不止60美元,不侵权就没必要给钱,给钱反倒显得做贼心虚

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注