您的位置:首页 > Web前端

漫谈Web Feed、RSS、原文链接和转贴

2014-02-13 12:18 197 查看
Web Feed(网上信息源【注1】)和对应的订阅器(feed reader)是一项在中国和西方境遇大不同的技术,从探讨这样的差别可以得出一些有趣的见解。历史上【注2】网站刚诞生不久,就有人思考以不同的方式来发布信息。传统的模式是网站添加新信息,网民访问网站以浏览和阅读。如果网民感兴趣的是频繁更新的,甚至有时效性的内容,就必须经常访问网站检查是否有更新;或者相反,一个网站或其中的某个主题很少更新,不想错过的网民经常访问的结果是失望。相对于主动访问和检查的方式,一种对网民来说更轻松的被动模式是邮件订阅,一旦某一主题有了新信息,网站就发送邮件给所有感兴趣的订阅用户,邮件客户端会像对其它邮件一样自动检查和提醒用户有新的订阅内容。但是这一方式也有几个缺点:
1. 需要提供用户的电子邮箱,增加了收到垃圾邮件的风险。
2. 多个主题的订阅邮件相互以及和普通邮件混杂显示,除非人工设定邮件规则分类。
3. 用户不想再收到订阅邮件时,需发送一封邮件或者上网取消订阅。
web feed和feed reader两者配合起来能更好地解决此需求。首先网站以某种feed格式,如RSS或Atom发布和更新信息,用户将感兴趣的feed添加进feed reader,reader定期检查feed有无更新。feed的格式一般都是定义好的XML文档,内容包括发布者的信息和数量不定的条目,每个条目都描述了一篇发布的信息,常见的有新闻、博客、音频或视频。条目包含信息的标题,通常还有摘要(虽然不常见但也可以直接包含信息的全文),以及指向信息全文的链接地址等。reader发现feed有更新时,提示用户或者也可以设置为自动下载更新,用户在reader里可以阅读更新的标题和摘要,对有兴趣的条目则可以据链接访问原文。用户浏览网页时,订阅新的网上信息源十分方便,只要点击现在已成为标准的橙底白色无线信号形的RSS图标,将该feed加入习惯的订阅器或者使用许多浏览器自带的订阅器。取消订阅同样方便。用户不必暴露电子邮箱,更新的信息也按照主题陈列。
以上所有仅仅介绍了web feed带来的便利之一,其另一主要功用影响的是网站。传统的模式下,文章、音频和视频这些内容都发布在作者经营或者合作的某家网站上,其他网站(这里姑且称为渠道网站)基于保护著作权的原因一般不能转载,只能以链接援引。如果提供内容的网站想透过其他网站增加己方资源的浏览量,这些渠道网站也希望发布甚至聚合多家源网站的内容,这种合作的想法就是web syndication(网上联合发布)的初衷。syndication(联合发布)的概念源自纸张媒体时代,某位作家、记者或者代理机构将文章或者新闻稿同时提供给多家出版或新闻机构发表。网上信息源技术将这种操作模式移植到互联网上。内容网站发布网上信息源,其他网站读取和嵌入显示在自己的页面里。网民点击信息源的某条内容的链接时,被引回原内容网站。
网上信息源带给内容网站、渠道网站和用户的巨大便利使得它在(中国以外的)互联网上迅速普及。新闻、博客、论坛等网站上RSS图标随处可见,有许多桌面的和web的订阅器可供选择,以至于Firefox、IE、Opera等主流浏览器和Outlook、Lotus Notes等邮件客户端都加入了订阅器的功能。
现在就可以回到本文一开始提到的现象,web feed在国外的网站上十分流行,在国内却显得不温不火甚至小众。新闻和博客网站上那个橙色的RSS图标不那么显眼或者没有,不少消息源不符合格式标准,数据有误或者更新不及时。几款中文web的订阅器在功能、界面上都难以令人满意【注3】。在国内网民中的普及度远不如邮件、搜索引擎等技术。如此反差的背后原因是什么呢?互联网上的新技术、想法和商业模式基本上都是从国外传入,因此国内的应用有时间上的滞后,例如电子邮箱、搜索引擎、电子商务和社交网站。但是网上信息源的未能流行我认为很大程度上不能归因于此,它在国外的成熟应用已超过十年,技术上并不复杂,实施的成本也不高,在中国普及的障碍更多是文化上的。
说明这一点前,可以对比国内外互联网站内容的另一对现象。“转载”、“转贴”是国内大量网站最重要的内容来源之一,大量的商业或者政府网站上刊载的某一领域的专业知识、博客和论坛里随处可分辨的转贴内容,新闻图片更是几乎不可能知道作者是谁,证明了Ctrl+C和Ctrl+V是网上的作者最信赖和喜爱的两组快捷键。负责一点的转载会注明文章来源以至原文地址,很多则简单地申明来源于互联网,甚至根本不标明转载或转贴。而上国外网站的朋友会发现无论是代表机构的网站还是个人发言的博客和论坛,转载和转帖都少见得多,相反原文链接随处可见,援引某机构或某人的话都会注明作者的名称,新闻网页上的图片也会注明来源。国内的很多博客和论坛作者一般把转贴当成吸引人气的手段,发达国家的网民无论是作者还是读者更尊重原作者的工作和贡献。如此形成的结果和氛围是:一边任意转载甚至冒用以期获得名声和关注,但由于大家都肆无忌惮,总的阅读量被分散到多个地方。原作者的天赋和努力得不到回报,原载处的阅读量有可能还不如别人的转贴处。读者的利益实际也会受到影响,除了转载往往粗心大意,有脱讹和排版糟糕外,大量的重复增加了读者搜索资料所费的时间和精力(Google的略去内容基本相同的搜索结果确实是个好想法)。另一边,人们不会痴想藉他人的文章沽名,作者只会把精力放在怎样写好文章上,若是被人喜爱,会得到读者和其他网站的链接推荐,扩散开来。创作的权益得到保护,自然受鼓励。读者知道文章的清晰来源,对于查找和确立责任也大有好处。这样一种氛围一方面会让好的作者和文章脱颖而出,惠及作者;另一方面大众建立起来的评价体系让读者更容易找到好东西,读者受益。
上面这段有些冗长的议论,得出的结论自然不是国内外网民和互联网这个特殊群体和领域的特异性。对知识产权法律上的保护和大众的意识是整个国家和国民层级上的差距和问题。表现是涉及多方面的,科学论文、技术专利、软件、文学作品,不良影响自然也存在于各个领域。
回到主题,网上信息源应用的基础是互联网各方尊重原作者的权益,或者以点概面地说,可以创建一个作者权益指数(想到一个英文名称Author Credit Index),等于网上援引链接的数量除以转贴文章的数量,得分越高,原创成分和网民对作者权益的尊重程度越高。在国内互联网此指数较低的情况下,网上信息源技术没有普及就可想而知了。

注1:也有译为消息来源、网源、馈料等等,但都没有取得通行的地位,我个人译为网上消息源。

注2:与很多现在流行的看似年轻的技术一样,或许让人有些意外的是,web feed的源头也可以上溯到很早以前的1995年,彼时互联网和网站刚诞生不久,苹果公司的Ramanathan V. Guha和其他人研发出了一种称为Meta Content Framework的技术,可视为web feed的雏形。1999年3月Dan Libby和Ramanathan V. Guha在Netscape公司设计了RDF Site Summary,也就是后来流行的Rich Site Summary(RSS)的第一个版本0.9,用于在My.Netscape.Com门户上发布信息。不久在1999年7月Dan Libby又推出了RSS 0.91,并将RSS从RDF Site Summary改为代指Rich Site Summary。随后就像JavaScript和cookie一样,网景在发明了这些技术之后,令人遗憾地以先驱者的身份退出了舞台。RSS-DEV Working Group和拥有UserLand Software公司的Dave Winer竞相发布RSS的新版本和声称拥有所有权。在数年的纷争中,RSS不断更新和普及,并且为了避免纠纷,2003年6月一项新的网上联合发布技术Atom被发明了。目前网上这两种技术并存,RSS因其历史更久应用更加广泛。(以上资料大部分来自http://en.wikipedia.org/wiki/Rss#History)

注3:例如CSDN博客的feed就不符合格式标准(通不过http://feedvalidator.org/的校验),新浪博客的feed列出的博文曾和在网页上看到的不一致。豆瓣网上订阅器对这两个博客的消息源都不能够载入,网易订阅器则不能载入前者。用其他一些工具如Firefox的Live Bookmarks则可以。(截至2014-02-13)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: