近两年来网络信息可谓爆炸,人们期待能够像浏览报纸标题一样,首先快速获取各类新闻摘要 然后再对感兴趣的新闻仔细阅读,于是一个很早就出现的技术开始普及和流行,它就是RSS!目前很多网站上出现了XML或RSS的标志,该标志通过超级链接直接接到一个被称为“RSS feed”的XML文件,这是网站在利用RSS来发布最新消息。这种做法得到大量网站的支持。如今,不仅是Blog,很多新闻、搜索站点都开始对RSS提供支持,比如百度、新华网等。许多科技网站也采用这种做法来发布最新消息,比如今日物理杂志(Physics Today Magazine)、美国物理研究所(The American Institute of Physics)、加拿大生物信息学链接目录(Bioinformatics Links Directory)、生物医学中心(Biomed Central)、PCWord、eweek等[1]。由于大量包括科技网站在内的网站都利用RSS来发布最新消息,所以现在网络上出现了大量的RSS feed,对于图书情报领域而言,这些RSS feed已经成为一种重要的网络资源。而在RSS应用浪潮的推动下,国内图书情报界也已经有少数图书情报网站对RSS进行了应用探索,比如国家科学数字图书馆的中心门户网站和图书情报门户网站、中科院文献情报中心网站、厦门大学图书馆网站和电子科技大学新闻中心网站等都出现了XML或RSS的标志。
1、RSS的内涵及其应用价值
从定义上讲,RSS是一种遵循W3C RDF规范的XML格式,是一种轻量级、多用途、可扩展的元数据描述及联合推广格式。RSS是一种允许互联网站点制作人员为内容融合客户端提供选择性的、汇总过的Web内容的技术规范。从本质上讲,RSS 作为一种通用的内容发布标准,它使得互联网站点制作人员可以将徽标、链接等站点信息以及多个包含标题、内容、链接的内容项目,根据RSS技术规范的定义编译为一个称为RSS feed的汇总文件,用于网站内容的发布与共享。它的作用是发布网站内容摘要 ,也就是用一个页面显示网站最近更新的新闻标题,标题下再列上一些内容摘要 ,如果感兴趣只要单击即可进入网站查看全文,而RSS 使用的格式是XML。用户从支持RSS订阅服务的网站上可以即时获取新闻标题和内容提要,再做出阅读的选择,整个过程和利用OutlookExpress收取电子邮件完全类似。由于有了统一的标准,RSS feed将能被其他网站上的RSS处理程序读取和显示,也可以由RSS阅读器读取供用户阅读和管理。
综上所述,RSS是一种Web内容联合格式,它包含了一套用于描述Web内容的元数据规范,具有一套新颖的能够实现内容整合者、内容提供商和最终用户之间的Web内容(包括元数据)的互动的多赢的联合应用机制。RSS通过RSS Feed来实现内容整合者、内容提供商和最终用户之间的联合。RSS Feed是一种XML内容所生成的数据(包括网站内容元数据,也可以包括网站内容的原文,下文简称为RSS数据),文件的扩展名常为“.RSS或.XML”。RSS Feed由内容提供商直接在网站上利用超级链接来发布,并且常用XML或RSS作为链接标志。当多个内容提供商都在网站上发布了RSS Feed之后,内容整合者可以基于http(s)协议来集中收割整合多个网站的RSS Feed,并为用户提供集中的内容服务,而且用户也可以直接访问RSS Feed。
2、RSS的应用领域及其应用方式
2.1 内容提供商可以利用RSS来发布网站内容
一个网站可以利用RSS元数据规范描述网站内容,创建并在网站中发布RSS Feed从而发布网站内容。网站管理员发布RSS Feed是将其放在网站上,提供访问路径并用XML或RSS链接到该文件,这种统一的发布方式方便了其他个人或机器自动发现、聚合或引用该网站的内容。此外还可以向RSS搜索引擎注册RSS Feed的路径(即URL),以方便RSS搜索引擎自动聚合该Feed。
2.2 内容整合商可以利用RSS来聚合多个网站的内容
聚合是一种自动收割、解析和整合多个网站中发布的RSS Feed的过程。内容整合者可以通过RSS搜索引擎和RSS桌面聚合工具来收割多个网站上的RSS Feed并根据RSS元数据规范来解析Feed,从而整合相应的网站内容。
RSS搜索引擎是一个聚合RSS Feed并提供RSS数据的检索、浏览和订阅等增值服务的Web网站,它面向多个用户提供Web方式的RSS数据服务。此外,还有一部分RSS搜索引擎也提供RSS Feed的注册和有效性验证功能以保证RSS Feed的正确解析。由于目前RSS主要应用于发布网站的最新消息,RSS搜索引擎对大量RSS Feed的聚合,方便了用户获得较为全面的网络动态信息,从而有效地跟踪相关课题的最新动态。在国外,现在已经有一些RSS搜索引擎,如Feedster、Syndic8、Daypop、NewsIsFree、Meerkat等。
RSS桌面聚合工具是一个提供RSS数据的定制、聚合、检索、管理和显示等功能的客户端软件。网络上许多人将RSS桌面聚合工具直接称为“RSS阅读器”,这主要是因为采用它的用户可以直接阅读到更加直观友好的HTML格式的RSS 数据,而不是XML格式的RSS Feed,并且可以直接访问原文信息。但大多数RSS桌面聚合工具不仅仅有阅读的功能,还有更为重要的 RSS Feed聚合的功能,它应该是“RSS阅读器”和“RSS聚合器”的集合体。用户可以定制网站让RSS桌面聚合工具定点、实时地聚合RSS Feed,从而对网络动态信息进行有效地监控。现在国外已经有许多种聚合工具,如FeedReader、NewzCrawle、WinRSS等,有些还支持中文,如FreeDemon和RSSOwl;现在国内也有自行开发的RSS桌面聚合工具,比如“看天下RSS阅读器”、“周博通RSS阅读器”等。
2.3 门户平台可以利用RSS来直接嵌入某个网站上的内容
嵌入是指绑定他人的RSS Feed、通过xlst等技术直接将其转换成HTML格式的信息嵌入本地网站的页面,这是一种实时的、实用的内容整合方式。利用这种方式进行Web内容整合,当被嵌入网站的内容发生变化时能在嵌入网站直接反映出来。许多门户平台所提供的RSS portlet能够直接将来自多个网站的RSS Feed嵌入到本地页面,并且转换成HTML的格式显示。
2.4 个人用户可以利用RSS来直接发现感兴趣的网站内容
用户在网站中点击某个页面中的XML或RSS标志可以直接浏览RSS Feed,从而发现RSS Feed中感兴趣的网站内容。此外,如果事先已经知道该RSS Feed的地址时,也可以直接在浏览器地址栏输入RSS Feed的路径后按回车,也能直接浏览RSS Feed从而发现网站内容。
3、RSS在国内外的应用势头看好Feed
在2004年,美国已经迎来了RSS的飞速发展期。到2004年年底,美国RSS用户数已近千万,而提供RSS订阅服务的网站超过了20万个,RSS终于突破专业领域,开始向大众化的Web服务迈进。英文网站的变化也对国内站点起了潜移默化的影响,那个代表RSS订阅的红色“XML”标记已经越来越多地出现在中文站点上,甚至新华网和新浪网这样的传统新闻门户也抛开了对新技术的顾虑,投入了RSS的怀抱。而“看天下”到硅谷融资及多家VC与“周博通”的主动接触更可以看作是国内RSS市场全面启动的先兆。
现在国内RSS订阅带来的Web浏览效率的极大提升除了使终端用户受益外,也为信息提供商带来了意想不到的好处。由于采用聚合阅读模式,RSS用户开始Web浏览的入口将从以往集中提供信息服务的门户站点改为Bloglines或toPim这样的提供在线RSS订阅服务的内容聚合网站,或者干脆就以“周博通”或“看天下”这样的桌面RSS阅读器作为其上网的入口。如此一来,门户网站导航页的流量就会降低(门户网站的广告收入有很大一部分都体现在其流量最高的上层导航页上),这正是很多网站对RSS持观望态度的最主要原因。而从美国互联网业界对RSS的态度来看,RSS不仅不是门户网站的敌人,甚至还是这些大网站不可或缺的服务模式。未来不支持RSS的网站就会落在下风,甚至是否支持RSS将有可能成为淘汰综合信息门户站点的一个标准。
仔细分析用户的Web浏览行为,不难发现RSS对网站流量的贡献是巨大的。用RSS订阅的好处就是把在网站上无序地寻找目标文章的时间节省了下来,大量节省下来的信息搜寻时间最终又会转化为有效的浏览时间,因而提供了RSS服务的网站不仅不会降低流量,反而会发现其网站的综合流量被RSS带来的有效浏览大幅度提升。例如,计世网从2005年1月4日开始提供RSS订阅服务(rss.ccw.com.cn),就在计世网推出RSS订阅服务一周后,来自RSS订阅的综合流量就已经攀升到计世网各类访问流量之首,并一度占据了计世网总流量的40%。随着IT类垂直门户尝到RSS的甜头,综合类新闻门户迟早也会跟进,像新浪网的很多频道都已经开始支持RSS,其他门户网站不会不动心。除了终端用户和Web内容提供商,RSS应用开发商也已经开始得到回报,甚至硅谷的风险投资商们已经开始四处寻找RSS的投资机会。RSS阅读软件、在线RSS聚合网站、RSS搜索引擎、基于RSS的个人信息管理服务以及RSS聚合媒体等被认为是时下几种最有前途的RSS应用。
2004年,RSS在国内的应用才刚刚亮了相,对国内的网站来说,RSS日益普及会带来两个变化,首先是网站的编辑需要学会写精彩的内文摘要 ,其次就是该考虑是否要把在线广告由导航页向内容页倾斜了。
4、RSS在图书情报领域的应用探讨
不同的人可以通过不同的方式来利用RSS以实现发布、嵌入、聚合或发现网站内容的目的。RSS作为一种简单的内容联合格式,有效地促进了网站内容的利用。因此许多商业人士和研究人员已经在积极地拓展RSS的应用空间。除了应用于网站的最新消息发布之外,有的专家建议在文件更新、书签和其他外部链接、邮件列表、搜索结果、数据库等领域均可以考虑应用RSS。
国内外图书情报界已经开始了对RSS展开应用探索。目前,除了将RSS应用于网站的最新消息的发布、嵌入、聚合或发现之外,国内外图书情报界还进行了其他应用探索。比如,英国剑桥大学联合利华分子信息学中心、伦敦皇家学院化学系以及荷兰Nijmegen大学分析化学实验室研究人员还研究了如何将RSS1.0规范与CML(化学标记语言,Chemical Markup Language)结合起来,用以实现一种基于元数据的提示服务(a metadata based alerting service)。他们称这种融合的元数据格式为“CML RSS”,它可以用来实现分子最新信息的呈现[10]。除此之外,RSS在图书情报界还具有其他更为广泛的应用空间,如:
4.1 在信息门户中利用RSS整合和发布资源
信息门户是一种内容整合技术之一,现在已经比较成熟。但是目前许多信息门户的资源都是通过人工去发现、收集、描述,这不仅影响了信息门户的资源建设速度,也限制了信息门户的资源报导的时效性。信息门户可以考虑通过聚合RSS Feed来发现和整合其他网站的内容,信息门户自身也可以将资源特别是最新资源用RSS来描述通过RSS Feed发布,以供用户聚合从而发现本门户的资源。这点可以参考Yahoo News的实践,它已经支持将所收录的新闻资源通过RSS Feed的方式提供。
4.2 在图书馆网站中利用RSS发布新书通告
新书通告是许多图书馆网站都会发布的信息,RSS技术用在这里有一个非常显着的优势:读者可以不登录图书馆网站也能发现新书信息,并且可以同时聚合来自多个图书馆网站的新书信息。这种应用非常激动人心,如果全国的图书馆网站都支持这一功能,则还可以考虑构建基于RSS的全国的新书通告搜索引擎,这将大大方便图书馆的读者发现最新的图书信息并且知道在哪个图书馆有收藏。如果每个出版社也用RSS来发布新书通告,那么不仅读者,连图书馆也可以享受上述便利[10]。
4.3 在图书馆网站中利用RSS发布图书馆的服务和资源摘要
图书馆最关键、最实质的两样东西是资源和服务。用户需要了解图书馆到底提供哪些资源和服务,才能选择适合自己的资源和服务。许多图书馆采用的办法是在图书馆的网站中说明本馆的资源和服务,但是由于网站风格以及内容呈现设计思路各方面的不一致,一个用户在图书馆网站中,特别是在面对多个界面迥异的图书馆网站时,要全面地发现这些图书馆到底提供哪些资源和服务、其中哪些符合自己的需要就很不容易。如果图书馆都能用RSS来描述本馆的资源和服务、生成RSS Feed并在图书馆网站上发布,则用户可以利用RSS桌面聚合工具从多个图书馆网站聚合此类RSS Feed,并且还可以利用聚合工具的检索服务从中检索出所需资源和服务的线索,这有益于用户快速发现和利用图书馆的资源和服务。
4.4 在数据库服务网站中利用RSS发布新增的资源摘要
当前很多数据库的内容都是动态的,更新时间非常短,如果一个用户要查新必须逐一访问和查找多个数据库,这对用户来说费时又麻烦。如果数据库提供商能用RSS来描述数据库中新增的资源、生成RSS Feed并在数据库服务网站上发布该Feed,那么用户便可以在本地利用桌面聚合工具同时聚合、浏览或检索多个数据库的新增内容,在发现相关的信息时又可以直接访问服务器获取原文信息(如果Feed中不包含原文),这可以节省用户的时间和精力。
4.5 利用RSS Feed来跟踪重要网站,辅助情报研究
情报研究人员在追踪情报时经常需要定点跟踪多个重要机构或其他相关网站。许多网站发布最新信息的目的是希望该信息广为传播从而得到充分的利用,因此他们会考虑采用RSS来发布最新信息,比如NewlsFree新闻搜索引擎的16329个来源网站中的绝大部分都支持RSS[11]。基于RSS可以为情报研究人员提供定点、实时地跟踪相关Web网站的最新信息,从而获取相应的情报。中科院文献情报中心已经开发了一个基于RSS的科技信息聚合系统以方便情报研究人员跟踪相关的Web科技信息[12]。
5、结语:图书情报界应该积极有效地探索RSS在图书情报领域的应用
目前RSS已经在网站的最新消息发布方面得到了广泛的采用,RSS Feed已经成为网络上重要资源,免费的开放的RSS搜索引擎和RSS桌面聚合工具也已经出现。RSS是一种既简单又实用的技术,它所提供的Web内容联合方案可行并且已经获得应用,因此,图书情报界应该对RSS投以必要的关注,积极有效地探索RSS在图书情报领域的应用。
中文RSS频道相关网址
1 中文RSS综合新闻频道:
新浪网RSS频道聚合 http://rss.com.cn/finance/index.shtml
新华网RSS聚合新闻服务 http://www.xinhuanet.com/rss.htm
百度新闻 http://www.baidu.com/search/rss.html
网典新闻索引站 http://www.netcull.com
焦点新闻 http://www.xasa.com/news/cn/
看天下个人信息门户 http://www.kantianxia.com/
2 中文RSS IT类频道:
中文MSDN每周快递 http://www.microsoft.com/china/msdn/
计算机世界RSS聚合资讯订阅 http://rss.ccw.com.cn/
CSDN Blog http://blog.csdn.net/default.html
先锋软件新闻 http://www.pcpchina.com/klip/pcpnews_software.xml
网易下载中心 http://dl.exam8.com/rss/rss.xml
博客中国 http://www.blogchina.com/xml/
3 中文RSS搜索引擎:
FeedsS http://www.feedss.com/
FeedSearch http://feedsearch.net/
八方搜索引擎 http://www.8fang.net/
Grassland http://grassland.cnblog.org/
【参考文献】
[1][10][12] 张会娥.RSS的应用研究[J].图书馆杂志,2005.2.53—57
金雅文.RSS阅读器轻松阅读网络报纸[J].新电脑,2005.3.166—169
眼镜猪.玩转KSS天下信息随心看[J].电脑爱好者,2005.5.63-66
王翌.“功夫”RSS [N].计算机世界,2005.2.28.B16-B18
[11] http://www.newsisfree.com/abont.php?what=feeds.[2005.4.12]