您的位置:首页 > 其它

使用NewsML组织企业新闻资源

2008-05-24 01:17 337 查看
google_ad_client = "pub-8800625213955058";

/* 336x280, 创建于 07-11-21 */

google_ad_slot = "0989131976";

google_ad_width = 336;

google_ad_height = 280;

//

在互联网上最受欢迎的信息之一就是新闻。从CNN到Slashdot,许多人将互联网作为他们主要的新闻来源。许多现有的新闻站点使用一个称为Rich Site Summary(RSS)的协议来联合他们的新闻头条和文章。现在有一个新的叫做NewsML的XML协议来完成这项工作。

开发人员将会因为以下的几个原因对NewsML感兴趣。首先,对于入口开发人员来说,他们可以使用NewsML来管理他们企业联合的新闻资源。同样,对于内容开发人员来说,他们可以使用NewsML来描述他们的面向新闻的多媒体格式的内容。在上面两种情况下,NewsML提供了一种丰富的XML解决方案来描述企业联合的多媒体数据。

什么是NewsML

NewsML实际上是一种描述多媒体新闻内容的XML文法。这里的多媒体指的是美联社或者路透社那种典型的在线新闻,私人拥有的新闻视频以及其他的一些多媒体数据。使用NewsML,内容辛迪加可以基于他们的新闻资源提供一种统一的格式。

NewsML由IPTC(the International Press and Telecommunication)维护,NewsML的最初想法来源于路透社,是他们将这个想法提交给了IPTC。

下面的Listing 1展示了一个来自IPTC的有效载荷NewsML样例:

Listing 1: SportResult.xml

<?xml version = "1.0" encoding = "UTF-8"?>

<!DOCTYPE NewsML PUBLIC "urn:newsml:iptc.org:20001006:NewsMLv1.0:1"

"./DTD/NewsMLv1.0.dtd">

<?xml-stylesheet type="text/xsl"href="./stylesheets/IPTCNewsML.xsl"?>

<NewsML>

<Catalog Href = "./catalog/mycatalog.xml"/>

<NewsEnvelope>

<DateAndTime>20001006</DateAndTime>

</NewsEnvelope>

<NewsItem>

<Identification>

<NewsIdentifier>

<ProviderId>iptc.org</ProviderId>

<DateId>20001006</DateId>

<NewsItemId>SportsResultSample</NewsItemId>

<RevisionId PreviousRevision = "0" Update ="N">1</RevisionId>

<PublicIdentifier>urn:newsml:iptc.org:20001006:SportsResultSample:1

</PublicIdentifier>

</NewsIdentifier>

</Identification>

<NewsManagement>

<NewsItemType FormalName = "News" Scheme ="IptcNewsItemType"/>

<FirstCreated>20001006</FirstCreated>

<ThisRevisionCreated>20001006</ThisRevisionCreated>

<Status FormalName = "Usable" Scheme ="IptcStatus"/>

</NewsManagement>

<NewsComponent>

<ContentItem>

<DataContent><![CDATA[<FootballResult><Hteam>Arsenal</Hteam><Hscore>1

</Hscore><Ateam>Chelsea</Ateam><Ascore>2</Ascore></FootballResult>]]>

</DataContent>

</ContentItem>

</NewsComponent>

</NewsItem>

</NewsML>

资源和格式

NewsML为打包来自不同来源的企业组合的多媒体新闻数据提供了包装机制。在NewsML内部,也许会有多种指定的新闻内容格式。一种格式称为News Industry Text Format,它被用来描述基于文本的新闻文章。另一个正在处于上升势头的格式是Sports Markup Language,或者称为SportsML,它是一种描述体育成绩和统计数据的协议。

实际上有很多种方法来接受新闻资源。一种简单的模式是使用SMTP,这种技术将NewsML数据报发送到电子邮箱之中;另一种模式是用FTP,这种技术将NewsML数据报发送到一个FTP站点。一个更实时地方法是使用一个代理直接接受NewsML地有效载荷。这个代理可以是一个简单的通过TCP socket接受数据的服务器,也可以内嵌在Web service这种。

工具

只有少数工具可以和NewsML资源和文档协同工作。用户可以从不同的来源获得样例文档和资源,这些来源可以是路透社或者道琼斯。SourceForge.net主导了NewsML的工具包,这是一个基于Java的工具集。

很多网站都有NewsML的其他信息,包括规范、DTD和其他的文档。IPTC网站是个查找相关网站的不错地方。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: