基于子树广度的Web信息抽取
2009-04-04 11:42
253 查看
摘要 提出一种新的网页信息抽取方法,基于子树的广度,可不加区分地对不同科技文献网站的页面信息进行自动抽取。对大量科技文献网站进行信息抽取实验,已应用到甘肃省科技文献共享平台。实验结果证明,该方法能不依赖科技文献网页的来源而自动地抽取相关信息,并能保证较高的数据抽取回召率和查准率。
关键词 子树广度 信息抽取 跨库检索
文章连接http://www.ecice06.com/CN/abstract/abstract11291.shtml
点击下载全文 全文地址:http://www.ecice06.com/CN/article/downloadArticleFile.do?attachType=PDF&id=11291
关键词 子树广度 信息抽取 跨库检索
文章连接http://www.ecice06.com/CN/abstract/abstract11291.shtml
点击下载全文 全文地址:http://www.ecice06.com/CN/article/downloadArticleFile.do?attachType=PDF&id=11291
相关文章推荐
- 基于 Web 的数据挖掘 (自动抽取用 HTML、XML 和 Java 编写的信息)
- 基于Web开发模式的信息抽取
- 基于Web开发模式的信息抽取
- 基于Web开发模式的信息抽取
- 基于 Web 的数据挖掘--自动抽取用 HTML、XML 和 Java 编写的信息
- WEB网页结构化信息抽取技术介绍(网页库级)
- 基于WEB的企业用能信息在线填报系统设计
- 基于web信息管理系统的权限设计分析和总结
- 基于Heritrix+Lucene的搜索引擎构建(3)——页面信息内容抽取
- WEB网页结构化信息抽取技术介绍(网页库级)
- Web信息抽取技术纵览一(转载)
- 基于语义和规则的Web网页细粒度信息抽取方法
- 基于主题的Web信息采集技术研究(六)
- 基于MVC架构的Web学生信息查询
- 基于WEB高校教务数字化信息平台图片展示
- 基于WEB信息管理体系的测试方法和测试技术详述
- 基于主题的Web信息采集技术研究(七)
- A Survey of Web Information Extraction Systems——web信息抽取系统研究现状(一)
- 基于web信息管理系统的权限设计分析和总结
- 基于Web过程模拟的动态Web信息获取