寻找与网页内容相关的图片(一) 开放图谱计划
2015-03-19 20:04
316 查看
要想找到网页里那些图片和网页的内容相关绝不是一件容易的事,网页里有各式各样的图片,广告啦、推荐其他网页的缩略图啦、logo等等,可是在与网页相关的图片少之又少。
过去大家都觉得没必要有文字就足够了,可到了信息大爆炸的时代,面对海量网页,人们早已没有了兴趣。第一个不得不面临这个问题地是社交网站,人们除了自己发微博以外,更多的时候也许只在转微博、分享网页。如果有一张网页的缩略图,便有可能极大提高链接被点击的可能性,进而提高网站的活跃程度(当然这只是瞎想)。
也不是没可能从网页找到这样一张图片,这需要耗费很大的经历(占用很多CPU),并且不完美,不能保证找到的图片是100%正确。
于是FACEBOOK最为全球社交网络的老大,提出了开放图谱计划(Open Graph)。在网页的头部,额外加上<meta>标签,来传递网页的关键词、摘要等信息,其中也就包括了一张缩略图。
百科上的说明是这样子的
Open Graph通讯协定(Protocol)本身是一种制定一套Metatags的规格,用来标注你的页面,告诉我们你的网页代表哪一类型的现实世界物件。另 一伙伴网站,即Amazon旗下的Internet Movie Database(IMDb),将用这个Open Graph Protocol为每一部电影标注页面。按下IMDb上的“赞”按钮,就会自动把那部电影加入Facebook使用者profile中的“最爱的电影”。
Facebook已和Yahoo、Twitter合作采用OAuth 2.0认证标准。Graph API翻新了Facebook的平台程序代码,让Facebook里的每个物件都拥有独特的ID。通过Open Graph把其他社交网站建构的网络给连接起来,将创造一个更聪明、更与社交连接、更个人化也更具语意意识的网络。
虽然互联网没有国界,很遗憾的是,在中国加入开放图谱计划的,只有最具社交基因的新浪。这也就是说,在中国这种方式行不通。
这更能说明的是,如果你想要找的与网页相关的图片,网站在这方面绝不会配合你。每一个网站几乎都采用了完全不同的结构来展示文字和图片。如果想要找到一种终极解决方案就只能另寻它法了。
过去大家都觉得没必要有文字就足够了,可到了信息大爆炸的时代,面对海量网页,人们早已没有了兴趣。第一个不得不面临这个问题地是社交网站,人们除了自己发微博以外,更多的时候也许只在转微博、分享网页。如果有一张网页的缩略图,便有可能极大提高链接被点击的可能性,进而提高网站的活跃程度(当然这只是瞎想)。
也不是没可能从网页找到这样一张图片,这需要耗费很大的经历(占用很多CPU),并且不完美,不能保证找到的图片是100%正确。
于是FACEBOOK最为全球社交网络的老大,提出了开放图谱计划(Open Graph)。在网页的头部,额外加上<meta>标签,来传递网页的关键词、摘要等信息,其中也就包括了一张缩略图。
<meta property="og:type" content="article" /> <meta property="og:title" content="将出席博鳌亚洲论坛2015年年会" /> <meta property="og:description" content="将出席博鳌亚洲论坛2015年年会" /> <meta property="og:url" content="http://news.sina.com.cn/c/2015-03-19/175331624500.shtml" /> <meta property="og:image" content="" />
百科上的说明是这样子的
Open Graph通讯协定(Protocol)本身是一种制定一套Metatags的规格,用来标注你的页面,告诉我们你的网页代表哪一类型的现实世界物件。另 一伙伴网站,即Amazon旗下的Internet Movie Database(IMDb),将用这个Open Graph Protocol为每一部电影标注页面。按下IMDb上的“赞”按钮,就会自动把那部电影加入Facebook使用者profile中的“最爱的电影”。
Facebook已和Yahoo、Twitter合作采用OAuth 2.0认证标准。Graph API翻新了Facebook的平台程序代码,让Facebook里的每个物件都拥有独特的ID。通过Open Graph把其他社交网站建构的网络给连接起来,将创造一个更聪明、更与社交连接、更个人化也更具语意意识的网络。
虽然互联网没有国界,很遗憾的是,在中国加入开放图谱计划的,只有最具社交基因的新浪。这也就是说,在中国这种方式行不通。
这更能说明的是,如果你想要找的与网页相关的图片,网站在这方面绝不会配合你。每一个网站几乎都采用了完全不同的结构来展示文字和图片。如果想要找到一种终极解决方案就只能另寻它法了。
相关文章推荐
- 寻找与网页内容相关的图片(三)网易新闻与qq空间的做法
- 又完成一个网页抽取器(企业相关网页)--实现了网页要素,企业要素抽取,内容相关度,网页质量评分
- 背景图片随网页内容自动调整大小
- java下载网页内容和网络图片
- Python保存一个网页的全部内容(包含链接内的图片等等)
- 图片下载器下载网页内容及网页图片,节省时间
- 网页里控制图片大小的相关代码
- PHP抓取网页内容,获取链接绝对路径和图片绝对路径
- asp.net防盗图片 也可用于防治网络爬虫等爬取网页内容
- 利用htmpParser获取网页内容以及网页上的图片地址
- ASP.NET网页打印(只打印相关内容/自写功能)
- C#将网页内容转换成图片保存到本地( webbrowser 可应用于B/S结构中)
- HTML to Image in C#指定网页地址,获取内容为图片
- libcurl保存网页内容以及图片
- asp.net防盗图片 也可用于防治网络爬虫等爬取网页内容
- 与网页内容抽取相关的文献
- QtWebkit中如何将网页内容转为图片
- 网页内容,图片及连接 抓取通用类
- Phpcms V9 栏目页,单网页,内容页 调用父栏目图片