用腾讯的技术实现自己的搜索和大数据分析
2015-12-03 15:56
399 查看
用腾讯的技术实现自己的搜索和大数据分析
2015-12-03 17:30:34 【大 中 小】 发表评论
此前,腾讯云推出了两款全新云服务,分别是腾讯云搜索服务和腾讯文智大数据分析服务。众所周知搜索技术一直以来都是互联网界最具挑战和技术含量的领域之一,包括当下十分热门的人工智能技术也多半是有搜索技术演化而来。而大数据分析更是这一技术又一热门应用的例证。而这两个服务的开放更凸显了腾讯开放的决心。
云搜索顾名思义,就是把搜索技术能力开发给中小型互联网创业企业来使用。企业可以通过平台为自己的网站、应用添加功能强大的搜索功能插件。其效果不亚于百度搜索。
而腾讯文智则是基于自然语言处理技术、数据挖掘技术对海量数据进行分析的工具。同时提供定制化服务。你想分析什么就是分析什么,我们拥有互联网1000亿海量数据储备。可以帮助企业在市场营销分析,用户定位、产品销售预测、用户对产品的评价摘要归纳。用户对企业品牌的认知度。竞争对手分析等等多个领域提供定制化服务。
布局前沿技术,建立智能计算与搜索实验室
腾讯智能计算与搜索实验室成立于2015年,成立的目的是结合学术力量和行业力量,连接符合行业发展趋势的先进科技与互联网产品。该实验室目前专注于四大研究方向:搜索技术、自然语言处理、数据挖掘和人工智能。
我们或许可以想象这样的一个图景:实验室通过搜索技术汇集网友的海量搜索信息;再用自然语言处理技术将海量用户的搜索语句拆分成词、句等模块并理解其意思,得到以大数据呈现的海量分析结果;最后再通过数据挖掘和人工智能领域技术对大数据进行自动的分析处理,输出实时计算结果、趋势分析等。
为了实现研究目的,实验室的研究人员汇集了腾讯内外部优秀的科研人才。对内,实验室组织腾讯公司技术与工程事业群里有学术志向的员工参与研究工作;对外,邀请了业界专家学者担任顾问。同时,腾讯还积极地与哈工大,中科大等高校展开合作。多方研究人员合力奠定了实验室厚重的理论基础。
在此基础之上,腾讯依托于自身的业务资源和海量数据做出了深入的研究,并将研究数据及时地应用到了腾讯的各项业务中。目前,研究成果已经成功应用于微信、QQ、QQ音乐、QQ视频等产品之中。接下来通过腾讯云,实验室的两大产品云搜和文智都将开放给行业使用。
腾讯云搜:一站式搜索服务平台
移动互联网时代,人们使用移动应用的时间越来越多。但相对互联网页面而言,移动应用是一个个信息“孤岛”,传统网络搜索引擎无法抓取其内容和内部使用情况。这就需要更适合移动互联网、功能更强大的搜索引擎。
云搜是腾讯智能计算与搜索实验室对外开放的第一个产品,基于腾讯在搜索领域多年的技术积累,对公司内部各大垂直搜索业务搜索需求进行高度抽象、整合,并且把搜索引擎组件化、平台化、服务化,最终形成成熟的搜索对外开放能力。云搜,可以为移动应用开发者和网站站长提供一站式搜索托管服务。
云搜功能丰富而简单易用,客户不需要关注云搜的运行原理和维护方式,只需简单接入即可。此外,云搜还为用户提供了专属的定制服务。例如搜索是依托于数据进行的,云搜为用户提供可视化的数据定制服务,包括可视化的数据预处理和离线排序定制能力。
搜索结果产生之后要进行排序,排序的结果决定了搜索引擎的优劣。在排序方面,云搜同样提供了定制功能,即用户可根据自己的应用特性选择匹配的打分库模版,同时能够通过友好的可视化界面自定义排序表达式,充分定制自己的个性化搜索服务,获得更加合理的搜索排序结果。
除了在基本功能上可定制,云搜还提供了多种高级武器:联想词推荐、高级纠错、人工干预、按域检索、个性化分词等附件组建功能。
腾讯文智:一站式中文语义分析开放平台
文智中文语义开放平台基于并行计算系统和分布式爬虫平台,一站式满足用户NLP、转码、抽取、全网数据抓取等需求。用户能够基于平台对外提供的API实现搜索、推荐、舆情、挖掘等语义分析应用,也能够通过深入合作定制产品特色的语义分析解决方案。
文智平台包含四大模块,第一是词法类模块,当得到一个句子的时候,它可以完成智能分词。即把一个句子拆成几个部分,每个部分由一个词组成。紧接着词法类模块会将所有的词做词性标注,分为名词、动词、形容词等。此外,该模块还包含实体识别功能,目前支持游戏、人名、机构等实体的识别。
第二类模块是句法类模块,目前包含短串纠错,同义词扩展等功能。
第三类模块是篇章类模块,该模块可以从短文中提供关键词并具备情感分析、自动摘要、分类等功能。也就是说针对这篇文章,篇章类模块可以提取文章的关键词,并根据关键词得出文章内容所属的领域,比如美食类、旅游类、健康类等。此外,还能分析出文章的正面情绪与负面情绪的占比。因此篇章类模块可应用于文章的智能分类和舆情分析等领域。
第四类模块是下载类模版,即帮助用户一站式实现网页抓取、转码、结构化抽取功能。
基于这些功能强大的模块,文智可以给客户提供强大的中文语义分析功能。
腾讯云搜、文智都是腾讯智能计算与搜索实验室的拳头产品,代表的是当下互联网时代的前沿技术。现在,腾讯通过云计算将前沿技术能力开放给全行业,让创业团队都能装备上互联网巨头级别的前沿技术积累,这样无保留的开放势必可以为开发者提供有力支持,给行业带来新的变化
2015-12-03 17:30:34 【大 中 小】 发表评论
此前,腾讯云推出了两款全新云服务,分别是腾讯云搜索服务和腾讯文智大数据分析服务。众所周知搜索技术一直以来都是互联网界最具挑战和技术含量的领域之一,包括当下十分热门的人工智能技术也多半是有搜索技术演化而来。而大数据分析更是这一技术又一热门应用的例证。而这两个服务的开放更凸显了腾讯开放的决心。
云搜索顾名思义,就是把搜索技术能力开发给中小型互联网创业企业来使用。企业可以通过平台为自己的网站、应用添加功能强大的搜索功能插件。其效果不亚于百度搜索。
而腾讯文智则是基于自然语言处理技术、数据挖掘技术对海量数据进行分析的工具。同时提供定制化服务。你想分析什么就是分析什么,我们拥有互联网1000亿海量数据储备。可以帮助企业在市场营销分析,用户定位、产品销售预测、用户对产品的评价摘要归纳。用户对企业品牌的认知度。竞争对手分析等等多个领域提供定制化服务。
布局前沿技术,建立智能计算与搜索实验室
腾讯智能计算与搜索实验室成立于2015年,成立的目的是结合学术力量和行业力量,连接符合行业发展趋势的先进科技与互联网产品。该实验室目前专注于四大研究方向:搜索技术、自然语言处理、数据挖掘和人工智能。
我们或许可以想象这样的一个图景:实验室通过搜索技术汇集网友的海量搜索信息;再用自然语言处理技术将海量用户的搜索语句拆分成词、句等模块并理解其意思,得到以大数据呈现的海量分析结果;最后再通过数据挖掘和人工智能领域技术对大数据进行自动的分析处理,输出实时计算结果、趋势分析等。
为了实现研究目的,实验室的研究人员汇集了腾讯内外部优秀的科研人才。对内,实验室组织腾讯公司技术与工程事业群里有学术志向的员工参与研究工作;对外,邀请了业界专家学者担任顾问。同时,腾讯还积极地与哈工大,中科大等高校展开合作。多方研究人员合力奠定了实验室厚重的理论基础。
在此基础之上,腾讯依托于自身的业务资源和海量数据做出了深入的研究,并将研究数据及时地应用到了腾讯的各项业务中。目前,研究成果已经成功应用于微信、QQ、QQ音乐、QQ视频等产品之中。接下来通过腾讯云,实验室的两大产品云搜和文智都将开放给行业使用。
腾讯云搜:一站式搜索服务平台
移动互联网时代,人们使用移动应用的时间越来越多。但相对互联网页面而言,移动应用是一个个信息“孤岛”,传统网络搜索引擎无法抓取其内容和内部使用情况。这就需要更适合移动互联网、功能更强大的搜索引擎。
云搜是腾讯智能计算与搜索实验室对外开放的第一个产品,基于腾讯在搜索领域多年的技术积累,对公司内部各大垂直搜索业务搜索需求进行高度抽象、整合,并且把搜索引擎组件化、平台化、服务化,最终形成成熟的搜索对外开放能力。云搜,可以为移动应用开发者和网站站长提供一站式搜索托管服务。
云搜功能丰富而简单易用,客户不需要关注云搜的运行原理和维护方式,只需简单接入即可。此外,云搜还为用户提供了专属的定制服务。例如搜索是依托于数据进行的,云搜为用户提供可视化的数据定制服务,包括可视化的数据预处理和离线排序定制能力。
搜索结果产生之后要进行排序,排序的结果决定了搜索引擎的优劣。在排序方面,云搜同样提供了定制功能,即用户可根据自己的应用特性选择匹配的打分库模版,同时能够通过友好的可视化界面自定义排序表达式,充分定制自己的个性化搜索服务,获得更加合理的搜索排序结果。
除了在基本功能上可定制,云搜还提供了多种高级武器:联想词推荐、高级纠错、人工干预、按域检索、个性化分词等附件组建功能。
腾讯文智:一站式中文语义分析开放平台
文智中文语义开放平台基于并行计算系统和分布式爬虫平台,一站式满足用户NLP、转码、抽取、全网数据抓取等需求。用户能够基于平台对外提供的API实现搜索、推荐、舆情、挖掘等语义分析应用,也能够通过深入合作定制产品特色的语义分析解决方案。
文智平台包含四大模块,第一是词法类模块,当得到一个句子的时候,它可以完成智能分词。即把一个句子拆成几个部分,每个部分由一个词组成。紧接着词法类模块会将所有的词做词性标注,分为名词、动词、形容词等。此外,该模块还包含实体识别功能,目前支持游戏、人名、机构等实体的识别。
第二类模块是句法类模块,目前包含短串纠错,同义词扩展等功能。
第三类模块是篇章类模块,该模块可以从短文中提供关键词并具备情感分析、自动摘要、分类等功能。也就是说针对这篇文章,篇章类模块可以提取文章的关键词,并根据关键词得出文章内容所属的领域,比如美食类、旅游类、健康类等。此外,还能分析出文章的正面情绪与负面情绪的占比。因此篇章类模块可应用于文章的智能分类和舆情分析等领域。
第四类模块是下载类模版,即帮助用户一站式实现网页抓取、转码、结构化抽取功能。
基于这些功能强大的模块,文智可以给客户提供强大的中文语义分析功能。
腾讯云搜、文智都是腾讯智能计算与搜索实验室的拳头产品,代表的是当下互联网时代的前沿技术。现在,腾讯通过云计算将前沿技术能力开放给全行业,让创业团队都能装备上互联网巨头级别的前沿技术积累,这样无保留的开放势必可以为开发者提供有力支持,给行业带来新的变化
相关文章推荐
- 阿里云、腾讯云、UCloud、华为云云主机对比测试报告
- 搜狗百度360市值齐跌:搜索引擎们陷入集体焦虑?
- 本人即将筹备败家日志,敬请期待!
- 康诺云推出三款智能硬件产品,为健康管理业务搭建数据池
- IE:使用搜索助手
- 腾讯 Tencent Traveler v3.4 下载
- MySQL中使用innobackupex、xtrabackup进行大数据的备份和还原教程
- C++深度优先搜索的实现方法
- 基于文本的搜索
- php实现搜索一维数组元素并删除二维数组对应元素的方法
- 使用Sphinx对索引进行搜索
- asp 多关键词搜索的简单实现方法
- C#使用foreach语句搜索数组元素的方法
- JavaScript中数组的排序、乱序和搜索实现代码
- 腾讯QQ php程序员面试题目整理
- C#编程实现Excel文档中搜索文本内容的方法及思路
- sqlserver中在指定数据库的所有表的所有列中搜索给定的值
- 可以用来搜索当前页面内容的js代码
- 全文搜索和替换