用户行为日志分析
2018-03-31 15:52
232 查看
用户行为日志生成渠道:
Nginx,Ajax
记录用户访问行为日志的原因:
网站页面的访问量
网站的黏性
推荐
用户行为日志内容:
1.访问的系统属性:操作系统,浏览器等等
2.访问特征:点击URL,从哪个url 跳转过来的(referer),跳转页面上停留时间
3.访问信息:session_id,访问ip(访问城市)
用户行为日志分析的意义:
离线数据处理架构:
1.数据采集
使用工具:flume工具
2.数据清洗
使用工具:Spark,Hive,MapReduce或者分布式计算框架
清洗完之后的数据可以存放在HDFS中
3.数据处理
按照我们的需要进行相应业务的统计和分析
使用工具:Spark,Hive,MapReduce或者分布式计算框架
4.数据处理结果入库
结果存在RDBMS,NoSql
5.数据可视化展示
使用工具:ECharts,HUE,Zeppelin
通过图形化展示的方式展现出来:
Nginx,Ajax
记录用户访问行为日志的原因:
网站页面的访问量
网站的黏性
推荐
用户行为日志内容:
1.访问的系统属性:操作系统,浏览器等等
2.访问特征:点击URL,从哪个url 跳转过来的(referer),跳转页面上停留时间
3.访问信息:session_id,访问ip(访问城市)
用户行为日志分析的意义:
离线数据处理架构:
1.数据采集
使用工具:flume工具
2.数据清洗
使用工具:Spark,Hive,MapReduce或者分布式计算框架
清洗完之后的数据可以存放在HDFS中
3.数据处理
按照我们的需要进行相应业务的统计和分析
使用工具:Spark,Hive,MapReduce或者分布式计算框架
4.数据处理结果入库
结果存在RDBMS,NoSql
5.数据可视化展示
使用工具:ECharts,HUE,Zeppelin
通过图形化展示的方式展现出来:
相关文章推荐
- 系统API模块——某大型互联网企业用户上网行为日志分析系统
- Hive基于搜狗搜索的用户日志行为分析
- 基于用户行为的数据分析与挖掘+分布式日志管理系统
- 云计算项目实战——某大型互联网企业用户上网行为日志分析系统 PPT下载
- 2017云栖大会·杭州峰会:《在线用户行为分析:基于流式计算的数据处理及应用》之《流数据处理:通过StreamSQL分析视频日志》篇
- Spark日志分析项目Demo(4)--RDD使用,用户行为统计分析
- 某大型互联网企业用户上网行为日志分析系统——云计算项目实战
- 自学大数据:Hive基于搜狗搜索的用户日志行为分析
- 用户行为分析业务系统日志处理方案
- 项目背景介绍——某大型互联网企业用户上网行为日志分析系统
- [session] 多视图建模与半监督学习:应用于海量用户数据挖掘与行为分析
- 行为日志分析java简单实现方法
- Spark项目之电商用户行为分析大数据平台之(三)大数据集群的搭建
- Spark项目之电商用户行为分析大数据平台之(十一)JSON及FASTJSON
- 大数据之“用户行为分析”
- MongoDB固定集合的使用(基于Ruby)-记录用户日志行为
- 深入浅出Spark机器学习实战(用户行为分析)_spark机器学习
- 《海量日志数据分析与应用》之数据加工:用户画像
- 创业公司做数据分析(三)用户行为数据采集系统 (转)
- 实战智能推荐系统(6)-- 用户行为分析