您的位置:首页 > 大数据

用户行为日志分析

2018-03-31 15:52 232 查看
用户行为日志生成渠道:
   Nginx,Ajax
记录用户访问行为日志的原因:
    网站页面的访问量
    网站的黏性
    推荐
用户行为日志内容:

1.访问的系统属性:操作系统,浏览器等等
2.访问特征:点击URL,从哪个url 跳转过来的(referer),跳转页面上停留时间
3.访问信息:session_id,访问ip(访问城市)

用户行为日志分析的意义:
离线数据处理架构:
  1.数据采集
      使用工具:flume工具
  2.数据清洗
    使用工具:Spark,Hive,MapReduce或者分布式计算框架
    清洗完之后的数据可以存放在HDFS中
   3.数据处理

     按照我们的需要进行相应业务的统计和分析
     使用工具:Spark,Hive,MapReduce或者分布式计算框架

   4.数据处理结果入库
     结果存在RDBMS,NoSql

   5.数据可视化展示

     使用工具:ECharts,HUE,Zeppelin
     通过图形化展示的方式展现出来:
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  日志分析 大数据
相关文章推荐