根据网站相关数据可以考虑做如下方面的研究
2011-05-10 18:44
197 查看
目前,我们可以拿到如下的数据,web server logs 以及相关的业务数据,那么就可以考虑做如下的数据分析:
1.用户分类:
根据用户的行为,判断用户的类型:潜水型、发布信息型、渴望与人交往型、随便看看型等;其中发布信息能产生内容的用户对我们来说意义更大。
2. 户访问路径分析:
用户在web上的访问路径长度、频繁访问的路径/行为、访问路径的预测、用户异常访问和孤立点分析(判断出网站访问异常以及spammer用户的发现)。
3.用户流失预测分析:
根据目前流失用户的信息,预测将会有那些用户流失,流失的原因是什么。
4.各产品之间的联系:
那些产品是用户经常一起访问而在产品设计上两个产品之间联系不大。那些网页是用户经常一起访问,而产品设计上却不相邻等。
5. 预测网站的流量:
分析和预测出未来一个星期的流量、一个月的流量等。
6. 建立OLAP:
构建自己的OLAP,减轻日常繁琐的数据提取和简单的分析工作。
7.竞争对手分析:
竞争对手最新策略动态信息的收集、竞争对手的流量和访问量的估算与分析(具体可以采用Alexa上的流量与本站流量信息进行估算)。主要应该采用情报学的相关理论进行分析。
8.用户群体分析:
那些用户之间联系紧密,可以构成一个群体(好友圈),所有用户在整体上是否能满足6度理论,好友圈里面的核心人物是谁等。
9.明星用户特征分析:
明星用户的年龄、职业、性别、地域、收入等信息,除了访问本站以外,还经常访问那些网站,来本站并留下来的原因是什么等。
10.数据中心展现界面的设计以及性能优化:
常规报表的展现界面是否可以设计的更漂亮些、更灵活、更易用。报表的访问速度是否可以优化等等。
要实现以上的分析,应该具备的基本知识:DM、DW、统计学、perl、php、DB、shell、C/C++、Excle、Web Usaging Mining、SPSS/SAS、R语言、JS、Apache日志等。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/emili/archive/2009/02/06/3865597.aspx
1.用户分类:
根据用户的行为,判断用户的类型:潜水型、发布信息型、渴望与人交往型、随便看看型等;其中发布信息能产生内容的用户对我们来说意义更大。
2. 户访问路径分析:
用户在web上的访问路径长度、频繁访问的路径/行为、访问路径的预测、用户异常访问和孤立点分析(判断出网站访问异常以及spammer用户的发现)。
3.用户流失预测分析:
根据目前流失用户的信息,预测将会有那些用户流失,流失的原因是什么。
4.各产品之间的联系:
那些产品是用户经常一起访问而在产品设计上两个产品之间联系不大。那些网页是用户经常一起访问,而产品设计上却不相邻等。
5. 预测网站的流量:
分析和预测出未来一个星期的流量、一个月的流量等。
6. 建立OLAP:
构建自己的OLAP,减轻日常繁琐的数据提取和简单的分析工作。
7.竞争对手分析:
竞争对手最新策略动态信息的收集、竞争对手的流量和访问量的估算与分析(具体可以采用Alexa上的流量与本站流量信息进行估算)。主要应该采用情报学的相关理论进行分析。
8.用户群体分析:
那些用户之间联系紧密,可以构成一个群体(好友圈),所有用户在整体上是否能满足6度理论,好友圈里面的核心人物是谁等。
9.明星用户特征分析:
明星用户的年龄、职业、性别、地域、收入等信息,除了访问本站以外,还经常访问那些网站,来本站并留下来的原因是什么等。
10.数据中心展现界面的设计以及性能优化:
常规报表的展现界面是否可以设计的更漂亮些、更灵活、更易用。报表的访问速度是否可以优化等等。
要实现以上的分析,应该具备的基本知识:DM、DW、统计学、perl、php、DB、shell、C/C++、Excle、Web Usaging Mining、SPSS/SAS、R语言、JS、Apache日志等。
本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/emili/archive/2009/02/06/3865597.aspx
相关文章推荐
- 一个100万数据(MYSQL)的网站,目前访问速度慢,如果让你优化,你会从哪些方面进行考虑,谈谈你的思路
- 第六题:航天飞行器是一项复杂而又精密的仪器,飞行器的损耗主要集中在发射和降落的过程,科学家根据实验数据估计,如果在发射过程中,产生了 x 程度的损耗,那么在降落的过程中就会产生 x2 程度的损耗,如果飞船的总损耗超过了它的耐久度,飞行器就会爆炸坠毁。问一艘耐久度为 h 的飞行器,假设在飞行过程中不产生损耗,那么为了保证其可以安全的到达目的地,只考虑整数解,至多发射过程中可以承受多少程度的损耗?
- 要求可以根据每个学生的成绩进行由高到低的排序如果成绩相等则按照年龄由低到高排序数据的样式如下张三:19:90|李四:20:90|王五:20:80|赵六:21:100
- 大型网站中图片存储方面的相关问题
- 中科院计算所在可信大数据软件技术方面的研究工作【DOC+PPT下载】
- 构建高性能ASP.NET站点 网站优化需要考虑的方面
- GridView根据数据库返回的值,在显示到界面前对相关数据进行处理后显示
- Socket数据发送中信号SIGPIPE及相关errno的研究(转)
- 经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)
- 阿里云ECS数据盘挂载过程 根据不同环境挂载网站目录
- 数据层应该分为两个部分,这样可以更好的“分工”,各自研究自己的功能
- 根据bundle ID获取App Store的APP信息(可用来检测新版本,可以不考虑APP ID了)
- 构建高性能ASP.NET站点 网站优化需要考虑的方面,徐汇区网站设计
- 美国政府研究实验室探索区块链在能源数据测试方面的应用
- 网站内链优化需要考虑的方面
- 经典的机器学习方面源代码库(非常全,数据挖掘,计算机视觉,模式识别,信息检索相关领域都适用的了)
- 可以考虑和借鉴的翻译网站
- oracle 树查询 根据上级查询所有下级,根据下级查询相关上级数据
- 一个 100 万数据( MYSQL )的网站,目前访问速度慢,如果让你优化,你会从哪些方 面进行考虑,谈谈你的思路
- mysql关于根据日期统计月份整合数据的相关语句