Modeling Temporal Effects of Human Mobile Behavior on Location-Based Social Networks
2014-03-28 21:26
489 查看
文章主要是解决的问题:已知用户的社交关系以及历史签到记录,预测给定时间用户的签到位置。重点提出时间对预测的影响,可以显著提高精度。
数据集:公开Foursquare数据集http://www.public.asu.edu/~hgao16/dataset.html
公开Brightkite数据集http://snap.stanford.edu/data/loc-brightkite.html
对用户移动模式建模(也是对问题的建模):
P(cu = l| t, Hu,t,Su,t)=P(cu = l | r(t), Hu,t, Su,t)∝P(r(t) | cu = l,Hu,t, Su,t) × P(cu = l | Hu,t, Su,t)
其中cu表示用户u的签到位置,Hu,t表示用户u在时间t之前的签到记录,Su,t表示用户u的好友们在时间t之前的签到记录,r(t)是时间状态函数(为考虑行为周期性设计,按week计算的话,有7个状态;按day计算的话,有24个状态)。P(cu
= l | Hu,t, Su,t)是已知用户签到记录,预测用户将在l处签到的概率,单纯的空间建模,这部分研究较多,本文并未对这部分研究,只是直接引用了前人的工作。P(r(t) | cu = l, Hu,t,Su,t)是已知历史记录,以及用户u在位置l签到,预测发生的时间状态,是时间建模,这也是本文的研究重点。
P(r(t) | cu = l, Hu,t,Su,t) =αP(r(t) | cu = l, Hu,t) + (1-α)P(r(t) | cu = l, Su,t)
P(r(t) | cu = l, Hu,t)这部分是反应用户自我偏好,P(r(t) | cu = l, Su,t)这部分反应社交关系
对用户选择的影响,这部分可由下公式计算。
P(r(t) | cu = l, Su,t)= [∑ui∈F(u) sim(u, ui) ×P(r(t) | c ui = l, H ui,t)] / ∑ui∈F(u)
sim(u, ui)
这样整个问题的核心转化为,对P(r(t) | cu = l, Hu,t)建模解决。基于用户的签到历史记录分析,规律如下图所示。
对此,给出两种处理方式:
最简单的统计方式(non-smooth):
基于混合高斯分布模型:
最后,对于r(t)按day或者week的选择问题,给出了一种融合两者的方法:
P(r(t)| cu = l, Hu,t)=P(rd(t), rw(t) | cu= l, Hu,t)=P(rd(t) | cu=l, Hu,t)×P(rw(t) |cu= l,Hu,t)
这样整个问题都予以解决了。实验部分进行了横向(本文模型与文献[2](阅读中的[1])的对比)和纵向的对比(简单统计方法与混合高斯分布模型哪个好?P(r(t)
| cu = l, Su,t)的选择是否合理,α如何选择?考虑P(cu = l| t, Hu,t,Su,t)的合理性,对效果有何改进?)。
自我感想:文本的模型非常好,实验部分也很充分。本文的基础假设就是用户的行为都是周期性的,所以其对于那些非周期性的预测必然不准,那么我们的模型是否对用户行为先分类(周期性与非周期性),然后再进行建模。另外,在选择混合高斯分布这一处理方式,是否有更好的选择?最后,模型并未考虑签到的顺序性!!这点是可以改进之处!
数据集:公开Foursquare数据集http://www.public.asu.edu/~hgao16/dataset.html
公开Brightkite数据集http://snap.stanford.edu/data/loc-brightkite.html
对用户移动模式建模(也是对问题的建模):
P(cu = l| t, Hu,t,Su,t)=P(cu = l | r(t), Hu,t, Su,t)∝P(r(t) | cu = l,Hu,t, Su,t) × P(cu = l | Hu,t, Su,t)
其中cu表示用户u的签到位置,Hu,t表示用户u在时间t之前的签到记录,Su,t表示用户u的好友们在时间t之前的签到记录,r(t)是时间状态函数(为考虑行为周期性设计,按week计算的话,有7个状态;按day计算的话,有24个状态)。P(cu
= l | Hu,t, Su,t)是已知用户签到记录,预测用户将在l处签到的概率,单纯的空间建模,这部分研究较多,本文并未对这部分研究,只是直接引用了前人的工作。P(r(t) | cu = l, Hu,t,Su,t)是已知历史记录,以及用户u在位置l签到,预测发生的时间状态,是时间建模,这也是本文的研究重点。
P(r(t) | cu = l, Hu,t,Su,t) =αP(r(t) | cu = l, Hu,t) + (1-α)P(r(t) | cu = l, Su,t)
P(r(t) | cu = l, Hu,t)这部分是反应用户自我偏好,P(r(t) | cu = l, Su,t)这部分反应社交关系
对用户选择的影响,这部分可由下公式计算。
P(r(t) | cu = l, Su,t)= [∑ui∈F(u) sim(u, ui) ×P(r(t) | c ui = l, H ui,t)] / ∑ui∈F(u)
sim(u, ui)
这样整个问题的核心转化为,对P(r(t) | cu = l, Hu,t)建模解决。基于用户的签到历史记录分析,规律如下图所示。
对此,给出两种处理方式:
最简单的统计方式(non-smooth):
基于混合高斯分布模型:
最后,对于r(t)按day或者week的选择问题,给出了一种融合两者的方法:
P(r(t)| cu = l, Hu,t)=P(rd(t), rw(t) | cu= l, Hu,t)=P(rd(t) | cu=l, Hu,t)×P(rw(t) |cu= l,Hu,t)
这样整个问题都予以解决了。实验部分进行了横向(本文模型与文献[2](阅读中的[1])的对比)和纵向的对比(简单统计方法与混合高斯分布模型哪个好?P(r(t)
| cu = l, Su,t)的选择是否合理,α如何选择?考虑P(cu = l| t, Hu,t,Su,t)的合理性,对效果有何改进?)。
自我感想:文本的模型非常好,实验部分也很充分。本文的基础假设就是用户的行为都是周期性的,所以其对于那些非周期性的预测必然不准,那么我们的模型是否对用户行为先分类(周期性与非周期性),然后再进行建模。另外,在选择混合高斯分布这一处理方式,是否有更好的选择?最后,模型并未考虑签到的顺序性!!这点是可以改进之处!
相关文章推荐
- [文章摘要]On the semantic annotation of places in location-based social networks
- LSTM对比GRU:Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling
- 输入法论文阅读一:Effects of Language Modeling and its Personalization on Touchscreen Typing Performance
- Friendship and mobility: user movement in location-based social networks
- A Simple GPS Application Based on Microsoft.WindowsMobile.Samples.Location
- CHANGING BEHAVIOR BASED ON THE VALUE OF AN ENUMERATED TYPE(ZT)
- 论文笔记:Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling
- 【分享】Stanford Dataset全集之Location-based online social networks
- Friendship and Mobility :User Movement In Location-Based Social Networks(2013.10.10)
- LSTM对比GRU:Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling
- ※Modeling Human Location Data with Mixtures of Kernel Densities
- 读Extracting Urban Patterns from Location-based Social Networks
- HAProxy Installation and Configuration on CentOS 6.4 to Mitigate The Effects of Abusive Clients--转
- Codeforces Round #433 (Div. 2, based on Olympiad of Metropolises) A
- Codeforces Round #433 (Div. 2, based on Olympiad of Metropolises)
- Codeforces Round #433 (Div. 2, based on Olympiad of Metropolises) D. Jury Meeting(贪心)
- (OK) New location of last_kmsg on Android 6.0 and above: /sys/fs/pstore/console-ramoops
- On the future of neural networks
- How to restore ASM based OCR after complete loss of the CRS diskgroup on Linux/Unix systems [ID 1062
- [论文笔记] Money, glory and cheap talk: analyzing strategic behavior of contestants in simultaneous crowdsourcing contests on TopCoder.com (WWW, 2010)