您的位置:首页 > Web前端

Modeling Temporal Effects of Human Mobile Behavior on Location-Based Social Networks

2014-03-28 21:26 489 查看
文章主要是解决的问题:已知用户的社交关系以及历史签到记录,预测给定时间用户的签到位置。重点提出时间对预测的影响,可以显著提高精度。

数据集:公开Foursquare数据集http://www.public.asu.edu/~hgao16/dataset.html

公开Brightkite数据集http://snap.stanford.edu/data/loc-brightkite.html

对用户移动模式建模(也是对问题的建模):

P(cu = l| t, Hu,t,Su,t)=P(cu = l | r(t), Hu,t, Su,t)∝P(r(t) | cu = l,Hu,t, Su,t) × P(cu = l | Hu,t, Su,t)

其中cu表示用户u的签到位置,Hu,t表示用户u在时间t之前的签到记录,Su,t表示用户u的好友们在时间t之前的签到记录,r(t)是时间状态函数(为考虑行为周期性设计,按week计算的话,有7个状态;按day计算的话,有24个状态)。P(cu
= l | Hu,t, Su,t)是已知用户签到记录,预测用户将在l处签到的概率,单纯的空间建模,这部分研究较多,本文并未对这部分研究,只是直接引用了前人的工作。P(r(t) | cu = l, Hu,t,Su,t)是已知历史记录,以及用户u在位置l签到,预测发生的时间状态,是时间建模,这也是本文的研究重点。

 




P(r(t) | cu = l, Hu,t,Su,t) =αP(r(t) | cu = l, Hu,t) + (1-α)P(r(t) | cu = l, Su,t)

 P(r(t) | cu = l, Hu,t)这部分是反应用户自我偏好,P(r(t) | cu = l, Su,t)这部分反应社交关系

对用户选择的影响,这部分可由下公式计算。

P(r(t) | cu = l, Su,t)= [∑ui∈F(u) sim(u, ui) ×P(r(t) | c ui = l, H ui,t)] / ∑ui∈F(u)
sim(u, ui)

这样整个问题的核心转化为,对P(r(t) | cu = l, Hu,t)建模解决。基于用户的签到历史记录分析,规律如下图所示。



对此,给出两种处理方式:
最简单的统计方式(non-smooth):
基于混合高斯分布模型:

最后,对于r(t)按day或者week的选择问题,给出了一种融合两者的方法:

P(r(t)| cu = l, Hu,t)=P(rd(t), rw(t) | cu= l, Hu,t)=P(rd(t) | cu=l, Hu,t)×P(rw(t) |cu= l,Hu,t)

这样整个问题都予以解决了。实验部分进行了横向(本文模型与文献[2](阅读中的[1])的对比)和纵向的对比(简单统计方法与混合高斯分布模型哪个好?P(r(t)
| cu = l, Su,t)的选择是否合理,α如何选择?考虑P(cu = l| t, Hu,t,Su,t)的合理性,对效果有何改进?)。

自我感想:文本的模型非常好,实验部分也很充分。本文的基础假设就是用户的行为都是周期性的,所以其对于那些非周期性的预测必然不准,那么我们的模型是否对用户行为先分类(周期性与非周期性),然后再进行建模。另外,在选择混合高斯分布这一处理方式,是否有更好的选择?最后,模型并未考虑签到的顺序性!!这点是可以改进之处!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  LBSN 用户行为预测
相关文章推荐