您的位置：首页 > Web前端

Modeling Temporal Effects of Human Mobile Behavior on Location-Based Social Networks

2014-03-28 21:26 489 查看

文章主要是解决的问题：已知用户的社交关系以及历史签到记录，预测给定时间用户的签到位置。重点提出时间对预测的影响，可以显著提高精度。

数据集：公开Foursquare数据集http://www.public.asu.edu/~hgao16/dataset.html

公开Brightkite数据集http://snap.stanford.edu/data/loc-brightkite.html

对用户移动模式建模（也是对问题的建模）：

P(cu = l| t, Hu,t,Su,t)=P(cu = l | r(t), Hu,t, Su,t)∝P(r(t) | cu = l,Hu,t, Su,t) × P(cu = l | Hu,t, Su,t)

其中cu表示用户u的签到位置，Hu,t表示用户u在时间t之前的签到记录，Su,t表示用户u的好友们在时间t之前的签到记录，r(t)是时间状态函数（为考虑行为周期性设计，按week计算的话，有7个状态；按day计算的话，有24个状态）。P(cu
= l | Hu,t, Su,t)是已知用户签到记录，预测用户将在l处签到的概率，单纯的空间建模，这部分研究较多，本文并未对这部分研究，只是直接引用了前人的工作。P(r(t) | cu = l, Hu,t,Su,t)是已知历史记录，以及用户u在位置l签到，预测发生的时间状态，是时间建模，这也是本文的研究重点。

对此，给出两种处理方式：
最简单的统计方式（non-smooth）：
基于混合高斯分布模型：

最后，对于r(t)按day或者week的选择问题，给出了一种融合两者的方法：

P(r(t)| cu = l, Hu,t)=P(rd(t), rw(t) | cu= l, Hu,t)=P(rd(t) | cu=l, Hu,t)×P(rw(t) |cu= l,Hu,t)

这样整个问题都予以解决了。实验部分进行了横向（本文模型与文献[2]（阅读中的[1]）的对比）和纵向的对比（简单统计方法与混合高斯分布模型哪个好？P(r(t)
| cu = l, Su,t)的选择是否合理，α如何选择？考虑P(cu = l| t, Hu,t,Su,t)的合理性，对效果有何改进？）。

自我感想：文本的模型非常好，实验部分也很充分。本文的基础假设就是用户的行为都是周期性的，所以其对于那些非周期性的预测必然不准，那么我们的模型是否对用户行为先分类（周期性与非周期性），然后再进行建模。另外，在选择混合高斯分布这一处理方式，是否有更好的选择？最后，模型并未考虑签到的顺序性！！这点是可以改进之处！

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： LBSN 用户行为预测

相关文章推荐

新的分享

章节导航