您的位置:首页 > 其它

Where is also about time A location-distortion model to improve reverse geocoding using behavior-dr

2016-01-12 09:07 507 查看
文章:Where is also about time: A location-distortion model to improve reverse

geocoding using behavior-driven temporal semantic signatures

作者:Grant McKenzie, Krzysztof Janowicz.

来源:Computers, Environment and Urban Systems 54 (2015) 1–13

本文关注反向地理编码(Reverse Geocoding)问题,反向地理编码将地理坐标转换为地址。Web API通常将地理坐标映射为一系列Places Of Interest (POI),例如一点阈值范围内K个最近的POI。但是该问题有如下挑战:查询位置和用点特征代表一个place的不确定性,以及如何将坐标映射为一个综合商业体(如购物商场)中的一个place。本文除了利用距离,还利用时间。利用LBSN发掘geosocial行为来提取出时态语义签名(temporal semantic signatures)。提出一个利用时态语义签名的model来distort
POI的位置,注意这里不改变POI的地理位置,而是查询的时候动态生成POI的新位置。

利用Fousquare的POI签到数据(包含POI类型),对每类POI,统计一周每天24个小时中每个小时的签到数目,再除以该类POI签到总数,为该类POI该小时的temporal probability。对每类POI,其一周的时态概率分布,为其semantic signatures。这里类比了遥感里面的波段和光谱签名。

下图为不同类型POI的一周内每天的时态签名。



下图为不同类型POI一天24小时的时态签名。



为分析什么时段最能代表该签名,利用了信息增益(Informagion gain)的概念来度量这个代表性。

不同类型的POI有不同的时态概率,利用这个信息,来distort POI的空间位置,即根据用户访问一类特点POI的概率来push或者pull POI相对于查询点的位置。

这个模型alter the geographic distance between the query location and each POI by a weighted temporal probability.

下图为四种不同的组合空间和时态信息的模型,包括线性vs非线性,对称vs非对称。



评价方法:

平均倒数排序-the Mean Reciprocal Rank (MRR)

发现rational1方法效果最好。

下图是distort的效果,绿色为拉近了的POI,红色为推远了的POI。





未来工作:

除了利用时态,还利用社交活动行为进行distort。

下图可以看到有很多活动(t代表twitter)发生在该区域类型,因此该查询点也朝向该地点被distort。



当然其它还可以考虑很多隐私:天气情况,节假日、季节影响等。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息