Where is also about time A location-distortion model to improve reverse geocoding using behavior-dr
2016-01-12 09:07
507 查看
文章:Where is also about time: A location-distortion model to improve reverse
geocoding using behavior-driven temporal semantic signatures
作者:Grant McKenzie, Krzysztof Janowicz.
来源:Computers, Environment and Urban Systems 54 (2015) 1–13
本文关注反向地理编码(Reverse Geocoding)问题,反向地理编码将地理坐标转换为地址。Web API通常将地理坐标映射为一系列Places Of Interest (POI),例如一点阈值范围内K个最近的POI。但是该问题有如下挑战:查询位置和用点特征代表一个place的不确定性,以及如何将坐标映射为一个综合商业体(如购物商场)中的一个place。本文除了利用距离,还利用时间。利用LBSN发掘geosocial行为来提取出时态语义签名(temporal semantic signatures)。提出一个利用时态语义签名的model来distort
POI的位置,注意这里不改变POI的地理位置,而是查询的时候动态生成POI的新位置。
利用Fousquare的POI签到数据(包含POI类型),对每类POI,统计一周每天24个小时中每个小时的签到数目,再除以该类POI签到总数,为该类POI该小时的temporal probability。对每类POI,其一周的时态概率分布,为其semantic signatures。这里类比了遥感里面的波段和光谱签名。
下图为不同类型POI的一周内每天的时态签名。
下图为不同类型POI一天24小时的时态签名。
为分析什么时段最能代表该签名,利用了信息增益(Informagion gain)的概念来度量这个代表性。
不同类型的POI有不同的时态概率,利用这个信息,来distort POI的空间位置,即根据用户访问一类特点POI的概率来push或者pull POI相对于查询点的位置。
这个模型alter the geographic distance between the query location and each POI by a weighted temporal probability.
下图为四种不同的组合空间和时态信息的模型,包括线性vs非线性,对称vs非对称。
评价方法:
平均倒数排序-the Mean Reciprocal Rank (MRR)
发现rational1方法效果最好。
下图是distort的效果,绿色为拉近了的POI,红色为推远了的POI。
未来工作:
除了利用时态,还利用社交活动行为进行distort。
下图可以看到有很多活动(t代表twitter)发生在该区域类型,因此该查询点也朝向该地点被distort。
当然其它还可以考虑很多隐私:天气情况,节假日、季节影响等。
geocoding using behavior-driven temporal semantic signatures
作者:Grant McKenzie, Krzysztof Janowicz.
来源:Computers, Environment and Urban Systems 54 (2015) 1–13
本文关注反向地理编码(Reverse Geocoding)问题,反向地理编码将地理坐标转换为地址。Web API通常将地理坐标映射为一系列Places Of Interest (POI),例如一点阈值范围内K个最近的POI。但是该问题有如下挑战:查询位置和用点特征代表一个place的不确定性,以及如何将坐标映射为一个综合商业体(如购物商场)中的一个place。本文除了利用距离,还利用时间。利用LBSN发掘geosocial行为来提取出时态语义签名(temporal semantic signatures)。提出一个利用时态语义签名的model来distort
POI的位置,注意这里不改变POI的地理位置,而是查询的时候动态生成POI的新位置。
利用Fousquare的POI签到数据(包含POI类型),对每类POI,统计一周每天24个小时中每个小时的签到数目,再除以该类POI签到总数,为该类POI该小时的temporal probability。对每类POI,其一周的时态概率分布,为其semantic signatures。这里类比了遥感里面的波段和光谱签名。
下图为不同类型POI的一周内每天的时态签名。
下图为不同类型POI一天24小时的时态签名。
为分析什么时段最能代表该签名,利用了信息增益(Informagion gain)的概念来度量这个代表性。
不同类型的POI有不同的时态概率,利用这个信息,来distort POI的空间位置,即根据用户访问一类特点POI的概率来push或者pull POI相对于查询点的位置。
这个模型alter the geographic distance between the query location and each POI by a weighted temporal probability.
下图为四种不同的组合空间和时态信息的模型,包括线性vs非线性,对称vs非对称。
评价方法:
平均倒数排序-the Mean Reciprocal Rank (MRR)
发现rational1方法效果最好。
下图是distort的效果,绿色为拉近了的POI,红色为推远了的POI。
未来工作:
除了利用时态,还利用社交活动行为进行distort。
下图可以看到有很多活动(t代表twitter)发生在该区域类型,因此该查询点也朝向该地点被distort。
当然其它还可以考虑很多隐私:天气情况,节假日、季节影响等。
相关文章推荐
- Java 使用poi把数据库中数据导入Excel的解决方法
- java使用POI读取properties文件并写到Excel的方法
- java使用poi读取ppt文件和poi读取excel、word示例
- Java中使用Apache POI读取word文件简单示例
- POI WORD
- POI封装二:导出 Export
- java生成word文档【一】
- java生成word文档【二】
- 使用POI修改Excel后进行保存
- Java 实现导出excel表
- java POI实现excle 强制换行
- poi解析office文档
- poi 一个单元格不同字体
- java实现excel的导入导出(poi详解)
- POI操作Excel常用方法总结
- 漫谈C指针:从const int i说起
- POI3.10.FINAL的word插入图片bug