GIS+=地理信息+大数据——纽约出租车大数据下载
2016-02-14 09:31
549 查看
--------------------------------------------------------------------------------------
版权所有:超图研究所(www.supermap.com)
Blog: http://blog.csdn.net/chinagissoft
QQ群:16403743
宗旨:专注于"GIS+"前沿技术的研究与交流,将云计算技术、大数据技术、容器技术、物联网与GIS进行深度融合,探讨"GIS+"技术和行业解决方案
转载说明:文章允许转载,但必须以链接方式注明源地址,否则追究法律责任!
--------------------------------------------------------------------------------------
题记
对于大数据的理解,仁者见仁智者见智,但是最起码需要一个量级的限制,例如如果你在将你的大数据有多么牛叉,但是演示的数据量在几百万条记录,几千万条记录等,其实并没有什么说服力,可以说,一个传统意义的关系型数据库都可以轻松管理上亿条记录,那么如果再进行相关的优化,几十亿条记录进行操作也没有问题,所以我们在学习或者实践我们的大数据,最起码在量级方面需要让大家信服。
这里面我们在互联网找到了一些关于大数据量及的数据,希望能够分享给各位,也希望这些数据能够为各位在大数据的研究和实践过程中提供数据支持。
元数据描述
数据介绍:来自美国纽约的出租车数据,包括空间位置信息,时间信息等属性信息。
数据格式:csv
数据字段描述:
medallion:UUID
hack_license:UUID
vendor_id:类型
rate_code:比率
store_and_fwd_flag:是否是四驱
pickup_datatime:客人上车时间
dropoff_datatime:客人下车时间
passenger_count:载客数量
trip_time_in_secs:载客时间
trip_distance:载客距离
pickup_longitude:客人上车经度
pickup_latitude:客人上车维度
dropoff_longitude:客人下车经度
dropoff_latitude:客人下车维度
数据量:11GB的文本数据
数据下载地址:http://pan.baidu.com/s/1i3QR8O1
trip_data_1.csv.zip
trip_data_2.csv.zip
trip_data_3.csv.zip
trip_data_4.csv.zip
trip_data_5.csv.zip
trip_data_6.csv.zip
trip_data_7.csv.zip
trip_data_8.csv.zip
trip_data_9.csv.zip
trip_data_10.csv.zip
trip_data_11.csv.zip
trip_data_12.csv.zip
附带说明:由于csv一般可以通过Excel打开,但是这些csv一般都在2GB左右,所有如果需要查询相关信息,建议使用专业的csv工具打开。
illumidata工具是一个不错的选择:http://pan.baidu.com/s/1i4xvCVF
版权所有:超图研究所(www.supermap.com)
Blog: http://blog.csdn.net/chinagissoft
QQ群:16403743
宗旨:专注于"GIS+"前沿技术的研究与交流,将云计算技术、大数据技术、容器技术、物联网与GIS进行深度融合,探讨"GIS+"技术和行业解决方案
转载说明:文章允许转载,但必须以链接方式注明源地址,否则追究法律责任!
--------------------------------------------------------------------------------------
题记
对于大数据的理解,仁者见仁智者见智,但是最起码需要一个量级的限制,例如如果你在将你的大数据有多么牛叉,但是演示的数据量在几百万条记录,几千万条记录等,其实并没有什么说服力,可以说,一个传统意义的关系型数据库都可以轻松管理上亿条记录,那么如果再进行相关的优化,几十亿条记录进行操作也没有问题,所以我们在学习或者实践我们的大数据,最起码在量级方面需要让大家信服。
这里面我们在互联网找到了一些关于大数据量及的数据,希望能够分享给各位,也希望这些数据能够为各位在大数据的研究和实践过程中提供数据支持。
元数据描述
数据介绍:来自美国纽约的出租车数据,包括空间位置信息,时间信息等属性信息。
数据格式:csv
数据字段描述:
medallion:UUID
hack_license:UUID
vendor_id:类型
rate_code:比率
store_and_fwd_flag:是否是四驱
pickup_datatime:客人上车时间
dropoff_datatime:客人下车时间
passenger_count:载客数量
trip_time_in_secs:载客时间
trip_distance:载客距离
pickup_longitude:客人上车经度
pickup_latitude:客人上车维度
dropoff_longitude:客人下车经度
dropoff_latitude:客人下车维度
数据量:11GB的文本数据
数据下载地址:http://pan.baidu.com/s/1i3QR8O1
trip_data_1.csv.zip
trip_data_2.csv.zip
trip_data_3.csv.zip
trip_data_4.csv.zip
trip_data_5.csv.zip
trip_data_6.csv.zip
trip_data_7.csv.zip
trip_data_8.csv.zip
trip_data_9.csv.zip
trip_data_10.csv.zip
trip_data_11.csv.zip
trip_data_12.csv.zip
附带说明:由于csv一般可以通过Excel打开,但是这些csv一般都在2GB左右,所有如果需要查询相关信息,建议使用专业的csv工具打开。
illumidata工具是一个不错的选择:http://pan.baidu.com/s/1i4xvCVF
相关文章推荐
- usaco training 1.3奶牛回文
- 让我来告诉你,为什么大数据并不能帮你找到女朋友
- LeetCode 70. Climbing Stairs
- hdu 1239 Calling Extraterrestrial Intelligence Again
- 大数据领域的JAVA 学习光速入门
- CodeForces 159D Palindrome pairs(manacher)
- hadoop问题小记
- 流式大数据处理的三种框架:Storm,Spark和Samza
- storm的基础介绍_数据分析_大数据
- HDU-1021-Fibonacci Again ( 找规律 + Fibonacci )
- 越狱Season 1-Episode 7: Riots, Drills and the Devil: Part 2
- 越狱Season 1-Episode 6: Riots, Drills and the Devil: Part 1
- Rails Error
- Codeforces Round #338 (Div. 2) B. Longtail Hedgehog
- UVa--514 Rails (stack)
- X-factor Chains(POJ3421 素数)
- hdoj 1702 ACboy needs your help again!(栈和队列的基础题)
- [LeetCode]11. Container With Most Water
- LeetCode Algorithms #70 <Climbing Stairs>
- 大数据存取的选择:行存储还是列存储?