计算广告学--笔记(2)
2013-09-01 21:55
134 查看
常用广告系统开源工具 ---内容来自师徒网, 计算广告学 刘鹏
使用开源工具搭建广告系统
Hadoop-----大数据处理的平台
-HDFS
-MapReduce
离线处理工具:HBase, Hadoop上的列存储数据库。类似的有:BigTable; HypeTable(C语言写的,效率相对高一点);Cassandra(Facebook, 不过好像他自己也不用了); mahout(数据挖掘、机器学习算法的MR实现工具);Elephant-bird: 配合Pig使用;
两个脚本语言: Pig/Hive, 使用MR实现类SQL的查询;
在线工具:
ZooKeeper: 分布式环境下解决一致性问题; Chubby:Google。 Zookeeper可以认为是Chubby的简化版本;
Avro;Thrift(Facebook):解决分布式环境里跨语言通信的工具包;
S4; Storm(twitter) 满足快速计算任务如快速计算粉丝数等;
Chuhwa;Scribe(facebook): Data highway;
Thrift:
-跨语言服务快速搭建(C++, Java, python, ruby, c#)
-用struct定于语言无关的通信数据结构;
struct KV
{1:optional i32 key=10; 2:optional string value="x"}
-用service定义RPC服务接口:
service KVCache{void set(1:i32 key, 2:string value)}; string get(1:i32 key); void delete(1:i32 key);}
-将上述声明放在IDL文件(比如service.thrift)中,用thrift -r -gen cpp service.thrift 生成服务框架代码
-能实现结构体和接口的Backward compatible (程序的后相兼容,新版本必须兼容老版本的数据接口)
-类似工具:Hadoop子项目Avro, Google开发的ProtoBuf
使用开源工具搭建广告系统
Hadoop-----大数据处理的平台
-HDFS
-MapReduce
离线处理工具:HBase, Hadoop上的列存储数据库。类似的有:BigTable; HypeTable(C语言写的,效率相对高一点);Cassandra(Facebook, 不过好像他自己也不用了); mahout(数据挖掘、机器学习算法的MR实现工具);Elephant-bird: 配合Pig使用;
两个脚本语言: Pig/Hive, 使用MR实现类SQL的查询;
在线工具:
ZooKeeper: 分布式环境下解决一致性问题; Chubby:Google。 Zookeeper可以认为是Chubby的简化版本;
Avro;Thrift(Facebook):解决分布式环境里跨语言通信的工具包;
S4; Storm(twitter) 满足快速计算任务如快速计算粉丝数等;
Chuhwa;Scribe(facebook): Data highway;
Thrift:
-跨语言服务快速搭建(C++, Java, python, ruby, c#)
-用struct定于语言无关的通信数据结构;
struct KV
{1:optional i32 key=10; 2:optional string value="x"}
-用service定义RPC服务接口:
service KVCache{void set(1:i32 key, 2:string value)}; string get(1:i32 key); void delete(1:i32 key);}
-将上述声明放在IDL文件(比如service.thrift)中,用thrift -r -gen cpp service.thrift 生成服务框架代码
-能实现结构体和接口的Backward compatible (程序的后相兼容,新版本必须兼容老版本的数据接口)
-类似工具:Hadoop子项目Avro, Google开发的ProtoBuf
相关文章推荐
- 刘鹏计算广告学听课笔记 第二章:合约广告系统(二)
- 百度计算广告学沙龙学习笔记 - 品牌展示广告
- 计算广告学-学习笔记
- 百度计算广告学沙龙学习笔记 - 内容匹配广告
- 刘鹏计算广告学听课笔记 第三章:受众定向(一)
- 计算广告学学习笔记
- 百度计算广告学沙龙学习笔记 - 内容匹配广告
- 信息检索导论学习笔记(7)-文档评分、词项权重计算
- 云计算、服务-云计算应用开发实践学习笔记-by小雨
- Pregel图计算模型--------学习笔记
- 黑马程序员之C#编程基础学习笔记:用while计算1到100之间整数的和;
- Python:入门笔记之list slices计算方法、匿名表达式、CGI、数据类型及应用领域
- python 科学计算 — numpy 学习笔记
- Udacity并行计算课程笔记-The GPU Programming Model
- 【计算方法笔记】列高斯消元法解线性方程组
- 大数据学习笔记·城市计算(1)
- 计算广告学学习2 - 广告有效性模型
- 辛星云计算笔记第一篇云计算的概念
- 四旋翼飞行器教学笔记2.2——姿态读取的计算
- 神经网络学习笔记-03-循环神经网络-反向传播计算公式的证明