您的位置：首页 > 其它

Actor模型

2012-02-24 14:59 330 查看

最近在看Yahoo的S4: distributed stream computing platform，主要是结合了MapReduce和Actor模型，于是找了些资料学习Actor模型，在这里简单介绍一下，S4等后续文章再介绍。

　　Actor这个模型由Carl Hewitt在1973年提出，Gul Agha在1986年发表技术报告“Actors: A Model of Concurrent Computation in Distributed Systems”，至今已有不少年头了。在计算机科学中，它是一个并行计算的数学模型，最初为由大量独立的微处理器组成的高并行计算机所开发，Actor模型的理念非常简单：天下万物皆为Actor。

　　Actor之间通过发送消息来通信，消息的传送是异步的，通过一个邮件队列（mail queue）来处理消息。每个Actor是完全独立的，可以同时执行它们的操作。每一个Actor是一个计算实体，映射接收到的消息到以下动作：

发送有限个消息给其它Actor；

创建有限个新的Actor；

为下一个接收的消息指定行为。

　　以上三种动作并没有固定的顺序，可以并发地执行。Actor会根据接收到的消息进行不同的处理。

　　在一个Actor系统中，包含一个未处理的任务集，每一个任务由以下三个属性标识：

tag：用以区别于系统中的其它任务；

target：通信到达的地址；

communication：包含在target上的Actor处理任务时可获取的信息，。

　　简单起见，可以把一个任务视为一个消息，在Actor之间传递包含以上三个属性的值的消息。

　　Actor模型有两种任务调度方式：基于线程的调度以及基于事件的调度：

基于线程的调度：为每个Actor分配一个线程，在接收一个消息时，如果当前Actor的邮箱（mail box）为空，则会阻塞当前线程。基于线程的调度实现较为简单，但线程数量受到操作的限制，现在的Actor模型一般不采用这种方式；

基于事件的调试：事件可以理解为上述任务或消息的到来，而此时才会为Actor的任务分配线程并执行。

　　综上，我们知道可以把系统中的所有事物都抽象成一个Actor：

Actor的输入是接收到的消息。

Actor接收到消息后处理消息中定义的任务。

Actor处理完成任务后可以发送消息给其它的Actor。

　　那么在一个系统中，可以将一个大规模的任务分解为一些小任务，这些小任务可以由多个Actor并发处理，从而减少任务的完成时间。

　　举个简单的例子，比如现在要在3台物理节点上运行一个WordCount作业，可以将这个作业细分为Split、Count和Merge三种任务（任务的target是物理节点的地址，communication可能包含文本、单词及计数等），根据需求要有Split Actor、Count Actor和Merge Actor。整个作业的处理流程以下：

Split Actor接收到消息后可以文本分割成10份，每份发送给一个Count Actor；

Count Actor统计好单词的数目后发送消息给Merge Actor；

Merge Actor收集完Count Actor发送的10个消息后，合并每个单词的数目，完成WordCount任务。

　　从以上例子可以看出，Actor系统跟数据驱动系统比如数据流相近，可以自定义任务的流向及其处理过程。Actor模型被广泛使用在很多并发系统中，比如Email、Web Service等等。

参考资料

　　(1) G. Agha, Actors: A Model of Concurrent Computation in Distributed Systems. Cambridge, MA, SA: MIT Press,1986.

　　(2) Wikipedia: http://en.wikipedia.org/wiki/Actor_model

　　(3) ActorLite：一个轻量级Actor模型实现（上）

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航