MQL指标:理解生命周期函数、首态数据处理与尾部动态更新
2016-03-10 20:33
549 查看
小记 在 MQL 中 编写自定义指标时的一些需要注意的地方。
环境: Meta Trader 5
指标(Indicator)有一个生命周期函数
其函数原型为:
其返回值意义为“完成计算的条(Bar)数”。
其真实计算产生的数据并不通过此函数的返回值返回,而是通过全局变量
那么所谓信号是什么?
当交易系统接受到新的数据时,在将数据推入 time, open, high, low, close, … 数组后立即调用 OnCalculate 函数。
rates_total 与 time, open, high , … 等数组的长度一致,等于实际接收到的总数据(tick)数。
而编程者应该保证:
返回值为处理完毕1的总数据数,这应当是不超过 rates_total 的。
基于以上保证,prev_calculate即你之前处理完毕的数据数,默认为0(什么都没有处理)。
也就是说, 上一次调用 OnCalculate 所返回的值会被缓存成prev_calculated 在这次调用 OnCalculate的时候作为参数传入。
市场价格更新频率: 分笔(全世界只要发生可观测交易就会变化,可能每秒都有若干笔数据)
数据量:按照周期缓存(简单估算一下如果1小时缓存一个数据,每1年有5000左右个数据)
几年的数据积累下来会有10000 ~ 30000 bars 的数据,这在回测中是比较正常的。
这通常意味着在通常情况下,OnCalculate 需要完整更新整个指标序列,在1秒内计算若干次 10000~ 30000 的数据量,有时候,完成这些计算还不是常数时间代价的……更致命的是,一旦你在计算上慢了一步,商机有可能就会被错过。
很容易发现,通常情况下,过去的指标是不需要发生变化的。比如“2016年3月10日 19:00处的3小时收盘均值”是不会随着时间改变而改变的。因此我们其实并不需要重复计算这些部分。
那么问题简单了,我们需要多记录一个,哪个位置之前的数据是不需要计算的,那就是 prev_calculated。因此,在编程时,编程人员应该时刻遵守这个约定来给出返回值。
通常情况下,在函数结尾
既然它已经把数据给OnCalculate了,OnCalculate就应该处理完它。
接下来给出一个基本的范式。
另外,传入参数使用了引用(&)可以避免拷贝构造,优化参数传入的效率。
const 修饰符只是纯粹起保护数据的作用。
如移动平均线(Moving Average),波动率(Volatility)通常基于多个时间点的数据的计算。
因此不可避免地会遇到下标越界的问题:
上面的代码会遭遇越界。因为在第一次调用
在MQL5中,具有严格如Java一般的运行时越界检查来保证不会因为访问非法的数据导致结果的不正确并产生财产损失。
所以我们需要一个特殊的逻辑来处理这个初始状态下的数据。
由于
上述代码在实际运行时仍然会发生错误,具体请看接下来的尾部动态更新。
比如,在1小时周期内,最后1小时的所有数据都会被整合到
在接收周期内数据时,指标尾部没有动态更新(不会动)。
某一段指标值异常3。
这是因为实际上系统可能是这样调用OnCalculate的:
真的什么都不要做吗?
你会发现系统多次调用 OnCalculate 根本没有卵用,事实上,在重复调用的时候,数据尾部的close,high, low, 等的数据都可能已经发生改变了(由于接收到了新的周期内数据)。
显然,这个时候不能忽略这些数据,应当进行尾部更新
如此,尾部的动态更新就完成了。
希望别人(或者是几个月以后的我自己)能够不再入坑而浪费时间。
处理完毕的意思是“允许可视化”,但不意味着“不可改变”。 ↩
基于一个数据的指标也是存在的:如周期内收益率(u=close−openopenu = \frac{close - open}{open}),这样的指标就不需要考虑首态,因为根本就不回溯。 ↩
有的人选择只更新到
环境: Meta Trader 5
指标(Indicator)有一个生命周期函数
OnCalculate,
其函数原型为:
int OnCalculate(const int rates_total, const int prev_calculated, const datetime &time[], const double &open[], const double &high[], const double &low[], const double &close[], const long &tick_volume[], const long &volume[], const int &spread[]);
其返回值意义为“完成计算的条(Bar)数”。
其真实计算产生的数据并不通过此函数的返回值返回,而是通过全局变量
Buffer来返回。
OnCalculate 的 调用( invoke )时机
这里强调 invoke 的原因是为了与主动调用 call 区分开来,生命周期函数通常意味着一个事件。你不应该主动去调用 OnCalculate 函数,而应该等待系统接受某种信号后自己去调用这个函数。那么所谓信号是什么?
当交易系统接受到新的数据时,在将数据推入 time, open, high, low, close, … 数组后立即调用 OnCalculate 函数。
OnCalculate中的一些潜规则
在 OnCalculate 函数 开始执行时,系统保证:rates_total 与 time, open, high , … 等数组的长度一致,等于实际接收到的总数据(tick)数。
而编程者应该保证:
返回值为处理完毕1的总数据数,这应当是不超过 rates_total 的。
基于以上保证,prev_calculate即你之前处理完毕的数据数,默认为0(什么都没有处理)。
也就是说, 上一次调用 OnCalculate 所返回的值会被缓存成prev_calculated 在这次调用 OnCalculate的时候作为参数传入。
性能优化
首先考虑一下 OnCalculate 函数可能处理的数据量。市场价格更新频率: 分笔(全世界只要发生可观测交易就会变化,可能每秒都有若干笔数据)
数据量:按照周期缓存(简单估算一下如果1小时缓存一个数据,每1年有5000左右个数据)
几年的数据积累下来会有10000 ~ 30000 bars 的数据,这在回测中是比较正常的。
这通常意味着在通常情况下,OnCalculate 需要完整更新整个指标序列,在1秒内计算若干次 10000~ 30000 的数据量,有时候,完成这些计算还不是常数时间代价的……更致命的是,一旦你在计算上慢了一步,商机有可能就会被错过。
很容易发现,通常情况下,过去的指标是不需要发生变化的。比如“2016年3月10日 19:00处的3小时收盘均值”是不会随着时间改变而改变的。因此我们其实并不需要重复计算这些部分。
那么问题简单了,我们需要多记录一个,哪个位置之前的数据是不需要计算的,那就是 prev_calculated。因此,在编程时,编程人员应该时刻遵守这个约定来给出返回值。
通常情况下,在函数结尾
return rates_total;是最好的方法。
既然它已经把数据给OnCalculate了,OnCalculate就应该处理完它。
接下来给出一个基本的范式。
int OnCalculate(const int rates_total, const int prev_calculated, const datetime &time[], const double &open[], const double &high[], const double &low[], const double &close[], const long &tick_volume[], const long &volume[], const int &spread[]) { //--- selectively update for(int i = prev_calculated; i < rates_total; i++){ //--- TODO: deal with new bars } //--- return value of prev_calculated for next call return rates_total; }
另外,传入参数使用了引用(&)可以避免拷贝构造,优化参数传入的效率。
const 修饰符只是纯粹起保护数据的作用。
首态数据处理
通常情况下,指标并不是基于一个数据2的,而是需要回溯之前的若干数据的。如移动平均线(Moving Average),波动率(Volatility)通常基于多个时间点的数据的计算。
因此不可避免地会遇到下标越界的问题:
int OnCalculate(const int rates_total, const int prev_calculated, const datetime &time[], const double &open[], const double &high[], const double &low[], const double &close[], const long &tick_volume[], const long &volume[], const int &spread[]) { //--- selectively update for(int i = prev_calculated; i < rates_total; i++){ Buffer[i] = (close[i] - close[i - 1]) / close[i - 1]; // => over range! } //--- return value of prev_calculated for next call return rates_total; }
上面的代码会遭遇越界。因为在第一次调用
OnCalculate时
prev_calculated的值是
0,而我们在这里访问了
close[-1],这将抛出越界异常。
在MQL5中,具有严格如Java一般的运行时越界检查来保证不会因为访问非法的数据导致结果的不正确并产生财产损失。
所以我们需要一个特殊的逻辑来处理这个初始状态下的数据。
{ int from = prev_calculated, to = rates_total; //--- first state if(from <= 0){ Buffer[0] = 0; // or any value you like from = 1; // change the value of from } // range update for(int i = from; i < to; i++){ Buffer[i] = (close[i] - close[i - 1]) / close[i - 1]; // => okay } //--- return value of prev_calculated for next call return rates_total; }
由于
prev_calculated与
rates_total是不可变量,因此复制它们的值是一个比较可行的做法。
上述代码在实际运行时仍然会发生错误,具体请看接下来的尾部动态更新。
尾部动态更新
在MT5中,接收周期内数据是不增加实际的bars数量的。比如,在1小时周期内,最后1小时的所有数据都会被整合到
bar[rates_total - 1]上,显而易见地,由于之前的范围优化,OnCalculate会选择不更新最后一个 bar,因此Buffer的尾部会体现出以下两个特征:
在接收周期内数据时,指标尾部没有动态更新(不会动)。
某一段指标值异常3。
这是因为实际上系统可能是这样调用OnCalculate的:
OnCalculate(3, 0, ...) // => return 3 (first state) OnCalculate(4, 3, ...) // => return 4 (selectively update [3,4) ) OnCalculate(4, 4, ...) // => return 4 (receive data in period, but do nothing) OnCalculate(4, 4, ...) // => return 4 (receive data in period, but do nothing) // ... OnCalculate(5, 4, ...) // => return 5 (selectively update [4,5) )
真的什么都不要做吗?
你会发现系统多次调用 OnCalculate 根本没有卵用,事实上,在重复调用的时候,数据尾部的close,high, low, 等的数据都可能已经发生改变了(由于接收到了新的周期内数据)。
显然,这个时候不能忽略这些数据,应当进行尾部更新
{ int from = prev_calculated, to = rates_total; //--- first state if(from <= 0){ Buffer[0] = 0; // or any value you like from = 1; // change the value of from } // range update for(int i = from; i < to; i++){ Buffer[i] = (close[i] - close[i - 1]) / close[i - 1]; // => okay } // dynamic update in tail if(from == to){ Buffer[from - 1] = (close[from - 1] - close[from - 2]) / close[from - 2]; } //--- return value of prev_calculated for next call return rates_total; }
如此,尾部的动态更新就完成了。
结语
在本文中总结了编写指标的几个坑点。希望别人(或者是几个月以后的我自己)能够不再入坑而浪费时间。
处理完毕的意思是“允许可视化”,但不意味着“不可改变”。 ↩
基于一个数据的指标也是存在的:如周期内收益率(u=close−openopenu = \frac{close - open}{open}),这样的指标就不需要考虑首态,因为根本就不回溯。 ↩
有的人选择只更新到
rates_total -1,忽略最后一柱的更新,来保证指标值的正确性,但牺牲了更好的实时性,这个既不值得,也不优雅。 ↩
相关文章推荐
- bzoj 1614(二分+最短路)
- error_reporting(E_ALL ^ E_NOTICE)详细说明
- [置顶] MATLAB和c#混合编程实现心电图显示软件
- Java以及Android回调机制的一些理解
- LeetCode 160. Intersection of Two Linked Lists
- 树状数组 http://blog.csdn.net/int64ago/article/details/7429868
- hihoCoder#1269 : 优化延迟
- Android实现控件动画效果
- bzoj 2656 [Zjoi2012]数列(sequence)(高精度)
- DQL数据查询语言(一)
- Word自动编号多级标题设置
- PAT-Dating (20)
- php的学习笔记之面向对象(五)访问修饰符
- 我是一只it小小鸟读后感
- iOS自定义导航控制器侧滑返回的多种实现方法
- 读程序员面试-java多线程1
- 链表
- 如何在windows上安装部署设置SVN服务器
- Android音频开发(2):如何采集一帧音频
- 设计模式系列(三) —— 策略模式