查看: 1082|回复: 0

高频交易事故的解析与启示

[复制链接]

60

主题

60

帖子

200

积分

中级会员

Rank: 3Rank: 3

积分
200
发表于 2014-4-30 14:42:54 | 显示全部楼层 |阅读模式
作者:中信证券何昱

何昱点评:在8月16日光大证券发生ETF高频交易故障后,目前官方说法是策略多次重复补单、且数量计算错误,与去年Knight事故相似。无论该描述是否完全准确,都值得关注。

下文分析了Knight案例,提出了这种潜在的故障及其解决方案。现在重发,仅供参考,避免不必要的损失。

抛开纯技术的描述,从系统层面看,光大存在一连串的问题,程序自身的检查失误、校验最大资金限额的合规风控被绕开、自营系统账户不对实际账户验资等等。

由于有这么多的潜在隐患,事故的出现就不是偶然问题,只是早晚而已。一根长长的链条上,满是漏洞,哪能不断开呢?

从更深层次分析,这次事故是由管理问题引起的。策略系统运用IT技术,却既不进行详细的测试,又不遵守常规的安全与风控规范。纵然在效率上有所提升,却牺牲了最重要的可靠性。

短板决定最终长度,不尊重客观规律,必定要付出代价。无论出于何种可能在制度和流程上放水,均可能导致不可知的灾难性后果。由于国内业界的整体IT技能有待提高,尤其是应用理念不够合理,这次事故也为有类似情况的从业者敲响了警钟。

所以,平时多流汗,战时少流血。从制度和流程上严格规范,方可保证正确性,这才是真正的硬道理。在即将来临的泛衍生品时代,股票、期货、期权的T+0交易接踵而至,会对交易系统提出极高的要求。只有认真建设,才可能在竞争中立于不败之地。

原文在2013年1月21日发表于《期货日报》,略有修改。文章分析了去年骑士资本KnightCapital的事故:起因是交易所的接口变更、Knight未仔细测试,导致交易中撤单失败、重复补单,最终造成巨大损失;并探讨了各类相关故障的可能性和全面应对措施。

文章较简单,以常识为主。仅愿抛砖引玉,与朋友们互相学习,共同进步。

==以下为正文==

高频交易的主要参与者为数量众多的各投资机构,最有可能发生且对交易员产生严重后果的,当属由机构自身交易系统的问题引发故障。

2012年,全球经济持续动荡。与此同时,世界各地与高频交易相关的交易系统发生了多起故障事件,对投资者产生了较大影响。

2月,东京证券交易所发生严重技术故障,241家上市公司股票交易受到影响,技术故障持续了近3个半小时。

3月,美国第三大证券交易所运营商BATS在其交易所上市当日,经历一次严重技术故障后宣布取消上市,令华尔街大跌眼镜。随后,由于纳斯达克[微博]的系统瘫痪,社交网络巨头Facebook股票上市当天开盘时间被推迟了30分钟,交易故障给投资者造成了前所未有的困惑和混乱。

8月6日,由于技术故障,西班牙股票交易所被迫暂停交易近5个小时。此前的4月份,为配合高频交易,西班牙股票交易所运营商BME迁移至一个更新更快的交易平台,以增强自身竞争力,但是3个月之后就发生了大规模的中断交易事故。

8月7日,东京证券交易所宣布,由于其交易系统发生半年来第二次“当机”故障,东证指数(TOPIX)期货等所有金融衍生产品的交易全部暂停,日本国债期货和期权交易暂停超过90分钟,不过股市交易并未受到影响。

除交易所外,参与高频交易的大型投资机构也出现了严重事故,其中影响最大的事件发生在8月。美国做市商骑士资本由于技术故障在45分钟内损失4.4亿美元。8月1日美国股市开盘后,上午9点半至10点15分的45分钟内,纽交所的上百只股票出现剧烈波动。做市商骑士资本不久后发表声明,称其做市部门出现交易技术问题,影响了纽交所约150只股票。

骑士资本在8月2日发布声明,称周三的交易故障导致税前亏损4.4亿美元。尽管骑士资本与高频交易巨头Getco等4家机构达成了4亿美元的注资协议,但其股价却出现暴跌,且可能面临股东的诉讼。作为2011年纽交所和纳斯达克交易所零售股票交易业务中排名第一的做市商,骑士资本损失惨重。这一事件成为2012年由高频交易引发的又一起严重事故。

反观各种事故,交易所故障的危害性最大,一旦发生,将影响所有市场参与者。但由于交易所数量有限,事故发生几率较小,属于从整体上无法规避的系统性风险。与之相对应,因为高频交易的主要参与者为数量众多的各投资机构,其技术水平有较大的差异,最有可能发生且对交易员产生严重后果的,当属由机构自身交易系统问题引发的故障。由于高频交易行业的隐秘性,大量此类事故未被披露。而骑士资本事故持续时间长,波及范围大,且得到了较为详细的记录,可以为从业者借鉴和参考提供宝贵的素材。那么,这次事故究竟是如何引起的呢?

事故的起因是当日纽交所NYSE对交易系统升级,启动了RetailLiquidityProgram新交易系统。在收到通知后,骑士资本的开发部门更新了执行系统的相关代码,但在上线前并没有通过全面测试。当开盘后,做市系统按照预设程序下单,却无法从交易所获取订单的确认信息,根本不知道已经发出有效订单,反而认为下单失败、没有成交,因此继续追加补单。由于同样的原因,补单也均“失败”,系统不停发单,由此造成的连锁反应使实际发出的订单量呈几何数量上升,最终导致市场不可避免地向不利的方向移动。

在全自动化超高速的追涨杀跌交易后,部分股票的价格上涨了100%—200%,有些交易每笔亏损15—17美分。大部分交易持续5—26分钟,最长的交易持续了40分钟。值得注意的是,异常情况出现后不久即被监控人员发现,但正常的管理操作却无法停止交易程序,最后只能通过切断网络等物理方法才停止了交易。程序异常的直接后果,就是不正常的极大持仓,其最高峰值达到70亿美元。经过一定的紧急处理,日终时总持仓仍然达到46亿美元,并导致了4.4亿美元的损失。

本次事件对于相关从业者有非常宝贵的借鉴价值。从专业的角度来看,以下几点值得高频交易员注意:

1.必须相信,机器是会犯错的,预先设计各种故障保护措施

归根到底,机器的设计者——人是会犯错的,必须预先设想各种极端情况,并提供预防方案,包括在界面上停止交易、关闭交易程序与切断网络连接等。如果异常程序积累了大量仓位,应考虑其平仓方式。

2.必须由专职的交易员来进行人工监控

监控界面应该展示完整的交易信息和控制要素。交易员可根据实战经验,检查出当前交易是否存在异常情况。

在股票/ETF等权益类交易时,由于数据发布的频率和交易速度较慢,交易员至少每5—10分钟查看一次。当进行期货交易时,检查频率需要更高。

3.交易程序必须与交易所升级严格同步,并定期维护

鉴于国内现状,IT部门应该与交易所、系统开发商紧密合作,以保持系统的正确性。从各大型券商的实际操作流程来看,可以满足这种要求。

4.交易程序必须监控价格和成交量的异常波动,在极端情况时终止交易

在骑士资本案例中,由于美股没有涨跌停限制,当价格被买单推动上涨了1倍以上,且交易量极大时,交易程序应该识别出该情况,并及时报警。

交易程序应该检查价格的当日波动性、涨跌幅度,相对于近期价格的变化率,以及市场交易量的变化、系统自身交易量的变化,以便精准控制。

5.交易程序必须判断持仓,包括每个交易对象的仓位和整体仓位

由于美股为T+0交易,做市商一般仅需维持很少的隔夜库存。出于对其程序的信心,骑士资本很有可能未在程序中判断全局或个股的仓位,从而在故障发生时积累了极大数量。

由于A股为T+1交易,有较大的隔夜风险,在ETF做市、套利时应做严格检查。交易程序在下单前,应评估本次交易是否对个股/ETF或整体仓位有较大影响,以及是否出现突破限额的风险等。

6.交易程序应该检查交易对象的关联性

可以设想,交易程序有可能出现某种故障,导致个股交易有一定异常,但数量不大,难以被察觉。不过若同时影响到许多个股,将会造成较大损失。

交易程序应该检查大量交易对象之间的关联性,如是否多个对象的交易均有亏损、亏损数量及价格、交易量波动幅度等。

发生在美国市场的这次事故,给了我们很好的启示,辛辛苦苦若干年,一朝跌回解放前。市场面前只有对错,没有永远的贵族,魔鬼就在细节中。无论过去如何辉煌,丝毫傲慢就足够引向毁灭的深渊。使用各种高精尖技术构建的高频交易系统,一旦遭遇木桶效应中最弱的短板环节,会轻易地将整体优势拱手让出。只有永远保持谦卑的学习心态和饱满的求知欲望,才可能不断进步。国内的金融机构,需要深入研究此类案例,才能从中吸收宝贵的经验,以研发具有中国特色、适应本土市场的下一代高频交易系统。

此外,从宏观层面来看,为避免类似情况的再次发生,不仅要求交易员提高自律性,更需要监管机构从源头入手,制定硬性的行业规范,并确保实施,从而能够更好地维护市场的有效性和公平秩序,保护普通投资者的利益。纵顾每一次危机,危后必有机,被揭露出的问题将促使相关技术获得更大的进步,从而反哺市场,带来更多收益。

这对于投资从业者也是个很好的契机,通过不断反思改进自己的系统,并最终在激烈的竞争中占领先机。随着时间的推移,中国经济继续稳步前进,不断深入的金融改革将为高频交易带来更多的发展空间和机遇,充分利用其减小市场波动、降低交易成本的优势,造福广大的普通投资者,分享市场发展的利益。我们只有从细处着手,充分考虑各个环节,一定可以开发出更完善的交易系统,在中国高频交易的新纪元中脱颖而出。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表