19年创业做过一年的量化交易但没有成功,作为交易系统的开发人员积累了一些经验,最近想重新研究交易系统,一边整理一边写出来一些思考供大家参考,也希望跟做量化的朋友有更多的交流和合作。
本篇是结合代码的说说股票TICK数据分析资金动力指标,由于股票没有用户数据,所以想把影响价格波动的动力资金识别出来,这部分需要TICK数据聚合而成,主动力大资金指标通过TICK数据加工到日级,所以还是有一定门槛。
在股票市场中,Tick 数据记录了每一笔成交的详细信息,包括成交时间、成交价格、成交数量等。Tick 数据提供了市场最细粒度的交易信息,是分析市场微观结构、追踪大资金动向的关键数据源之一。主动力大资金指标旨在通过对 Tick 数据的深入分析,识别出大资金对市场的推动作用,为投资者和交易策略提供参考。以下是关于如何基于股票 Tick 数据生成主动力大资金指标的详细扩展。
1. Tick 数据的收集与预处理
生成主动力大资金指标的第一步是收集和预处理 Tick 数据。Tick 数据通常包含每一笔交易的时间戳、成交价格、成交量、买卖双方的信息等。
-
数据收集:通过交易所提供的 API 或第三方数据供应商获取 Tick 数据。对于高频交易策略,建议使用低延迟的 WebSocket 连接来实时采集 Tick 数据,确保数据的时效性。
-
数据清洗:由于 Tick 数据量大且可能存在噪声和异常值,需要对原始数据进行清洗。清洗步骤包括:去除价格或成交量异常的记录,过滤掉极小交易量的“噪声”交易,以确保数据质量。
-
数据整合:将不同来源的 Tick 数据进行整合和标准化,以确保数据的一致性和完整性,尤其是在多交易所采集数据的场景中,需要对不同交易所的时间戳进行同步和校正。
2. 大资金识别与分类
生成主动力大资金指标的核心在于识别市场中大资金的流动,即区分大额交易和一般性交易。通常,大资金的交易对市场具有更大的影响,因此需要采用一定的标准来识别大资金的交易行为。
-
大资金交易的阈值设定:根据市场整体的流动性和个股的特性,设定一个阈值,用于区分大资金交易和普通交易。例如,可以根据过去一段时间的成交量分布,设定成交量达到某个百分位数的交易为“大资金”交易。通常,将单笔成交量超过某个绝对值(如某个股票平均每笔交易量的 10 倍)视为大资金。
-
大资金交易的分类:将大资金交易按类型进行分类,例如主动买入、主动卖出等。主动买入是指以卖一价成交的交易,主动卖出则是以买一价成交的交易。通过区分买卖方向,可以进一步分析大资金的市场影响力。
-
价格冲击分析:通过观察大资金交易对价格的冲击,评估这些交易对市场价格的短期影响。例如,可以计算大资金交易前后若干秒内的价格变化,以量化其冲击效果。
3. 主动力大资金指标的计算
主动力大资金指标旨在量化大资金对市场的影响,核心是评估大资金的净流入和对价格走势的推动力。
-
净大资金流入计算:净大资金流入是指一定时间窗口内,主动买入的大资金成交量减去主动卖出的大资金成交量。例如,可以在一分钟内累加所有大资金的主动买入和主动卖出的交易量,得到净流入量。净流入为正,表示市场中买方力量较强,净流出为负则表示卖方力量占优。
-
加权大资金推动力:为了更精确地评估大资金的市场推动力,可以对每笔大资金交易按其对市场价格的影响程度进行加权。加权因子可以考虑交易量、交易时段的流动性等因素。例如,在市场流动性较差的时段,大资金交易对价格的影响可能更大,因此可以给予更高的权重。
-
累积主动力指标:将净大资金流入在时间上进行累积,生成主动力曲线,以反映大资金在较长时间内的市场推动力。例如,可以计算每天的主动力大资金净流入累积值,生成一个时间序列来评估趋势。
4. 主动力大资金指标的应用
主动力大资金指标能够为投资者提供有关市场大资金动向的重要信息,可用于多个方面的交易决策和市场分析。
-
趋势识别:主动力大资金指标可以帮助识别市场的趋势变化。例如,当累积的主动力大资金指标持续为正且呈上升趋势时,表明市场中有持续的买入压力,市场可能进入上升趋势;相反,如果指标持续为负,表明市场中卖压较大,可能出现下行趋势。
-
反转信号:主动力大资金指标的快速变化可以作为市场反转的先行信号。例如,当市场价格在高位横盘时,如果主动力大资金指标由正转负,表明有大量大资金开始卖出,这可能预示着市场将出现回调。
-
辅助短线策略:对于短线交易者,主动力大资金指标可以作为开平仓信号的辅助参考。当大资金的买入推动力显著增加时,可能是一个短期买入机会;而当大资金的卖出压力增大时,则可以考虑卖出或平仓。
5. 计算中的技术挑战与解决方案
在基于 Tick 数据生成主动力大资金指标的过程中,存在一些技术挑战,主要包括数据量庞大、计算性能要求高、数据的噪声和延迟等。
-
数据量庞大:Tick 数据的频率非常高,特别是在交易活跃的时段,每秒钟可能有数百笔甚至上千笔成交记录。因此,数据存储和计算的性能要求很高。解决方案是使用内存数据库(如 Redis)来缓存实时 Tick 数据,并定期将历史数据存入分布式存储系统(如 Hadoop 或 Cassandra),以保证数据的读写效率。
-
计算性能优化:为了在交易决策中实时应用主动力大资金指标,计算必须足够快速。可以使用分布式计算框架(如 Apache Flink 或 Spark Streaming)对 Tick 数据进行实时处理,并使用流式计算技术来降低延迟,保证计算结果的实时性。
-
数据噪声处理:Tick 数据中包含大量的小额交易,这些交易可能对分析结果产生干扰,因此需要进行噪声处理。例如,可以设定一个最小交易量阈值,仅对超过该阈值的交易进行处理。此外,通过对连续多笔成交进行聚合,可以进一步过滤掉噪声,得到更加稳定的主动力大资金指标。
6. 主动力大资金指标代码参考
# 获取资金动力:主动买1/主动卖-1/无法判断0 # 根据tick划分阶段:1、第一条tick(集合竞价和无集合竞价);2、正常交易;3、尾盘集合竞价最后一条(挂单都为0);4、最后一条close; # 主动买1:按照顺序if # 1.第一条数据成交价大于昨日收盘价:包括集合竞价和没有集合竞价数据的第一条,(start >= 1) and (price > pre_close) # 2.跌停:(当前tick成交价等于跌停价) and (买1交易量为0 or 买1交易量为0),(0 < limit_up_sign < 1) # 3.当前tick成交价大于上一tick的价格,(price > pre_price) # # 注掉3.当前tick成交价大于上一tick的卖1挂单价格,(price > pre_a1_p) # # 注掉3-1.验证3可以通过当前tick成交量占比上一tick的大于等于pre_a1_p小于等于price的卖挂单量,卖挂单量大于50%成交量判断 # # 注掉4.当前tick成交价等于上一tick的卖1挂单价格,通过当前tick买1价大于等于上一tick卖1价判断,(price = pre_a1_p) and (b1_p >= pre_a1_p) # 主动卖-1:按照顺序if # -1.第一条数据成交价小于昨日收盘价:包括集合竞价和没有集合竞价数据的第一条,(start > 1) and (price < pre_close) # -2.涨停:(当前tick成交价等于涨停价) and (卖1交易量为0 or 买1交易量为0),(limit_up_sign > 1) # -3.当前tick成交价小于上一tick的价格,(price < pre_b1_p) # # 注掉-3.当前tick成交价小于上一tick的买1挂单价格,(price < pre_b1_p) # # 注掉-3-1.验证3可以通过当前tick成交量占比上一tick的小于等于pre_b1_p大于等于price的卖挂单量,买挂单量大于50%成交量判断 # # 注掉-4.当前tick成交价等于上一tick的买1挂单价格,通过当前tick卖1价小于等于上一tick买1价判断,(price = pre_b1_p) and (a1_p <= pre_b1_p) # 无法判断0: # 1.第一条数据成交价等于昨日收盘价:包括集合竞价和没有集合竞价数据的第一条,(start > 1) and (price == pre_close)
def _get_dl_tick(self, df, before):
df_all = before
df_pre = df_all[df_all.datetime < df.datetime][-1:]
# 处理非第一条数据,但第二条数据与上一条时间一样,导致没有数据
if (len(df_pre) == 0) and (df.start == 0):
return 0
# start 0 表示非第一tick条数据 1 表示第一tick为集合竞价数据 2 表示第一tick不是集合竞价数据
# 1、第一条tick数据,判断price>pre_close为主动买1;price<pre_close为主动卖1;price=pre_close为不确认0
if df.start >= 1:
# 主动买1:第一条数据成交价大于昨日收盘价:包括集合竞价和没有集合竞价数据的第一条,(start >= 1) and (price > pre_close)
if df.dvwap > df.pre_close:
return 1
# 主动卖-1:第一条数据成交价小于昨日收盘价:包括集合竞价和没有集合竞价数据的第一条,(start > 1) and (price < pre_close)
elif df.dvwap < df.pre_close:
return -1
else:
return 0
# 3、尾盘竞价最后一条数据,挂单价格和量都为空,辅助时间准确判断,判断涨跌停和非涨跌停:涨跌停判断挂单量变,非涨跌停根据挂单位置判断;
elif (df.b1_p == 0) and (df.a1_p == 0):
# 跌停
if (df.limit_up_sign > 0) and (df.limit_up_sign < 1):
# 上一tick也是跌停
if (df_pre.limit_up_sign.values[0] > 0) and (df_pre.limit_up_sign.values[0] < 1):
return 1
# 上一tick不是跌停
else:
return -1
# 涨停
elif df.limit_up_sign > 1:
# 上一tick也是涨停
if df_pre.limit_up_sign.values[0] > 1:
return -1
# 上一tick不是涨停
else:
return 1
else:
if df.dvwap > df_pre.a1_p.values[0]:
return 1
elif df.price < df_pre.b1_p.values[0]:
return -1
else:
return 0
# 4、收盘close最后一条,有可能上一tick买卖1挂单价格都为0,判断涨跌停和非涨跌停:涨跌停判断挂单量变,非涨跌停根据挂单位置判断;
elif (df.close > 0) and (df.datetime >= df.datetime[:10] + ' 15:00:00'):
df_pre_2 = df_all[df_all.datetime < df.datetime][-2:-1]
# 跌停
if (df.limit_up_sign > 0) and (df.limit_up_sign < 1):
# 上一tick也是跌停
if (df_pre.limit_up_sign.values[0] > 0) and (df_pre.limit_up_sign.values[0] < 1):
# 如果上一tick买卖挂单量价都为0,用上上tick数据判断
if (df_pre.b1_p.values[0] == 0) and (df_pre.a1_p.values[0] == 0):
# 如果当前tick的一档挂单量对比上一tick的一档挂单量是上涨和持平的则是消耗封单的资金即为主动买
if (df.a1_v + df.dvolume) >= df_pre_2.a1_v.values[0]:
return -1
else:
return 1
else:
# 如果当前tick的一档挂单量对比上一tick的一档挂单量是上涨和持平的则是消耗封单的资金即为主动买
if (df.a1_v + df.dvolume) >= df_pre.a1_v.values[0]:
return -1
else:
return 1
# 上一tick不是跌停
else:
return -1
# 涨停
elif df.limit_up_sign > 1:
# 上一个tick也是涨停
if df_pre.limit_up_sign.values[0] > 1:
# 如果上一tick买卖挂单量价都为0,用上上tick数据判断
if (df_pre.b1_p.values[0] == 0) and (df_pre.a1_p.values[0] == 0):
# 如果当前tick的一档挂单量对比上一tick的一档挂单量是上涨和持平的则是消耗封单的资金即为主动买
if (df.b1_v + df.dvolume) >= df_pre_2.b1_v.values[0]:
return 1
else:
return -1
else:
# 如果当前tick的一档挂单量对比上一tick的一档挂单量是上涨和持平的则是消耗封单的资金即为主动买
if (df.b1_v + df.dvolume) >= df_pre.b1_v.values[0]:
return 1
else:
return -1
# 上一tick不是涨停
else:
return 1
else:
# 主动买3.当前tick成交均价大于上一tick的成交均价格,(dvwap > pre_dvwap)
if df.dvwap > df.pre_dvwap:
return 1
# 主动卖-3.当前tick成交均价小于上一tick的成交均价格,(dvwap < pre_dvwap)
elif df.dvwap < df.pre_dvwap:
return -1
# 不确定0
else:
return 0
# 2、正常交易,非第一条start、收盘最后一条close、尾盘竞价最后一条数据
else:
# tick涨跌停标记-默认0,与pre_close比例[1.2, 1.1, 1.05, 0.95, 0.9, 0.8]
# 主动买2.跌停:(当前tick成交价等于跌停价) and (卖1交易量为0 or 买1交易量为0),(0 < limit_up_sign < 1)
if (df.limit_up_sign > 0) and (df.limit_up_sign < 1):
# 上一tick也是跌停
if (df_pre.limit_up_sign.values[0] > 0) and (df_pre.limit_up_sign.values[0] < 1):
# 如果当前tick的一档挂单量对比上一tick的一档挂单量是上涨和持平的则是消耗封单的资金即为主动买
if (df.a1_v + df.dvolume) >= df_pre.a1_v.values[0]:
return -1
else:
return 1
# 上一tick不是跌停
else:
return -1
# 主动卖-2.涨停:(当前tick成交价等于涨停价) and (卖1交易量为0 or 买1交易量为0),(limit_up_sign > 1)
elif df.limit_up_sign > 1:
# 上一tick也是涨停
if df_pre.limit_up_sign.values[0] > 1:
# 如果当前tick的一档挂单量对比上一tick的一档挂单量是上涨和持平的则是消耗封单的资金即为主动买
if (df.b1_v + df.dvolume) >= df_pre.b1_v.values[0]:
return 1
else:
return -1
# 上一tick不是涨停
else:
return 1
# 非涨跌停:以价格为准判断,兼容价格在买卖挂单1之外逻辑
else:
# 主动买3.当前tick成交均价大于上一tick的成交均价格,(dvwap > pre_dvwap)
if df.dvwap > df.pre_dvwap:
return 1
# 主动卖-3.当前tick成交均价小于上一tick的成交均价格,(dvwap < pre_dvwap)
elif df.dvwap < df.pre_dvwap:
return -1
# 不确定0
else:
return 0