因为个人原因,本项目不再维护了,感谢各位网友的关注,如果需要获取相关数据,建议关注另一个开源项目akshare
pip install fushare
pip install fushare --upgrade
1.2.1
新增了每交易日17点自动爬数据并存本地csv文件功能,进而将数据发送给自己QQ邮件(微信有提醒)
1.2.3
新增指数日线行情爬取(持仓量加权)
1.2.5
修复指数日线行情bug
1.2.6
同bug,改成持仓量或成交量为0时都不进行加权
1.2.7
czce的rank_table中有的数值类型变成numpy.int,在_tableCut_cal函数末尾加了一句保证数据类型转换为int
1.2.8
pandas最新版0.24.0的pd.read_html函数在basis脚本中识别格式有区别,脚本中针对不同pandas版本识别不同
1.2.9
大商所的仓单数据网站格式变化
1.2.10
上期所成交量0时候有的为str格式的空白,解决该问题
20190502,20190503,去掉该交易日
作者:LowinLi
目录
传统的CTA策略以趋势为主,但是自从2017年以来,无论是长线还是短线的趋势策略都受制于商品波动率的降低,面临了多多少少的回撤,同时市场也逐渐趋于机构化理性化,因此在传统CTA策略的基础上加入基本面的因素显得迫在眉睫。近几年各券商的研报陆续提出了许多依赖于趋势行情以外的有效信号,它们的表现都与趋势策略有着很低的甚至负的相关性,这样通过多种不同类型的信号对冲得到的策略,就有机会在市场上取得非常棒的夏普率和稳定的收益。
fushare库的公开就是为了向各位同仁提供一个爬虫接口,避免各个研究组、机构重复造轮子爬取相关数据的资源浪费。
展期收益率是由不同交割月的价差除以相隔月份数计算得来,它反映了市场对该品种在近期交割和远期交割的价差预判。
通过get_rollYield_bar接口下载展期收益率,这里展期收益率列表的序列类型分为三种,分别可以通过type='date'、'symbol'、'var'获取。 其中'date'类型是由某商品品种在不同日期的主力合约次主力合约的价差组成,调用方法例子为:
import fushare as f
f.get_rollYield_bar(type = 'date', var = 'RB', start = '20180618', end = '20180718',plot = True)
其中'symbol'类型是由某商品品种在某天的所有交割月合约价格组成,可以很方便的观察该品种从近期到远期的展期结构,调用方法例子为:
f.get_rollYield_bar(type = 'symbol', var = 'RB', date = '20180718',plot = True)
其中'var'类型是由某交易日,所有品种的主力次主力合约展期收益率的组合,可以方便的找到展期收益率高的品种和低的品种,调用方法例子为:
f.get_rollYield_bar(type = 'var', date = '20180718',plot = True)
利用get_rollYield接口,可以找到特定合约特定日期的主力合约次主力合约展期收益率,或通过symbol1、symbol2变量自定义某两个合约的展期收益率。
f.get_rollYield(date = '20180718', var = 'IF', symbol1 = 'IF1812', symbol2 = 'IF1811'),如下图所示:
注意:
主力合约和次主力合约的定义,是由该日的各交割月合约持仓量由大到小排序得到。
注册仓单是由各交易所的公布的日级数据,在一定程度上可以反映市场的库存变化。调用例子如下:
f.get_reciept(start = '20180712', end = '20180719', vars = ['CU', 'NI'])
注意:
1.vars变量接上需要爬取的品种列表,即使是一个品种,也需要以列表形式输入;
2.在研究仓单的方向变化时,需要考虑一些品种的年度周期性,如农产品的收割季、工业品的开工季等;
3.需考虑到交割日的仓单变化。
基差是商品期货非常重要的基本面因素。这里提供两种获取基差的方法: 获取当天的基差数据
f.get_spotPrice('20180712')
返回值分别为品种、现货价格、最近交割合约、最近交割合约价格、主力合约、主力合约价格、最近合约基差值、主力合约基差值、最近合约基差率、主力合约基差率。
获取历史某段时间的基差值
f.get_spotPrice_daily(start = '20180710', end = '20180719', vars = ['CU', 'RB'])
注意:
现货价格是从生意社网站爬取获得,仅支持从2011年至今每个交易日数据。
自从“蜘蛛网策略”问世以来,会员持仓数据受到日益关注。数据的爬取方式如下所示: 获取某段时间的会员持仓排名前5、前10、前15、前20等总和
f.get_rank_sum_daily(start = '20180718', end = '20180719', vars = ['IF', 'C'])
获取某交易日某品种的持仓排名榜
f.get_dce_rank_table()、f.get_cffex_rank_table()、f.get_czce_rank_table()、f.get_shfe_rank_table()
注意:
因为每个交易所公布的持仓排名不同:大连所只公布品种的总持仓排名,没有按不同交割月划分;上海、中金交易所公布了每个交割月的持仓排名,没有公布品种所有合约总排名,因此这里的品种排名和是各合约加总计算得来;郑州交易所公布了各合约排名和品种排名,因此这里都是交易所原始数据。
通过爬取交易所官网信息,可以获得各合约日线行情,以及根据持仓量加权的指数行情,用法如下:
f.get_future_daily(start='20190107', end='20190108', market='SHFE', indexBar = True)
market可以添为四个交易所的简称,即'dce'代表大商所;'shfe'代表上期所;'czce'代表郑商所;'cffex'代表中金所。 indexBar为True时,在生成的dataframe中通过持仓量加权合成指数合约,如RB99
anaconda是集成了上千个常用包的python发行版本,通过安装anaconda简化了环境管理工作,非常推荐使用。
建议选择成熟的python3.6版本,即anaconda3-5.2.0。根据系统选择windows版、linux版或mac版,及32位或64位。红框为64位windows选择的版本
双击安装过程中有一个界面需要注意,即下图把两个钩都选上,以便于把安装的环境加入系统路径。
安装好后,打开cmd窗口,输入python,如果如下图所示,即已经在系统目录中安装好anaconda5.2.0(python3.6)的环境。
用ctrl+Z可以退出刚才的python运行环境回到cmd命令下,输入
pip install fushare
即在python环境中安装了fushare库(有网络情况下)
再次输入python,进入python环境,输入
import fushare
即导入了fushare库,再输入
fushare.__version__
本地配置好anaconda,以及通过pip安装好fushare>=1.2.1后,在github上下载示例文件,即按照下图选择。
https://github.com/LowinLi/fushare
解压下载的文件,然后来到example目录下,设置setting配置文件 root设置为fushare爬数据时存储的默认目录(需要保证目录存在),qqEmail和secret为爬取到数据时把数据发送给自己的qq邮箱账号和密码。需要开通SMTP服务,如果不需要自己邮件提醒,就不用设置(也不要改默认的qqEmail和secret)。
最后双击monitor.cmd即完成,每日17点自动下载数据。
在利用python程序发送QQ邮件时,需要开启QQ邮件的SMTP服务,操作方法如下,第一步打开QQ邮箱,点‘设置’。
开启以下的两项服务,并生成授权码,授权码为python程序通过SMTP发送邮件的密码,即上一节文档的secret(不同于QQ邮箱登录密码)
在启动服务的过程中,如果该QQ账户没有绑定过手机号,可能会需要验证,这里不再赘述。
致谢: 感谢tushare项目提供借鉴学习的机会;感谢生意社网站的商品基差数据的公开。
交流: 欢迎加QQ群交流809290570
数据仅供参考,不构成投资建议,投资者请自行研究,风险自担。