发表于 2019-04-26 18:00:34 股吧网页版
联创量化编程教程1:写模型之前的准备——数据


首先要数据质量有保证,数据质量保证了再来谈模型优劣好坏。事实上我们拿到的很多很多量化数据噪声都是非常大的,即使靠谱的金融数据噪声本来就大,如果再加一些人为失误或造势就更离谱了。我想大部分量化工作者都是从万德或者其他数据源下载来数据就开始套用各种“神奇”的模型了,最后搞得很累,研究10个最后能参与交易的很少,能赚钱的就又靠运气了!

K线数据就一定能表示真正的市场吗,亦或是K线本身只是一件衣服而已。形态很多理论更多,乱花渐欲迷人眼。各种行情软件的功能越来越通用但仍旧无法自定义规则。比如我想看7分钟K线并且要连接起日盘和夜盘无间隔怎么办?往往操作不好会一错再错。尤其是遇到某些指标是依赖前值权重的,那么问题来了起点不同绩效就可能大相径庭,从哪开始起点又完全靠运气了。赚亏都是迷迷糊糊。所以,首选要选准采样点并不局限K线,有必要时二次加工K线。

那么tick数据呢,不同于外盘中国期货数据不是真正意义的tick只不过是时间切片而已,更无法代表真正的当时的队列状态。这也是为什么一些机构花大价钱去购买五档行情。没有钱的朋友怎么办?没办法的靠自己的智慧去猜去探究去实验根据反馈来确定状态。但无论如何非高频状态下,一个工作者能拥有海量tick数据和分析能力那么对将来的研究肯定是大有裨益。


郑重声明:用户在财富号/股吧/博客社区发表的所有信息(包括但不限于文字、视频、音频、数据及图表)仅仅代表个人观点,与本网站立场无关,不对您构成任何投资建议,据此操作风险自担。请勿相信代客理财、免费荐股和炒股培训等宣传内容,远离非法证券活动。请勿添加发言用户的手机号码、公众号、微博、微信及QQ等信息,谨防上当受骗!
郑重声明:用户在社区发表的所有资料、言论等仅仅代表个人观点,与本网站立场无关,不对您构成任何投资建议。用户应基于自己的独立判断,自行决定证券投资并承担相应风险。《东方财富社区管理规定》