大数据时代的金融投资_Big Data书评-查字典图书网
查字典图书网
当前位置: 查字典 > 图书网 > 科技 > Big Data > 大数据时代的金融投资
eric Big Data 的书评 发表时间:2013-02-13 15:02:04

大数据时代的金融投资

大数据时代的金融投资思维

金融数量化投资由于其巨大收益,是大数据最早应用的领域,而其也符合大数据最重要的三大思维变革:

1) 不是随机样本,而是全数据。 根据作者的定义, 大数据是指不用随机分析,而采用所有数据的方法。 主要原因有二,一是当前的技术能力让人类可以处理海量的数据, 二是随机样本无法获取某些有用的信息,比如跨境汇款中的异常交易。

量化投资与图表派技术分析不同,用全数据进行分析,了解指标或信号在整个数据集上的统计优势,比如我们建立交易策略时就是用了10年所有股票的日内数据。

2) 不是精确性,而是混杂性

大数据时代精确不可能实现,反之用概率说话,混杂性变成了一种标准途径。 对一个交易策略,只要透过全数据分析,在概率上他是能够长期稳定盈利的,即可被投资者考虑采纳。 而到底哪笔交易赚钱,哪笔交易赔钱,虽然投资者很好奇,但交易策略无法给出精确的答案,从某种程度上讲也是无意义的。

3) 不是因果,而是相关性

在大数据时代,是什么比为什么更重要。 虽然这违背了人类好奇和探索的天性,但知道是什么对决策的帮助确实有限。

比如,策略预测某个模式出现后该股票有很大概率上涨,如果执迷于探究股价上涨背后的基本面缘由,则成本过高,也确实无法得出准确的原因。


大数据时代对交易策略的研发提出了几大要求。

1) 量化非结构的数据(unstructured data)。 比如国外的对冲基金和我们自己都曾尝试量化财经新闻,用情感度的变化帮助决策。 但至今为止,我们也没发现某个基于情感分析的策略能够带来稳定明显的收益。
2) 数据的再利用。 Amazon利用用户的购书记录推荐新书,我们是否可以利用用户的观点和交易记录做协助学习(collaborative filtering),帮助策略作出更好的选择?
3) 数据的重组。 把多个数据集的总和重组在一起往往能提高单个数据的价值。 这就好像除了利用股价信息,加上从财务报表提取的因子能提升预测水平一样。做好多因子分析也是我们今年重点研发的方向。

大数据时代与金融投资的未来

1) 投资者的扁平化。 随着互联网和移动互联网带来的信息化革命, 个人投资者将能够轻松使用有大数据实证支持,低风险交易策略,投资能力将大幅提升。
2) 金融市场更加高效。大数据时代令有盈利能力的交易策略能够被更快的发现,验证和应用,金融市场也会变得变得更加有效,起到更好的分配财富作用。
3) 平庸的基金公司将消亡。大数据让科技公司第一次有机会能够挑战传统的金融分析师和交易员,利用对各种全体数据的量化,重组和整合,低成本的建立针对各个市场,面向不同用户的交易策略,让投资者能够科学稳定的在全球市场投资。 实际上,管理1200亿资产,全球最大的对冲基金Bridge Water已经很接近这一点,他们搜集了近百年的金融数据建立交易模型,覆盖全球外汇,债券,衍生品和股票市场,其99%的交易都由电脑决策作出。不远的将来,普通的共同基金将被根据大数据分析提供交易策略的公司所取代,留下的基金公司将是那些能够提供独特优势(alpha)的对冲基金和自营基金(如高频基金和统计套利型基金)。

因此,大数据时代对金融投资的革命不仅仅是未来的趋势,而是正在实现的现实,谁能做到这一点,谁就能引领金融投资的未来。


大数据时代的挑战

让普通人接受大数据时代的思维。 这是最难也是最容易被忽略的部分。 普通投资大众,习惯关注每只股票的输赢,关注购买每只股票背后的原因和故事。 现在,需要他们忽视这些,转而关注概率和相关性, 关注交易策略的整体表现, 这就需要金融大数据分析的公司帮助投资者完成信念的飞跃,强调量化投资在解决普通人投资不确定性问题上带来的好处:
1) 执行上的绝对确定性。 虽然无法告诉投资者每笔投资背后深层次的原因,但至少可以清楚的让他们了解买卖规则,在执行层面行为简单一致,节省时间。
2) 表现上的相对确定性。 虽然无法保证每笔交易盈利,但至少可以透过历史表现让他们了解使用该方法的预期胜率,盈亏比和收益,增加安全感。
简而言之,大数据时代承认金融市场的噪音和随机性,但透过量化和数据资料为投资者找出大概率的交易规律,从而增加操作的确定性和收益的稳定性。


大数据 VS. 理论

最后, 不得不说说最有争议的理论与大数据的关系。 连线主编Anderson关于“理论已死”的观点我不太认同,理论可以在交易策略研发的数据选择,建立和应用假想中起到重大帮助。毕竟,再好的大数据分析也无法替代人类创造性的思维和理解。

例如,在Hedge fund market wizards一书中Jaffray Woodriff描述了数据驱动的大数据分析法。基本想法是尝试千亿种适合不同市场的二次变量组合(如价格的方向和波动率),找出能预测市场位置的统计模型。 但是,即使利用此方法,其实也使用了金融的理论创建如波动率这样的关联物,同时也选择了架构合适的时间周期作为搜索的基础(Jaffray使用的是每日数据)。

如果只关注数据,忽视了未来不等于过去的现实,就容易犯长期资本管理公司(LTCM)当年的错误,给自己甚至整个行业造成巨大的损失。因此,在从事大数据研究时,一定要注意对找出的相关性模式进行逻辑分析和样本外测试(out of sample testing),最好是发现的相关性模式不仅在样本外表现稳定,而且又具备理论上的合理性,毕竟同把尿片和啤酒放在一起不同,在金融行业使用无效模式的后果是相当严重的。

展开全文
有用 104 无用 7

您对该书评有什么想说的?

发 表

推荐文章

猜你喜欢

附近的人在看

推荐阅读

拓展阅读

对“大数据时代的金融投资”的回应

piggyfly 2016-06-08 19:24:36

如果应用大数据规避风险成为一种常态的时候,用大数据的执行结果作为大数据的数据源进行分析,会不会陷入循环而扭曲了本来的市场规律?

犹如炽焰 2014-10-21 00:48:44

其实大数据的本质是把所有的数据收集起来,然后让电脑根据过去猜测未来,其实就是玩的概率!

如果应用到除了金融外的地方还要牺牲你的隐私。没错,玩的是概率!牺牲了隐私!概率!牺牲了隐私!!!概率!牺牲了隐私!!!

舰光辉空虚 2014-08-13 12:36:30

惊现kuhasu大神

Warroir 2014-01-21 09:31:32

目前在做同类工作,也在考虑未来发展趋势。

幸哉乐活 2013-07-29 22:27:03

基于大数据来挖掘金融领域的获利相关性,这个我也在思考,首先要想得到相关性必须分析足够多的数据,这本书里面提供的方法及时样本=总体,这对一般公司都是不可能的,交易所倒是可能,但它的数据会提供给你吗?其二是有了数据并不等于得到了答案,书中有个例子就是google通过数据得出流感的分布和爆发趋势,它只是给我们讲了结果,到底google是怎么处理数据的,我们不知道,所以处理数据的方法很重要。第三关于相关性的有效边际,道德经里有一句话叫“世人皆知美之为美,斯恶已,皆知善之为善,斯不善已。”,也就是当大家都都去用相关性来操作时,从个人行为变成了整体行为,它就会失效的,很可能都等不到它成为整体行为时,它就会失效。这就像索普的鲨鱼泳衣一样,当他刚开始用时,他很有优势,但当大家都穿了那就又站在同一个起跑线上了。

其实我到觉得我们的思维不要狭窄,也可以通过大数据时代谁会受益来找投资标的。google 、facebook、 亚马逊等已经受益了,但国内也有阿里、腾讯、百度也在大数据的收集上有优势啊,阿里已经从大数据上受益了它的小贷公司就是。

Jake Major 2013-06-19 05:38:42

根据你的描述,是否可以这样说,金融大数据分析 == <更广泛的获取市场行情,找到潜在的关联模式,设计对应的概率交易策略> ?
关于新闻的分析,之前也关注过,股市新闻中出现的趋势现象往往是行情趋势的结果,而不是原因。
另外,在计算关联性过程中,如何加入时间延迟要素的考量,这方面有什么相关的话题也介绍一下吧。

kuhasu 2013-06-04 00:25:00

1、很多是错的,包括业内信息了解;2、部分太基础看得太简单;3、缺乏经验;4、加油!年轻人有前途!

eric 2013-05-19 16:20:36

关于5楼的建议,我也一直在思考投资和投机间的区别,是否只有投资区间的区别。 比如bridge water的交易策略,利用了从经济数据存在开始的所有数据构建经济交易模型, 捕捉经济周期中股票,债市,外汇间的不同相关性,他们是在投资还是投机呢?

eric 2013-05-19 16:16:25

关于3楼的问题, 我们还是偏向从交易理论(主要参考论文和著作)出发,加入自己的思考,产生相关性的一系列存在假设,然后建立统计模型, 在全数据集上进行验证的方法。至今为止,利用这些相关组建的策略还是比较稳健的。

eric 2013-05-19 16:07:08

关于2楼的两个问题, 个人的一些看法:

1.如果市场内的大多数人都能借用数据公司的数据分析来决定自己的交易策略,那么过往的数据推导出的相关性可能就受到了很明显的影响,会不会就变成了错误的推论?

会的。金融市场受人的行为影响, 每个相关性都有对应的利润空间。 如果很多人使用这个相关性获利,那么市场在这个方面就会反应得很高效,导致相关性套利空间的减少和消失。

因此,策略师一方面需要寻找利润空间尽可能大并且不易被常人争夺的相关性(如捕捉高频交易中的相关性就需要投资者投入巨大的初始成本,所以竞争相对没那么激烈),另一方面需要经常利用最新数据检验相关性的有效性,从而决定是否继续使用根据这个相关性建立的交易策略。

2.普通的投资者如何才能获取到大数据分析所需的数据报告?

从我们在香港股票市场研究分析来看,公开的股价和财报数据已经提供了非常多的情报, 足够探索出一些有趣的相关性。

星际漂流瓶 2013-05-09 13:13:04

首先,我想将作者的标题改为大数据时代的金融投机,一字之差,谬以千里。在这个基础上,一楼的问题,就由4楼回答了。

旺财 2013-05-05 10:30:07

因此,普通投资者应该全部离场

Galois伽罗华 2013-04-23 14:32:32

好文。 楼主对于大数据如何指导alpha策略的寻找有什么心得吗?

另外不赞同对因果性的弱化。事实上文艺复兴科技公司的宗旨之一就是对数据事无巨细的检索,并与经济结构进行结合解释。 内在原因在于, 金融市场数据虽然表面上是大量的,但对于多参数环境下,每一参数估计可用的样本实际上还是有限的。并且随着使用投资底物数目越多, 数据矩阵就越病态(ill-condition),因此大数据仍然是不够做出良好的统计分析的数据。 所以如果不分析与数据对应的 市场内在结构的话, 难以做出何时市场会发生变化的预测 ,很难控制潜在风险

阿.joe 2013-04-21 18:46:46

写的非常好,当我看完这本书,联想到金融投资的时候,总觉得有些启示,但是只是业余投资者,所以理不清楚相关的主线,楼主的分析让人豁然开朗。不过有两个疑问:
1.如果市场内的大多数人都能借用数据公司的数据分析来决定自己的交易策略,那么过往的数据推导出的相关性可能就受到了很明显的影响,会不会就变成了错误的推论?
2.普通的投资者如何才能获取到大数据分析所需的数据报告?

醉声梦使 2013-04-02 19:56:20

大数据时代