【知乎】AlphaGo 的学习决策模型

景德镇陶瓷大学科技艺术学院
内容摘要:
速读文章内容
【知乎】AlphaGo 的学习决策模型

AlphaGo 的学习决策模型是否能用于股票市场的交易?

来自:知乎用户

之前写的匆匆忙忙,再看有很多书写错误,重新编辑一下~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

景德镇陶瓷大学科技艺术学院

泻药(谢邀)~这段时间被阿法狗深深得震撼了,在我还从事人工智能相关研究的时候,还只有机器学习。当深度学习刚刚出现的时候,我还以为只是神经网络叠加而来的又一个名词噱头。现在感觉自己迅速落伍,深度学习确实是人工智能领域的一个极大的突破。之前在使用神经网络和机器学习对付一些“前”人工智能问题的时候,还需要绞尽脑汁自己去寻找好的feature,现在看来确实已经成为上个时代的人工智能了。阿法狗很成功,把小李子虐残了,但是我认为阿法狗只是工程上的一个突破,在深度学习的理论与工程上找到了解决围棋问题很好的契合点,验证了深度学习的强大。而深度学习想要在金融市场交易中获得同样的成功,还有非常长远的路要走。其一,围棋是一个封闭系统,是一个完全信息系统,无论是现在的深度学习还是以前的机器学习,都依赖于庞大的样本训练,训练完成之后的样本外输入,其本质和可能性要与训练样本相同。例如围棋只能你一步我一步在固定区域内下,所有的规则都是实现就已经约定好的。而金融市场并不是完全信息系统,这一点在很多人的回答中也都提到。也就是很多新的情况,是系统不可预估的,并不是在历史中存在的,在这种情况下,之前的训练会失效。做过自动程序化交易的人都知道,如果自己不清楚策略为什么赚钱,不清楚背后的理论是什么,是不敢放任其自动交易的。就算深度学习系统经过了长期验证,也不能保证某些黑天鹅来临的时候,它能正确的应付,这个几乎是无法证明的。或许赚了几年但是几分钟就全亏回去了。比如今天第四场小李子终于赢了一局。在下棋中出现bug输一局无所谓,在交易中出低级bug可能就再也无力翻身了。其二,阿法狗的paper中提到,人类现有的棋谱在训练中只占到了很小的一部分。他们发现如果只用人类现有的棋谱,阿法狗很快会陷入过度优化。因此对于阿法狗的训练,自己和自己下棋才是训练集的大部分。这也是为什么在盘中总是出现一些人类无法理解的下发,认为是阿法狗的失误。其实阿法狗算得很清楚,因为人类在于围棋的各种可能性走法其实还只探索了一部分。对应到金融市场,所有的行情、新闻、财报等等,对于这样一个复杂系统来说,数据量远远不够。但是系统不可能像围棋那样自己模拟出行情、新闻和财报等信息。因为围棋的走法有规矩,而行情并不是随机生成的数据序列。因此想要完全使用深度学习预测明天大盘的涨跌是不可能的,因为没有足够的训练样本。深度学习可能会在无人车,自主机器人领域带给人类最大的福利,因为这些训练都是可以完全充分的。而在金融市场,要把目前的量化交易和人工智能区分开对待。人工智能或许可以在一些特定的金融领域有所作为,比如对逐笔交易,挂单信息的大量数据进行建模和分析,预测短期的一个概率。随着工程能力,计算能力等不断发展,在未来完全使用深度学习进行金融交易也未尝不可。

首页

相关内容

最新发布

专题合集

艺考培训-江西本科院校-景德镇陶瓷大学科技艺术学院-微高校-院校号-景德镇陶瓷大学科技艺术学院-【知乎】AlphaGo 的学习决策模型