1. 首页
  2. 考试认证
  3. 其它
  4. 股票买卖最佳时机leetcode DRQN Stock Trading 这是论文《FinancialTradingasaGame...

股票买卖最佳时机leetcode DRQN Stock Trading 这是论文《FinancialTradingasaGame...

上传者: 2024-10-02 21:05:20上传 ZIP文件 15.86MB 热度 11次
股票买卖最佳时机leetcode DRQN在股票交易中的实施背景深度循环Q网络论文使用的模型称为深度循环Q网络(DRQN)。它是一种将循环网络层添加到原始DQN的模型。 Q-learning背后的主要思想是,如果我们有一个函数Q∗:State×Action→ℝ。这可以告诉我们我们的回报是多少,如果我们要在给定状态下采取行动,那么我们可以轻松构建一个最大化奖励的策略:然后,我们可以设计一个深度神经网络作为通用函数逼近器。我们可以将它训练成类似于Q∗。事实上,DQN是许多问题领域的强大模型。然而,它们是有限的,因为它们从有限数量的过去状态中学习映射。这是一个可以合理应用循环网络的场景。具体来说,为了实现深度循环Q网络,我们可能会添加一个LSTM层来记住过去的状态。金融交易在设计金融领域的方法论时,我们需要注意一些特点。代理以离散的时间步长与金融市场交互,即使时间步长可能非常接近,例如,在高频交易中,交易决策可以在几毫秒内做出。从天真地提交具有固定头寸规模的市价单到提交完全指定的限价单,代理人可以向市场申请一系列法律行动。交易规模和历
下载地址
用户评论