(基于算法的挖矿困境研究) 基于策略梯度算法的PoW挖掘困境研究:针对区块链工作证明(PoW)机制下阻塞拦截攻击导致的挖掘困境,将挖掘池间的博弈行为视为迭代的囚徒困境(IPD)模型,采用深度强化学习的策略梯度算法研究IPD的策略选择。 在该算法中,每个矿池被视为一个独立的agent,矿工的渗透率被量化为强化学习中的行为分布。策略网络在策略梯度中预测和优化代理人的行为,以最大化矿工的人均收入,并通过仿真实验验证了策略梯度算法的有效性。 发现早期的矿池处于相互攻击的状态,平均收益小于1,导致纳什均衡问题。政策梯度算法自调整后,矿池由相互攻击变为相互合作,双方渗透率趋于0,人均收入趋于1。 结果表明,政策梯度算法能够解决矿业困境的纳什均衡问题,使矿业联营体的人均收益最大化。 & nbsp
下一篇:施工机具安全技术措施
上一篇:钻土机结构(旋挖钻机打泥岩技巧)
免责声明:
本网转载自合作媒体、机构或其他网站的信息,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。本网所有信息仅供参考,不做交易和服务的根据。本网内容如有侵权或其它问题请及时告之,本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。