(基于算法的挖矿困境研究) 基于策略梯度算法的PoW挖掘困境研究:针对区块链工作证明(PoW)机制下阻塞拦截攻击导致的挖掘困境,将挖掘池间的博弈行为视为迭代的囚徒困境(IPD)模型,采用深度强化学习的策略梯度算法研究IPD的策略选择。 在该算法中,每个矿池被视为一个独立的agent,矿工的渗透率被量化为强化学习中的行为分布。策略网络在策略梯度中预测和优化代理人的行为,以最大化矿工的人均收入,并通过仿真实验验证了策略梯度算法的有效性。 发现早期的矿池处于相互攻击的状态,平均收益小于1,导致纳什均衡问题。政策梯度算法自调整后,矿池由相互攻击变为相互合作,双方渗透率趋于0,人均收入趋于1。 结果表明,政策梯度算法能够解决矿业困境的纳什均衡问题,使矿业联营体的人均收益最大化。 & nbsp
我的煤炭网>新闻>综合信息>选矿知识>(基于算法的挖矿困境研究)
(基于算法的挖矿困境研究)
下一篇:施工机具安全技术措施
上一篇:钻土机结构(旋挖钻机打泥岩技巧)