主页 > imtoken里的ht > AI算法跨界参与比特币挖矿？基于机器学习的最优挖掘策略|火星技术帖

AI算法跨界参与比特币挖矿？基于机器学习的最优挖掘策略|火星技术帖

imtoken里的ht 2023-01-17 11:17:40

我们知道，激励是无许可区块链（公共链）的核心：它们激励参与者运行和保护底层共识协议。

但是，设计与激励措施兼容的激励措施实际上非常具有挑战性。具体来说，用户要么是拜占庭的，要么是诚实的，具有强大理论安全保证的系统也常常排除对可能被激励而偏离诚实行为的理性用户的分析。

因此，当今大多数公链所使用的激励机制在安全属性上都不是绝对的，而且很多都没有经过测试。

矿工投入计算资源来解决 PoW 问题。在早期，人们认为最赚钱的挖矿策略是诚实挖矿目前最好的比特币挖矿机，即矿工一旦解决了 PoW 问题，就会尽快广播 PoW 问题。这个新生成的区块。

后来，在 13 岁时，康奈尔大学的 Emin Gün Sirer 教授和助理教授 Ittay Eyal 提出了一种称为自私挖矿的挖矿策略。这种策略在一定条件下可以获得比诚实挖矿更高的回报。此后，对激励攻击的研究如雨后春笋般涌现。

使用自私挖矿的矿工不会立即广播他们挖出的区块，他们会通过秘密链接他们未来挖出的区块和他们扣留的区块来进行区块扣留攻击。

目前最好的比特币挖矿机

到 2015 年，微软研究院和以色列耶路撒冷希伯来大学的研究员 Ayelet Sapirshtein 等人将挖矿问题描述为具有较大状态-动作空间的一般马尔可夫决策过程 (MDP)，但是，目标挖掘 MDP 不像标准 MDP 那样是奖励的线性函数，因此不能使用标准 MDP 解码算法来解决挖掘 MDP。为了解决这个问题，研究人员首先将具有非线性目标的挖掘MDP转化为具有线性目标的MDP，然后在这个MDP上使用标准的MDP解码算法来寻找最优挖掘策略。

在这种方法中，在建立MDP之前，必须知道各种参数值。在真实的区块链网络中，准确的参数值很难获得，并且可能随时间变化。随着时间的推移而变化，阻碍了该解决方案的实际采用。

论文 1：“当区块链遇上 AI：基于机器学习的最优挖掘策略”

香港中文大学教授、IEEE FELLOW（院士）、深圳大学助理教授、博士后王韬韬与深圳大学教授、博士生导师张胜利近期发表了新的研究论文。

论文链接：

在这篇题为“当区块链遇到人工智能：基于机器学习的最优挖掘策略”的论文中，研究人员使用强化学习（RL）算法通过观察和交互动态学习性能接近最优挖掘策略的挖掘方法与网络。

目前最好的比特币挖矿机

强化学习 (RL) 算法是一种机器学习范式，其中代理学习成功的策略并从环境的反复试验中获得最大的长期回报。

目前，Q-learning 是最流行的强化学习 (RL) 算法，它可以通过更新状态-动作-价值函数来学习良好的策略，而无需环境的操作模型。强化学习 (RL) 算法已成功应用于许多具有挑战性的任务，例如玩电子游戏、围棋和控制机器人的运动。

但是，原始强化学习 (RL) 算法无法处理挖掘问题的非线性目标函数。

因此，论文作者提出了一种新的基于Q-learning的多维RL算法，该算法能够成功找到最优挖掘策略。

AI 算法跨界参与比特币挖矿？基于机器学习的最优挖矿策略 | 火星技术帖

模拟实验表明，通过这种强化学习 (RL) 算法进行挖掘比传统的自私挖掘和诚实挖掘效率更高。有利可图。

目前最好的比特币挖矿机

自由而轻松的评论：这是跨学科研究的最新例子。也提醒了加密货币世界的原住民，新技术的发展也会带来新的问题，我们是不是该担心太多了？别着急目前最好的比特币挖矿机，我们先看下一篇研究论文。

论文 2：《SquirRL：利用深度强化学习技术实现区块链激励攻击的自动发现》

来自卡内基梅隆大学、北京大学、康奈尔理工学院、斯坦福大学的多位研究人员近期发表了题为“SquirRL: Using Deep Reinforcement Learning Techniques to Achieve Automatic Discovery of Blockchain Incentive Attacks”的论文。

论文链接：

标题看似有点混乱，但大意是：使用深度强化学习（Deep-RL）算法实现区块链激励攻击的自动化发现。

在上一篇论文中，我们提到了强化学习（RL）算法，什么是深度强化学习（Deep-RL）算法？

目前最好的比特币挖矿机