主页 > imtoken里的ht > AI算法跨界参与比特币挖矿?基于机器学习的最优挖掘策略|火星技术帖

AI算法跨界参与比特币挖矿?基于机器学习的最优挖掘策略|火星技术帖

imtoken里的ht 2023-01-17 11:17:40

我们知道,激励是无许可区块链(公共链)的核心:它们激励参与者运行和保护底层共识协议。

但是,设计与激励措施兼容的激励措施实际上非常具有挑战性。具体来说,用户要么是拜占庭的,要么是诚实的,具有强大理论安全保证的系统也常常排除对可能被激励而偏离诚实行为的理性用户的分析。

因此,当今大多数公链所使用的激励机制在安全属性上都不是绝对的,而且很多都没有经过测试。

矿工投入计算资源来解决 PoW 问题。在早期,人们认为最赚钱的挖矿策略是诚实挖矿目前最好的比特币挖矿机,即矿工一旦解决了 PoW 问题,就会尽快广播 PoW 问题。这个新生成的区块。

后来,在 13 岁时,康奈尔大学的 Emin Gün Sirer 教授和助理教授 Ittay Eyal 提出了一种称为自私挖矿的挖矿策略。这种策略在一定条件下可以获得比诚实挖矿更高的回报。此后,对激励攻击的研究如雨后春笋般涌现。

使用自私挖矿的矿工不会立即广播他们挖出的区块,他们会通过秘密链接他们未来挖出的区块和他们扣留的区块来进行区块扣留攻击。

目前最好的比特币挖矿机

到 2015 年,微软研究院和以色列耶路撒冷希伯来大学的研究员 Ayelet Sapirshtein 等人将挖矿问题描述为具有较大状态-动作空间的一般马尔可夫决策过程 (MDP),但是,目标挖掘 MDP 不像标准 MDP 那样是奖励的线性函数,因此不能使用标准 MDP 解码算法来解决挖掘 MDP。为了解决这个问题,研究人员首先将具有非线性目标的挖掘MDP转化为具有线性目标的MDP,然后在这个MDP上使用标准的MDP解码算法来寻找最优挖掘策略。

在这种方法中,在建立MDP之前,必须知道各种参数值。在真实的区块链网络中,准确的参数值很难获得,并且可能随时间变化。随着时间的推移而变化,阻碍了该解决方案的实际采用。

论文 1:“当区块链遇上 AI:基于机器学习的最优挖掘策略”

香港中文大学教授、IEEE FELLOW(院士)、深圳大学助理教授、博士后王韬韬与深圳大学教授、博士生导师张胜利近期发表了新的研究论文。

论文链接:

在这篇题为“当区块链遇到人工智能:基于机器学习的最优挖掘策略”的论文中,研究人员使用强化学习(RL)算法通过观察和交互动态学习性能接近最优挖掘策略的挖掘方法与网络。

目前最好的比特币挖矿机

强化学习 (RL) 算法是一种机器学习范式,其中代理学习成功的策略并从环境的反复试验中获得最大的长期回报。

目前,Q-learning 是最流行的强化学习 (RL) 算法,它可以通过更新状态-动作-价值函数来学习良好的策略,而无需环境的操作模型。强化学习 (RL) 算法已成功应用于许多具有挑战性的任务,例如玩电子游戏、围棋和控制机器人的运动。

但是,原始强化学习 (RL) 算法无法处理挖掘问题的非线性目标函数。

因此,论文作者提出了一种新的基于Q-learning的多维RL算法,该算法能够成功找到最优挖掘策略。

AI 算法跨界参与比特币挖矿?基于机器学习的最优挖矿策略 | 火星技术帖

模拟实验表明,通过这种强化学习 (RL) 算法进行挖掘比传统的自私挖掘和诚实挖掘效率更高。有利可图。

目前最好的比特币挖矿机

自由而轻松的评论:这是跨学科研究的最新例子。也提醒了加密货币世界的原住民,新技术的发展也会带来新的问题,我们是不是该担心太多了?别着急目前最好的比特币挖矿机,我们先看下一篇研究论文。

论文 2:《SquirRL:利用深度强化学习技术实现区块链激励攻击的自动发现》

来自卡内基梅隆大学、北京大学、康奈尔理工学院、斯坦福大学的多位研究人员近期发表了题为“SquirRL: Using Deep Reinforcement Learning Techniques to Achieve Automatic Discovery of Blockchain Incentive Attacks”的论文。

论文链接:

标题看似有点混乱,但大意是:使用深度强化学习(Deep-RL)算法实现区块链激励攻击的自动化发现。

在上一篇论文中,我们提到了强化学习(RL)算法,什么是深度强化学习(Deep-RL)算法?

目前最好的比特币挖矿机

深度强化学习是一类使用神经网络学习策略的强化学习 (RL) 算法。

深度强化学习 (Deep-RL) 算法在解决具有以下两个属性的问题方面特别成功:

区块链激励机制符合上述性质,事实上,区块链激励机制问题的附加优势是区块链奖励是连续处理的。以下是论文的关键摘要:

论文作者:Charlie Hou, Mingxun Zhou, Yan Ji, Phil Daian, Florian Tramèr, Giulia Fanti, Ari Juels

实验的一些细节

研究人员使用他们提出的 SquirRL 框架对比特币、以太坊和 GHOST 的区块链激励机制进行了实验比较。他们分别为每个区块链协议进行了 100 次实验。这些试验中的每一个都包含 10,000 个状态转换和至少 5,000 个主链中的块,然后分为单个和多个代理进行评估。

目前最好的比特币挖矿机

以下是实验中涉及的4个组件:

以下是单个代理的实验结果的可视化:

AI 算法跨界参与比特币挖矿?基于机器学习的最优挖矿策略 | 火星技术帖

我们可以看到,当攻击者持有的算力(或权益)α低于25%时,SquirRL并没有采取“自私挖矿”的策略,而是采用恢复诚实的挖矿策略。当计算能力(或权益)α 大于 25% 时,SquirRL 优于所有其他方案。

最后,SquirRL 的结果表明,针对比特币的经典自私挖矿攻击在存在多个攻击者的情况下会失效。

这些结果揭示了为什么理论上存在自私挖矿,但在现实世界中它可能是一种糟糕的攻击策略。

自由解说:也是使用人工智能算法进行的区块链主题研究。与之前的论文不同,本研究的目的是识别相关的区块链激励攻击,同时也证明当网络中存在多个代理(即攻击者)时,相关的激励攻击效果会被削弱,即也就是说,网络最终会达到一个均衡的状态,所以我们不用太担心。