IEEE论文:当区块链遇上人工智能——区块链智能未来的三大机会
在谈论ABCD的时候,我们把AI排在blockchain前面,在谈论AI + Blockchain的时候,我们也总下意识地认为区块链服务于AI智能,用区块链解决人工智能的安全和隐私漏洞等缺点, 以AI为主区块链为辅。那么代表生产力的AI真的比代表生产关系的强,更重要?这是我们如何理解区块链,如何定位区块链的问题。以下,我们分享一篇以区块链为主,AI智能服务于区块链论文,用AI智能赋能区块链。
Blockchain Intelligence: When Blockchain Meets Artificial Intelligence 区块链智能:当区块链遇上人工智能
https://arxiv.org/pdf/1912.06485.pdf Zibin Zheng, Senior Member, IEEE, Hong-Ning Dai, Senior Member, IEEE, Jiajing Wu, Member, IEEE
摘要
区块链以其安全去中心的资源共享方式广受关注。然而,现有的区块链系统在运营维护、智能合约的质量保证以及区块链上的恶意行为检测等方面也面临诸多挑战。人工智能的最新进展为克服上述挑战带来了机遇。区块链与人工智能的整合有利于提升现有的区块链系统。本文介绍了区块链与人工智能(即区块链智能)的融合。本文还通过案例分析进一步论证了区块链智能化的可行性,并指出了未来的发展方向。
区块链;人工智能;智能合约;机器学习
一、 导言
区块链因其提供可追踪性、不变性和不可否认性的安全数据共享服务而受到广泛关注。尽管区块链具有诸多优点,但区块链技术的发展仍面临着许多挑战,包括可扩展性差、运营维护困难、在智能合约中发现易受攻击的代码以及识别区块链历史数据中的恶意行为。
人工智能的最新进展极大地推动了各种商业应用的发展。人工智能与区块链的融合有可能克服区块链的局限性。我们将人工智能赋予区块链生态系统的智能能力称为区块链智能。特别是机器学习、数据挖掘和数据可视化等人工智能方法,有助于捕捉区块链中的异常行为,识别交易中的风险,检测智能合约中可能存在的脆弱程序等。因此,可以采取主动识别行动来防止区块链的破坏性或非法行为,从而使区块链更加智能化。
本文旨在回顾区块链技术以及人工智能技术,对区块链与人工智能的结合进行深入分析,提出区块链智能技术。与目前大多数关于区块链与人工智能集成的研究(主要集中在应用区块链来克服人工智能的安全和隐私漏洞等缺点[14])不同,本文主要集中在应用人工智能技术来改进区块链系统。综上所述,本文的主要贡献概括如下:
- 我们首先对区块链技术进行概述,并指出现有区块链系统面临的挑战。
- 然后我们回顾人工智能的进展,正式介绍人工智能和区块链的融合,然后讨论智能区块链带来的机遇。
- 接下来我们将展示一个案例研究,以证明智能区块链的可行性
二。区块链技术概述
作为一种颠覆性的技术,区块链正在重塑不同的行业职能部门。区块链本质上是一种链式的数据结构,存储由整个网络中的大多数节点达成共识验证的交易,如图1所示。由于区块链中已提交的交易已存储在每个节点,因此极难更改或伪造其数据。结合数字签名和非对称加密,对区块链数据进行认证和审计,意味着交易发起方的不可篡改。随着新的验证交易被附加到链的末尾,区块链的长度不断增长。区块链数据的数据分析可能会提到取有价值的信息。
区块链技术的发展经历了两个阶段:1)区块链1.0(即以比特币的数字货币为标志)和区块链2.0(即以太坊的以智能合约为标志)[1]。在区块链1.0中,区块链主要用于比特币等数字货币。区块链的出现促进了智能合约的发展。智能合约基本上由多个当事人同意的若干计算机自动化合约协议组成[2]。智能合约中的合约条款被触发,并在满足特定条件时自动执行(例如,谁违反合约将被自动处以罚款)。
智能合约已经在区块链上实现,如图1所示。经批准授权确认的合同条款被转换成可执行的计算机程序。合同条款之间的逻辑连接也以程序中的逻辑流(例如if else if语句)的形式保留下来。每个合同语句的执行记录为存储在区块链中的不可变事务。同时,智能合约保证了适当的访问控制和合约执行。特别是,开发人员可以为合同中的每个函数分配访问权限。
尽管区块链及其智能合约在重塑各行各业方面都有很好的前景,但区块链系统固有的局限性也带来了不少的挑战。
1) 运行维护。
由于区块链系统的去中心和异质性,很难找出影响区块链绩效的潜在因素。例如,由于采用了不同的一致性算法,Hyperledger Fabric的交易吞吐量瓶颈不同于比特币和以太坊。此外,与其他软件系统一样,智能合约由许多计算机程序组成,这些程序可能会受到软件错误、恶意代码和运行环境不兼容的影响。因此,实现复杂区块链系统的智能化、自动化运营维护至关重要。
2) 智能合约的质量保证。
智能合约也存在许多漏洞,如重入性漏洞[1]、过充问题[3]、随机性控制[4]和去中心化自治组织(DAO)攻击[5]。此外,合约的正确性对智能合约也至关重要,因为一旦合约部署在区块链之上,几乎不可能进行任何修改更新。然而,与软件系统一样,智能合约通常包含编程错误,这些错误可能导致崩溃或错误行为,同时由于智能合约的复杂性,很难检测和识别这些错误。
3) 恶意行为检测。
除了合法业务外,区块链还可能被用于恶意活动,但由于区块链的假名(即匿名区块链地址),这些恶意活动很难被检测到。另一方面,加密的区块链数据也导致难以通过简单的数据分析来检测和识别恶意行为。此外,区块链数据的海量性、异构性以及用户行为的多样性使得问题更加严重。因此,传统的基于分类的方法(如机器学习方法)不能直接应用。
三、 人工智能带来的机遇
人工智能(Artificial intelligence,AI)是一门涵盖机器学习和认知计算的广泛学科,是智能主体进行智能任务的能力。近年来,大数据、人工智能技术(如深层神经网络)和通用计算机硬件(如图形处理单元)的发展极大地推动了人工智能的发展。因此,我们目睹了计算机视觉、自然语言处理、语音识别、情感分析等多种人工智能应用的激增。大数据在推动人工智能和人工智能应用方面起着至关重要的作用。例如,主要基于深度神经网络(DNNs)的深度学习,由于具有海量数据,使得DNNs能够从海量数据中提取(或学习)足够的特征,从而取得了优异的性能。
各种区块链系统的出现产生了海量的区块链数据,这些数据对所有人都是公开的。以比特币为例。据Statista( https://www.Statista.com/)在2019年第三季度末报告,比特币包含近242 GB的数据。对海量区块链数据进行数据分析,不仅可以挖掘出巨大的商业价值,也为克服区块链系统的上述挑战带来了巨大的机遇。人工智能的最新进展也极大地推动了大数据分析的发展[7]。因此,人工智能和区块链技术的集成可以潜在地克服区块链系统的上述挑战,从而形成智能区块链系统。我们将区块链与人工智能的集成称为智能区块链。值得一提的是[14]、[15]在将区块链与人工智能集成方面有很多研究工作,但大多集中在人工智能上利用区块链,以克服人工智能正在出现的安全和隐私漏洞。与这些研究相比,本文的工作主要集中在利用人工智能技术解决区块链的内在问题上。
我们将人工智能为增强现有区块链系统带来的机会总结如下(如图2所示)。
1) 区块链智能运营维护。
区块链实时生成大量数据。通过分析区块链数据,可以发现可能的故障,预测故障,识别性能瓶颈,从而对区块链系统的性能进行调整。数据分析有四个不同的层次,包括:描述性分析、诊断性分析、预测性分析和规定性分析。特别是[8]的工作提供了一个通用平台,通过对区块链数据的描述性分析来评估三个具有代表性的区块链系统:以太坊、Parity和Hyperledger Fabric结构的性能。同时,区块链日志数据的描述性分析有助于监控区块链系统的实时性能,识别可能的故障[6]。除了对区块链数据进行诊断分析外,预测分析对于预测区块链系统的性能瓶颈也是必要的。与诊断分析和预测分析不同,规定性分析可以模拟和优化区块链系统,从而提高区块链系统的可靠性。
2) 智能合约的智能质量保证。
与计算机软件一样,智能合约可能包含漏洞或错误代码,这些代码容易造成系统崩溃和被恶意攻击。为了实现智能合同智能质量保证,对智能合同中的缺陷进行智能检测和自动识别至关重要。如Oyente平台,用于检测和识别潜在的错误。同时,智能合约本质上是对执行成本敏感的程序代码(例如,智能合约的执行由以太坊的gas收费)。因此,有必要确定成本高昂的模式,并纠正这些脆弱的智能合约。在[3]中,Chen等人。开发了一个工具GASPER,通过分析以太坊智能合约的字节码来识别和定位七种耗费巨大的GAS模式。机器学习方法可以自动检测和识别智能合约中的漏洞。此外,越来越多的智能合约也带来了组合多个合约的机会。特别是,我们可以找到并识别满足用户需求的合约,并将它们组合在一起,实现更全面的应用。与传统的分布式软件系统如web服务[11]不同,智能合约缺乏语义描述和服务质量(QoS)评估指标。因此,基于人工智能的新方法有望自动标记智能合约的语义,并提供数据驱动的智能合约QoS评估。
3) 自动恶意行为检测。
分布式的区块链系统导致难以审计区块链平台中发生的洗钱、网络钓鱼、赌博和诈骗等恶意行为。区块链系统生成了大量的交易数据,基本上人人都可以使用,而历史交易数据则是通过匿名账户地址进行的。海量的区块链数据带来了审计和检测恶意行为的机会。对海量区块链数据进行大数据分析,有助于识别恶意用户、识别行为模式、分析市场操纵、发现欺诈行为。[12]的工作展示了以太坊数据的交叉图分析,并确定了以太坊区块链平台上发生的几个主要活动。如[10]所述,提出了一种基于机器学习的方法来检测和捕获发生在以太坊的庞氏骗局。【13】的工作通过奇异值分解(SVD)方法分析了Mt.Gox比特币交易所的泄露交易历史,识别了许多市场操纵模式。此外,恶意用户还可能利用多个匿名帐户组成犯罪团伙,在区块链系统上进行非法活动。新的机器学习方法以及对多个帐户的关联分析有望解决这个问题。
人工智能、机器学习和大数据分析的进步为解决上述区块链挑战带来了众多机遇。接下来,我们将展示一个案例研究,以说明区块链智能的可行性。
四、 案例研究
区块链的数据分析有利于交易欺诈识别和智能合约漏洞检测。然而,对区块链数据进行大数据分析也具有挑战性。1) 由于区块链规模庞大,下载整个区块链数据非常耗时,例如,在一个新加入的对等节点上完全同步(即下载)整个以太坊需要一周多的时间和超过500 GB的存储空间。2) 它需要在提取和处理区块链数据方面付出巨大努力。首先,区块链数据以异构、复杂的数据结构存储在客户端,无法直接分析。同时,底层区块链数据要么是二进制的,要么是加密的。因此,有必要提取和处理二进制和加密的区块链数据,以便获得有价值的信息,而这一过程并不简单,因为传统的数据分析方法可能无法处理这类数据。3) 区块链数据没有通用的数据提取工具。尽管有几种用于区块链数据提取的开放源代码工具可用,但大多数工具只能支持提取部分区块链数据(而不是整个数据)。
A、 以太坊数据提取
为了应对上述挑战,我们提出了一个区块链数据分析框架,即XBlock ETH,用于分析以太坊数据。特别是,我们提取了8,100,000块以太坊的原始数据。图3(a)示出了典型的以太坊事务执行流程,从块N经由区块链对等端到EVM。在此过程中,我们收集三种类型的区块链原始数据:区块、接收和跟踪。由于对原始区块链数据的分析比较困难,我们将获得的以太坊区块链数据处理和分类为六个数据集:(1)区块和交易,(2)以太坊的内部交易,(3)合同信息,(4)合同调用,(5)ERC20令牌交易,(6)ERC721令牌交易,如图3(b)所示。处理raw是非常重要的,因为它需要从原始数据中提取有用的信息并与六个数据集相关联。然后,我们对这些细化的数据集进行统计分析。在以太坊,矿商有更高的优先权将具有更高“gasPrice”的交易打包到区块中。“gasPrice”的可视化如图4所示。从宏观上看(如图4(a)所示),随着以太坊社区的发展,“gasPrice”正在逐渐减少,除了在网络拥塞时由于极其频繁的事务而导致的几个峰值。从微观上看(如图4(b)所示),我们提取了8,000,000到8,020,000块的时间,发现这种“ fluctuations/起伏”的波动可以用潮汐定律来观察。这一观察结果意味着“fluctuations/起伏”的波动是可以预测的。
B、 以太坊检测庞氏骗局
区块链也可以被用来进行诈骗等非法活动的检测。例如,在[10]中,我们提出了一种通过提取和分析以太坊合约中用户账户和操作码的关键特征来检测以太坊区块链中庞氏骗局的方法。图5用以太流图比较了普通合同和庞氏方案合同,其中横轴表示时间线,纵轴表示特定合同的参与者数量,红色圆圈和蓝色圆圈分别表示投资交易和支付交易。此外,圆圈的大小也代表交易量,即圆圈越大表示交易量越大。
图5(a)是正常的博彩合约,图5(b)是典型的庞氏骗局合约(即Rubixi)。我们可以观察到图5(a)和图5(b)之间的几个显著差异:1)图5(b)中的参与者比图5(a)多;2)图5(b)中的支付交易比图5(a)中的支付交易多,交易数量的随机性更强。在提取关键特征并应用其他数据挖掘和机器学习方法后,我们可以从其他正常活动中成功地对庞氏骗局进行分类。
五、 总结
本文首先回顾了区块链技术,并分析了区块链系统面临的挑战。然后我们介绍人工智能(AI)以及AI给区块链系统带来的机遇。我们将这种区块链和人工智能的集成称为区块链智能。主要讨论了人工智能在区块链智能操作维护、智能合约智能质量保证和自动恶意行为检测等方面给区块链带来的好处。此外,我们还提供了一个案例来进一步展示区块链智能的巨大潜力。相信人工智能与区块链技术的融合将进一步推动区块链系统的良性发展。我们将区块链智能的未来方向概述如下。
区块链的实时自动化操作维护。未来区块链系统的智能操作将不再只是进行性能监测和故障检测,而是对区块链系统的多个性能指标进行实时监测,实现从崩溃点的自动恢复。
集体智慧赋予智能合约。目前智能合约的QoS保证方法主要基于对区块链中唯一对等点的合约模式(即检测和分类脆弱合约)的分析。与单个智能体不同,集体智能能够激励所有参与者进行分析和推理,从而贡献他们的集体知识,在全球范围内做出更好的决策。未来,集体智能有望与分散的区块链系统整合,提供可信、智能的区块链服务。
集成多种机器学习方法,以监控和监督区块链数据。区块链分散化给区块链平台交易的监控带来了困难,导致了大量的违法行为。同时,区块链数据的异构性和假名性使得这种情况更加严重。在未来,应将多种机器学习方法结合起来,从不同类型的区块链数据中提取关键特征。此外,交易的动态图(或网络)也可以用来识别不同账户之间的关联,从而识别恶意行为。
展望
个人认为,代表生产力的智能AI是一种线性的量变过程,多少人工多少智能,多少数据多少智能,而代表生产关系的区块链“B”即是一种非线性质变的过程,它通过改变共识的达成,改变了生产关系,改变了组织结构,这种关系的改变,达到的效果可能是非线性的。所以应以区块链为主AI智能为辅,本文只是讨论了,利用智能AI提升区块链,解决区块链上的难维护难识别等问题上。未来,代表着云基础设施的"C", 代表着生产资类的数据"D"也将围绕能达成“共识”的区块链展开赋能,助力区块链发展。
REFERENCES [1] X. Li, P. Jiang, T. Chen, X. Luo, Q. Wen, “A survey on the security of blockchain systems”, Future Generation Computer Systems, 2017, https://doi.org/10.1016/j.future.2017.08.020 .
[2] N. Szabo, “The idea of smart contracts”, Nick Szabo’s Papers and Concise Tutorials. http://www.fon.hum.uva.nl/rob/Courses/InformationInSpeech/CDROM/Literature/LOTwinterschool2006/szabo.best.vwh.net/smart contracts 2.html
[3] T. Chen, X. Li, X. Luo, X. Zhang, “Under-optimized smart contracts devour your money”, Proceedings of 24th International Conference on Software Analysis, Evolution and Reengineering (SANER), 2017, pp. 442–446.
[4] J. Bonneau, J. Clark, S. Goldfeder, “On bitcoin as a public randomness source”, IACR Cryptology ePrint Archive, 1015, 2015
[5] The DAO, The Hack, The Soft Fork and The Hard Fork (2017). https://www.cryptocompare.com/coins/guides/the-dao-the-hack-the-soft-fork-and-the-hard-fork/
[6] P. Zheng, Z. Zheng, X. Luo, X. Chen, X. Liu, “A detailed and realtime performance monitoring framework for blockchain systems,” 2018 IEEE/ACM 40th International Conference on Software Engineering: Software Engineering in Practice Track, pp. 134–143, 2018. (conference proceedings)
[7] H.-N. Dai et al., “Big data analytics for large-scale wireless networks: Challenges and opportunities,”, ACM Computing Surveys, vol. 52, no. 5, 2019
[8] T. T. A. Dinh, R. Liu, M. Zhang, G. Chen, B. C. Ooi and J. Wang, “Untangling Blockchain: A Data Processing View of Blockchain Systems,” IEEE Transactions on Knowledge and Data Engineering, vol. 30, no. 7, pp. 1366-1385, 1 July 2018
[9] L. Luu, D.-H. Chu, H. Olickel, P. Saxena, and A. Hobor, “Making Smart Contracts Smarter,”Proceedings of the 2016 ACM SIGSAC Conference on Computer and Communications Security (CCS ’16), 2016
[10] W. Chen, Z. Zheng, J. Cui, E. Ngai, P. Zheng, and Y. Zhou, “Detecting Ponzi Schemes on Ethereum: Towards Healthier Blockchain Technology,” Proceedings of the 2018 World Wide Web Conference (WWW ’18), 1409-1418.
[11] P. Rodriguez-Mier, C. Pedrinaci, M. Lama and M. Mucientes, “An Integrated Semantic Web Service Discovery and Composition Framework,” IEEE Transactions on Services Computing, vol. 9, no. 4, pp. 537-550, 1 July-Aug. 2016.
[12] T. Chen et al., “Understanding Ethereum via Graph Analysis,”IEEE INFOCOM 2018 - IEEE Conference on Computer Communications, 2018, pp. 1484-1492.
[13] W. Chen et al., “Market Manipulation of Bitcoin: Evidence from Mining the Mt. Gox Transaction Network”,IEEE Conference on Computer Communications, 2019, pp. 964-972.
[14] T. N. Dinh and M. T. Thai, “AI and Blockchain: A Disruptive Integration”, Computer, vol. 51, no. 9, pp. 48-53, September 2018.
[15] Nassar, M, Salah, K, ur Rehman, MH, Svetinovic, D., “Blockchain for explainable and trustworthy artificial intelligence”, WIREs Data Mining Knowl Discov, 2020; 10:e1340. https://doi.org/10.1002/widm.1340