Diem团队梦碎,但成果留存:谈谈Move的编程魅力

avatar
CertiK
2年前
本文约5245字,阅读全文需要约7分钟
本文将讨论Move及其两个特性:支持高交易率的可编程资源以及助于提高安全性的形式化验证。

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

Move是一种相对发展时间较短的编程语言,但已经在许多Web3.0项目中得到了应用。

CertiK安全专家团队最近审计了一个支持Move编写智能合约的新型Layer 1区块链。借此机会,我们将为大家整体概述一下Move这一新型编程语言。

鉴于该内容较为专业,在这篇文章中,我们将讨论Move及其两个特性:可编程资源(有助于支持高交易率)和形式化验证(有助于提高安全性)。

在这一过程中,本文也将展示Move的语法、类型系统和内存模型,并研究工程师在使用Move时可能犯的一些常见错误。除此之外,我们也将从技术角度审视Move形式化验证的潜力及面临的挑战。

什么是Move?

Move是一种用于编写智能合约的特定领域编程语言。最近推出的几个热门项目均支持Move语言,包括Aptos、0L和Starcoin区块链。另外还有Sui区块链同样支持Move语言并将其命名为Sui Move。

Move最初是作为Diem项目的一部分开发的,但这一属于Meta(原Facebook)的基于区块链的支付网络现在已被解散。

在Diem发表的《为什么要创建Move?》文档中,其指出“为了成功支持像Diem支付网络这样的支付系统,我们需要一种可以对数字资产的所有权进行编码,并为这些资产的转移创建程序的编程语言。目前已经有数百种语言在使用,其中一些已经作为原生语言包含到区块链的实现中。

Diem Networks本可以选择一种通用语言,如WebAssembly或Java字节码,或现有的区块链语言,如EVM字节码或比特币script。理论上,我们的确应当选择一种现有的语言,毕竟一种语言的社区、库、工具都和语言设计一样重要,而这些都需要多年的时间来建立。从这一角度上来说,应该谨慎创建一种新语言。但最终选择创建Move是因为我们看到了一个机会——Move将可以帮助我们在几个重要方面对现有替代方案进行逐步改进。”

Diem需要安全地支持大量的交易,因此其团队决定以这些目标为基础创建Move。

可编程资源

Move的关键特征之一是它对可编程资源的使用。一个资源(Resource)直接代表着一条有价值的数据(例如一个用户所持有的项目资产数量)。在Move中,每个持有项目资产的账户中通常都存储着可以直接代表该资产的数据。这与Solidity中项目资产的表示形成了鲜明的对比,从账户到他们持有的项目资产数量的映射,Solidity通常是使用一张映射表在智能合约中进行记录。

这种对可编程资源的利用有两个主要优势。首先,它形成了一个支持高交易率的智能合约编程模型。如果一项交易涉及两个「仅相互交互」的账户,该交易可以与其他交易并行执行。类似于现实生活中,小明在便利店结账付款并不影响小红的结账付款。Aptos区块链就是一个很好的例子,其使用软件交易存储器来并行运行交易,并检测两个同时进行的交易是否可能发生冲突。

可编程资源的第二个优势是它们可以自动验证程序是否存在某些类型的错误:例如,资源永远不会被悄无声息地删除或复制——这是由Move编译器完成的。但是仍然有可能在智能合约代码中引入算术或逻辑错误,从而导致资源中出现不正确的值。

下图来自GitHub(https://github.com/move-language/move)上的Move文档,显示了区块链数据在Move中的组织方式。Move将区块链状态称为全局存储。

每个区块链地址代表一个账户,其中一些可能是外部拥有的。与以太坊不同的是,所有地址都可以存储数据。在下图中,BasicCoin持有者的账户中有数据表明他们所持有的BasicCoin数量(资源)。该图显示,地址0x42还拥有一个实现BasicCoin的代码模块。

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

当使用Move编写智能合约时,最好的做法是将资源存储在拥有该资源的账户中,而非包含该智能合约代码的账户中。尽管有可能在Move智能合约中实现「Ethereum风格」的资源映射,但涉及此类合约的交易可能无法并行执行。

Move的安全功能

Move包含几个可帮助开发者创建更安全智能合约的功能。其中就包括上文所提到的“编译器会检查资源的基本使用情况”这一功能。Move语言原生就支持形式化验证,并有意排除了那些容易导致形式化验证困难的语言结构。

此外,Move还支持泛型。泛型编程(Generic Programming)允许通用代码在不同类型中被重复使用。

这一点很重要,因为使代码更安全的一种方法是重用那些已被专家精心编写过的代码,少编写一些新代码。就像许多Coin共享实现代码——如Aptos Coin标准所示,通用编程允许该代码在不同Coin之间共享。

Move类型系统和Rust

在处理有价值的数据时,追踪清楚是谁拥有这些数据,并限制对这些数据的操作(如复制或删除)十分重要。

幸运的是,已经有一种开发完善的支持所有权特性的编程语言:Rust。Move的开发者在类型和语法方面都受到了Rust思想的启发。

此图表显示了Move的内置原始类型:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

此图表显示了Move的结构类型,这些是由其他类型构建的类型:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

当涉及到结构类型时,事情就变得有趣了,结构类型是Move中唯一的用户定义类型,一个结构类型是一个存储在字段中的值的集合:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

在Move中,结构是一种“value”类型。结构类型的value在内存或存储中是线性排列的,对一个结构的引用必须明确地构建。这与Solidity不同,在Solidity中,结构变量通常是对底层value的引用。下图说明了这一点:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

字段可以是除引用类型之外的任何类型,结构的实例是通过打包创建的(就像在Rust中那样)。

Move为结构类型的value实现了一个类似于Rust的所有权系统,其中每个value都由包含它的变量或字段拥有。引用并不拥有它们所指向的任何value。

默认情况下,结构value只能被转移到另一个所有者,它们不能被复制或删除。当一个结构value被转移到另一个所有者那里时,它将无法被先前的所有者访问。

在一个结构类型的value被创建后,同一时间只存在该value的一个可以使用的副本。以下代码说明了这一点:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力Move还有一个称为abilities的类型特性,它可以控制一个给定类型的value可被允许进行哪些操作——这是受到了Rust的启发。这四种能力分别是:

Copy:value可以被复制。不具备复制能力的结构在被使用后无法被访问。

Drop:value可以被删除。当一个value的所属变量或字段超出范围时,该value将被删除。不具备删除能力的结构则必须被使用,无法被丢弃。要么明确地销毁它们,要么将它们“转移”到其他地方。它们不能被无声无息地删除或丢弃。

Store:value可以存储在全局存储的其他结构中。

Key:该类型可用作「键」来对全局存储进行访问。

对于结构类型来说,abilities是在结构类型声明中声明的,如下图所示:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

以上内容主要介绍了Move是什么,以及其一个关键特性:可编程资源。

接下来我们介绍Move的另一关键特性:形式化验证,及该特性为Move所带来的优势和弊端。

深度资源

一个资源是一个只有key和store能力的结构体。在Move中,一个账号每种类型的资源只能持有一个。资源不能被复制或丢弃,这使得资源适合直接代表价值的物品,例如coin。

账户与其资源之间的直接关联,使得编写某些「不好的」代码也变得更加困难,例如导致价值意外损失的代码。

但是,不正确的计算以及与资源有关的那些更微妙的逻辑错误还是有可能会出现。这就是为什么我们强烈建议进行智能合约审计来增强安全保障。

区块链上全局存储的编程接口执行了一个限制——每个账户最多只能持有每个资源的一个副本。

一个程序可以使用以下操作在全局存储中创建、读取、更新和删除资源:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

为了避免资源的伪造及其他不当操作,Move执行严格的数据封装(encapsulation of data)。Move的代码和类型声明被分组为module。代码作为module的一部分被部署到一个账户中。

当一个结构类型在一个模块中被声明时,只有在同一模块中定义的函数可以访问该结构类型的字段或创建该结构类型的value。Move结构声明被视为抽象数据类型,对其module以外的代码隐藏其内部工作原理。module中的函数默认为私有,只能在模块内调用。它们可以被声明为public,这使得它们可以被外部代码访问。module可以有friend,也就是他们信任的其他module,并且可以声明个别non-public方法以供friend访问。

References

Reference是pointer的一种类型,包括对其使用方式的限制。使用pointer的语言中,一个常见问题是悬挂引用(dangling references):指向已被重新用于其他目的或被取消分配的内存或存储。

例如,如果你为一个向量的最后一个元素创建了一个reference,然后缩小了向量,则该reference现在就指向了无效的内存或存储。悬挂引用和其他与不受限制的pointer相关的问题历来是导致大多数软件安全漏洞的原因。

Move处理reference的方式与Rust处理reference的方式类似。它包括类型检查规则,以确保reference的生命周期不长于原始数据的生命周期。当代码创建一个reference时,该reference并没有取得数据的所有权。相反,代码借用了读取或写入数据的能力。

在阅读Move代码时,名称中带有“borrow”一词的操作就会产生reference。

Move语言的定义中并不包含对reference checking的完整描述(borrow checker,它确保borrow的reference不会存留太长时间)。

不过,今年有一份详细的技术论文被发表(https://arxiv.org/abs/2205.05181),该定义中的两个关键规则是:

① 不允许对reference的reference,而且reference不能存储在结构中。这意味着,当一个函数被调用并带有一个reference参数时,尽管它可以返回reference,但也不能将reference存储在一个长期存在的数据结构中。一个函数调用并不会延长reference的生命周期。

② 对局部变量或局部变量字段的reference不能超过局部变量的作用域的终点。

类Rust语法

Move有一种类似于Rust的语法,在某些地方与C风格的语言有些不同。在此,我们总结了一些重要的语法规则,以便更轻松地浏览Move代码。

使用let声明变量:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

类型注释:type和initializer=e是可选的。当它们被省略时,Move使用类型推理来确定变量的类型。

下图是一些变量声明的例子:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

Move有典型的表达式,用于算术、移位操作、函数调用、赋值等,用于流程控制的有if、while、for、break和continue等表达式。

函数是使用以下语法声明的:

其中id是函数的名称,parameter-list声明参数,return-type是返回类型。还有一些必要的注释,如acquires注释。这些注释列出了函数从全局存储中访问的资源,还有关于可见性的注解。如前所述,函数可以是公共的、私有的,或者可以被friend module访问。

形式化验证

智能合约安全和正确地运行至关重要,因为其往往持有巨额的资产。形式化验证是确保一个程序(如智能合约)执行其预期操作的最佳技术之一。

在形式化验证中,工程师编写规范,并以数学方式表达代码的预期行为。然后使用工具尝试检查代码是否符合规范。

我们可以将这种检查视为测试,但这其中有一个关键的区别:它不是检查代码在某些特定情况下的行为,而是检查代码在所有可能情况下的行为。

如果检查通过,则说明该工具找不到代码违反规范的用例。不过这并不意味着代码100%不存在违反规范的情况,因为工具或编译器的漏洞还是有可能导致错误的发生。但这依旧使得其比运行一组测试用例提供了更严格的规范保证。

对于一些代码,特别是复杂的代码,工具可能无法自动检查代码是否符合规范。因此工程师也许需要为一小部分的代码添加具体化的规范,直到检查器能够成功运行为止。工程师甚至可能需要写证明规则,然后该工具会根据数学原理检查代码是否符合这些证明规则。

因为确保智能合约的安全是至关重要的,一些智能合约编程语言会原生就提供对形式化验证的支持。就像Solidity编译器提供的SMTChecker工具,它假设requires子句始终为真,然后试图证明assert子句永远不会失败。

Move也对形式化验证技术进行了集成支持。它含有丰富的用于形式化验证的规范语言,能够规范比Solidity的requires和assert子句更复杂的属性,并且有目的地删除了会对形式化验证造成问题的语言结构。Move的开发环境中就包括一个名为“Move Prover”的检查器。

CertiK由两位常春藤盟校的计算机科学教授所创立。作为区块链安全领域的先驱,CertiK运用的正是目前最先进的形式化验证技术。创办CertiK的两位教授均是形式化验证方面的专家,并创建了CertiKOS——世界上第一个也是唯一一个完全被验证的并发式多核操作系统和管理程序。CertiK致力于通过将形式化验证技术应用于安全审计以确保智能合约的安全。

因此,CertiK安全专家自然而然地就注意到了Move这一集成了形式化验证技术的编程语言。

下方是一个double函数及其规范的简单示例。double函数的功能是将一个64位无符号整数(unsigned integer)进行翻倍计算。由spec double给出的double 规范从数学上描述了预期的结果。

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

规范语言是Move的一个集成部分。规范被分离成spec block。spec block指定了函数的前置条件(requirements)和后置条件(ensures)。

前置条件需要在函数被调用之前必须为真,以便该函数能够正常运行。而后置条件则是指当函数返回时必须为真。

此外,spec block还指定了失败条件(aborts_if)。规范语言支持大多数常规Move语法。它还支持用于指定程序行为的重要附加功能,包括forall、exists和implies。

下方是spec block的示例:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

Move Prover将规范和程序语义转换为了逻辑表达式。然后将它们传递给可满足性模理论(SMT)求解器,例如Z3和CVC5,以证明或反驳。以下大幅简化的图表说明了这一点:

Diem团队梦碎,但成果留存:谈谈Move的编程魅力

形式化验证有其优势也有弊端。

形式化验证被认为是构建可靠程序的“黄金标准”,并被用于许多如NASA这样的关键任务系统。编写系统行为的形式化规范可以暴露出逻辑上的不一致或思维的不清晰。

然而即使是对于专家来说,将相对简单的系统进行形式化规范也是困难且耗时的。

除此之外,在处理更复杂的程序或规范时,检察员也会遇到阻碍,并且可能会需要极长的时间来将其解决。

在CertiK接下来发布的文章中,我们将更深入地探究Move形式化验证的潜力和其所面临的挑战。

由于形式化验证的复杂性,CertiK在此建议如有需求的用户应当寻找一个在形式化验证方向有所建树的安全机构来进行合约审计或是协助对合约的形式化验证。

写在最后

我们希望这篇文章可为想要了解Move语言的读者提供足够的参考价值。

Move确实引入了新的方法来解决可扩展性问题以及提高安全性。然而,没有一种语言可以100%保证安全,非可扩展的或不正确的代码仍有机会干扰Move的内置功能。

如同Web3.0,兔子洞的存在是永远数之不尽的。

如果你想了解关于Move技术特点的更多信息,那么建议复制链接(https://move-language.github.io/move/introduction.html)至浏览器访问这些值得参考的开发人员文档,并持续关注我们对Move Prover(一个用Move编写的智能合约的形式化验证工具)进行的技术深入研究。

原创文章,作者:CertiK。转载/内容合作/寻求报道请联系 report@odaily.email;违规转载法律必究。

ODAILY提醒,请广大读者树立正确的货币观念和投资理念,理性看待区块链,切实提高风险意识;对发现的违法犯罪线索,可积极向有关部门举报反映。

推荐阅读
星球精选