2 月 11 日,存储网络Arweave 宣布 2.6 版本已经开发完成,创始人 Sam Williams 表示将会在 3 月 6 日激活网络硬分叉。
本次更新将会集中在两个方面,一是降低 Arweave 存储数据的能源消耗,以提高存储市场的效率;二是激励矿工存储更多数据,尤其是稀有数据备份和音视频等重度空间需求的数据类型。
具体而言,主要会包括以下四个具体措施:
通过鼓励矿工使用更便宜的硬盘来存储数据,而不是继续提升传输速度,从而降低 AR 存储的平均成本;
通过激励矿工备份更多 Arweave 主网数据的完整副本,从而建立更快地索引信息,以实现更“分布式”的数据备份网络;
允许将更多的挖矿算力投放至真正有用的数据类型来减少网络中的能源浪费,避免过度的垃圾信息换取 AR 代币;
允许在 Arweave 网络中以动态价格对存储成本进行估算,从而引导矿工转向更高价值的数据类型存储上,提高网络容错率。
量大从优:空间扩容的第一性原理
在 Arweave 2.6 之前,矿工主要是通过竞争更快的提交验证速度来竞争 AR 代币,但是在 Arweave 2.6 更新中,将会引入哈希速度限制,矿工在单位时间内可以合并的交易量将会下降。
从而会将 Arweave 从计算密集型转向资源密集型机制,更多的硬盘将带来更多的 AR 激励,从而引导网络上的 Gas Fee 消耗转向存储更多的完整数据集。
在数据集的完整性上,将会继续沿用 SPoRA(随机访问的简介证明)机制,从而鼓励矿工存储更多 Arweave 主网的完整数据集,而非通过存储单个数据集的多个副本来作弊。
SPoRA 的特点在于会通过对矿工提交的验证结果进行历史性回溯,主网会随机对新提交的区块进行随机检查,以确认是否存在旧的区块信息,在确认存在后,新的区块才能被纳入主网之中,矿工进而得到 AR 奖励。
通过对整个网络的区块确认机制的修改,Arweave 将会成为空间性最优的新存储网络,以实现减少单位能源消耗的同时,提升整个 Arweave 网络的数据完整性和存储容量。
新式“编织”:挖矿机制将导向增强冗余
Arweave 2.6 意在改变单纯的矿工提交速度,这是出于存储和公链不同的特性而采取的优化措施,比特币等公链竞争的是提交速度,以维护网络的正常结算能力和保证主网确认结果的唯一性,但是存储在考虑确认速度的同时,还需要考虑数据的完整性,以防止单一节点作弊导致数据丢失。
为此,Arweave 2.6 会改变自己的数据组织方式,具体而言,会添加一个新的数据分区(Partitions),以适应新的挖矿机制。
Arweave 中 Weave(块)为最小单一单位,均匀地分布在 Arweave 网络之上,负责标识存储数据的位置,可以类比为“砖头”;而紧随其后的是 chunk(组块),通常是连续的块数据,长度为固定的 256 KB,矿工所竞争的就是针对组块的 SPoRA 提交证明,可以理解为一面墙。
而本次 Arweave 2.6 更新后会新加 Partitions(分区),会以 3.6 TB 的方式组织一个分区的规模,可以理解为一个房间的雏形,以提高数据利用的规模效应。
在更改后的挖矿竞争模型中,为了避免矿工通过存储部分数据集的多个副本来占据空间,每个数据的副本对于每个矿工而言都是唯一的地址,以更好辨识副本位置,并且减少无关数据的存储,从而将空间分配给真正需要的数据。
对于矿工而言,存储完整数据集的多个副本更容易得到主网承认,从而减少存储部分数据的多份副本对主网容量的消耗。
固态 VS 机械:抹除硬盘速度优越性
在设计 Arweave 之初就考虑到对NFT等大型文件的存储,尤其是在和 Meta 达成合作后,Arweave 将承担 Instagram 上 NFT 的永久存储职责,而更多音、视频等数据的涌入,将会导致整个网络的负载和备份能力。
在 Arweave 2.6 之前的版本中,主要采用的是价格非常昂贵的 SSD(固态硬盘),矿工为增加提交成功率,会刻意减少打包此类内容,进而节省宝贵的硬盘空间容量。
在 Arweave 2.6 中,主网上的合并数据块是连续的内存块,因此可以提升 HDD(机械硬盘)的读取性能,基本可以做到 SSD(固态硬盘)相同的读取速度,但得益于远低于 SSD 的价格,矿工可以更大规模组建 HDD 阵列。
并且,为了避免“大力出奇迹”的局面,Arweave 2.6 中会尽可能平衡挖矿机制,以避免矿工通过增加 SSD 来超越使用 HDD 组网的收入水平。
部分矿工仍然可以选择 SSD 来小幅领先同行,但是结合新的单一、稀有数据存储激励措施,存储空间的浪费也会导致矿工的损失。
只要当 SSD(固态硬盘)组网的收入无法覆盖购买 SSD 的花费,那么矿工转向 HDD 就会成为最优解,而网络中的 SSD 存量也会起到保障网络速度的效果。
更新模型:动态定价确保数据完整
Arweave 的目标是“一次存储,永久保存”,用户无需为保证数据完整性而续费,只需要在存储数据时一次性付费,随后 Arweave 会通过缓慢的释放机制分发 AR,来奖励矿工为保存数据而进行的工作。
这里面的关键在于,存储价格需要综合考虑用户的承受能力,矿工的积极性,以及网络的可持续性。
在 Arweave 2.5 中,引入了基于难度的动态定价机制,试图在硬盘价格、存储容量和故障率之间求取艰难的平衡,但是难以计算矿工使用的硬盘速度,因为竞争机制下只能估计主网的平均速度,而很难去评估单个矿工的硬件型号。
而在 Arweave 2.6 版本中,协议将会规定最高硬盘驱动速度,从而让硬盘价格的计算有章可循,在这种机制下,矿工使用超越规定速度的硬盘无法获得额外奖励,因此为动态定价机制确定了一个坚实的基础。
根据测算,Arweave 主网至少可保障 200 年的存储失效,而按照目前的硬盘平均故障时间间隔(MTBF),每份数据至少需要 15 个副本,更具长期保存能力的 HDD 也有利于数据的“永久化”存储。
结语
本次 Arweave 更新,用创始人 Sam Williams 的话来说是“自 2.4 版本发布的 SPoRA(简洁证明机制)发布以来的最重要更新。”从更新内容中可以发现,Arweave 在重新回归存储的初心,即如何永久化的存储更多不同数据。