映月读书网 > 区块链社会:解码区块链全球应用与投资案例 > 十、存储与下一代互联网 >

十、存储与下一代互联网

(一)Storj

2014年4月,开源、去中心化存储平台Storj,赢得了美国得克萨斯州比特币会议的黑客马拉松奖,获得了小蚁比特(BitAngles)基金25万美元投资。

云存储的未来是去中心化的。想象一下,你能够通过自动网络出租额外的硬盘空间,并获得密码学货币回报。由于中本聪的发明和例如Storj、MaidSafe、Ethereum这样的平台,这一切都能够实现。现在我们有能力将P2P货币与例如存储空间、带宽、CPU(中央处理器)算力连接起来,例如Dropbox和Google Drive(谷歌硬盘)这样的云存储服务就可以有自己的专属货币。

不同于其他比特币2.0平台,Storj决定以“小步走”的方式开发他们的软件。他们想首先开发小规模的系统,作为原型使用。因此他们开发了被称为Metadisk的拖放文件托管网页应用。需要注意的是Metadisk只是Storj平台的一部分,团队将会继续开发更多的网页应用,例如DriveShare(用来出租你的硬盘空间),最终形成一个更紧密结合的完整的去中心化存储平台。

(二)MaidSafe

MaidSafe是一家位于苏格兰特伦(Troon)的英国创业公司。该公司认为,当前互联网存在的问题可以追溯至互联网底层的架构设计。为解决这些顽症,探索可持续的数字内容商业模式,保护用户数据和隐私,以及对抗黑客、恶意软件和过度监控,答案在于重新开始,设计全新的互联网架构。

MaidSafe从2006年以来就在开发自己的新网络,并于2014年早些时候结束了“保密模式”,开始展示其实用计划。当时,该公司正在部署3个测试网络之一,在不运行任何应用的情况下测试底层网络。该公司在2014年第四季度启动了完整的beta测试(一种验收测试)。最初的测试网络包括180个节点,分别位于新加坡、旧金山、阿姆斯特丹和纽约。

MaidSafe是一个完整的跨平台、去中心化的自治数据及通信网络。在实际应用中,即是一个无须中间服务器和数据中心的网络,完全基于点对点架构。因此,MaidSafe将Skype前首席运营官米歇尔·约翰逊(Michael Jackson)作为顾问,而Skype是P2P技术的先驱。

相对而言,这一网络的用户自身也是网络基础设施的一部分,需要贡献出一部分硬盘空间。这一网络构建了激励机制,当用户贡献硬盘空间时将向他们回馈名为“SafeCoin”的加密数字货币。因此,正如许多人为了获得比特币而进行挖矿活动一样,MaidSafe网络的用户在提供计算资源之后将可以获得SafeCoin作为补偿。MaidSafe也希望,随着网络规模的扩大,SafeCoin的价值也将水涨船高。

MaidSafe能将网络内的所有计算机联系在一起,形成类似巨型计算机的设备,或者称为“巨型数字大脑”。因此,这一网络将所有节点联系在一起,在不需要实际数据中心的情况下,将这些节点变成巨大的数据中心。这是一种能取代数据中心,甚至可以取代大型科技公司的网络基础设施。这家创业公司还希望重新配置当前的互联网架构,弱化大型数据中心和平台所有者掌握的权力及中心地位,将权力重新还给个人用户。

个人开发者也将从中受益。在MaidSafe网络中开发应用的成本将低于采用当前的主机模式,建设一家创业公司不需要支付任何主机成本。AWS(Amazon Web Service,亚马逊云服务)和Rackspace(全球三大云计算中心之一)将不再必要。在这样的网络上进行开发不需要任何前期费用,MaidSafe的API也是免费的。

MaidSafe网络的用户贡献出闲置的硬盘空间,将成为网络节点。随后,MaidSafe网络利用大量用户的空闲计算资源形成互联的存储服务,因此存储功能不会集中于某些专门的数据中心。网络无须任何中间人来提供数据。用户可以直接访问网络,而网络也可以直接访问用户的电脑。

MaidSafe是全球首个自主运行、不需要服务器的网络,并支持自我认证。如果某些节点离线导致数据丢失,那么网络能重新创建数据。MaidSafe网络同时也能够抵御病毒,无须服务器,目前没有其他网络能同时实现自治及无服务器。

在MaidSafe网络中,用户使用数字服务时不必暴露自己的隐私,而是只要付出目前并不使用的硬盘空间即可。相对于当前模式,这是一种更公平、更平等的“客户端/服务器”关系。与此同时,通过MaidSafe网络发送的数据在本地加密,随后通过软件进行分块,并经由未知节点随机发送。因此,所有数据以大规模去中心化的方式来存储,能抵御黑客攻击和窃听。

通过服务器和数据中心对数据进行集中存储将带来问题,即数据非常容易受到攻击。这些数据很容易被黑客窃取,无论是由于公司追踪活动还是政府监控,甚至一些政府还会尝试控制用户能访问的内容。因此,基于中间人的方式应当被舍弃。

(三)Sia

1.项目介绍

Sia最初的设计目的是:让云储存去中心化。当前,大多数数据由一个中心如AWS托管。一个单一的企业掌握着所有的数据,而且数据常常是不加密的。当前,把数据放在云中需要信任,即必须相信亚马逊会保存你的数据并尊重你的隐私权。而Sia准备建立一套完全不同的系统来把数据放在云中。即提供一个去中心化的、有奖励机制的、可抗拒拜占庭错误(byzantine fault-tolerant)的云储存系统,而这个系统将与类似的中心化系统(主要是像支持Dropbox的AWS S3这样的系统)产生竞争。

使用Sia时,数据被存在多个存储供应者的主机里。Sia的设置是可以调整的,但系统的标准设置是把一个文件存在30个托管主机里。一种称为Reed-Solomn代码算法使Sia可以把一个文件分成多个部分,并把每个部分分别存于各个托管主机里,这样一来,只要10个托管主机就足够恢复一个文件。这个10对30的方案意味着文件会有三个备份。假设每个托管主机的可靠性是90%,那么这个文件本身的可靠性将达到99.999999999%。即使托管主机没有非常好的在线状态,文件却有相当好的在线状态,可以在多个地区间选择托管主机的能力意味着Sia不受地区网络瘫痪的影响。

所有用户数据在进入Sia客户端的时候都被分割成很多小块,只留下用户恢复原始数据的少数片段。敏感用户信息块被压缩到4MB,用于保护用户隐私。最后,每个压缩块又使用客户端的密钥进行加密。主机接收到一个加密的二进制块,并且没有关于文件其他部分的信息。即便是黑客们发现了,他们也仍然需要破解众多的加密密钥用以恢复文件。客户保存有加密校验,如果主机试图篡改数据,它将提醒用户注意。

Sia平台严格而复杂的加密和去中心化分布式文件系统可被用于去中心化应用开发。它的API使得开发者可以直接在Sia客户端存储文件,允许第三方应用用户直接访问他们的客户端数据存储系统,并且不需要改变原来的客户端。

每一个托管主机都受到加密文件合约的约束。当一个文件上传时,同时形成的合约将确保托管主机只有在完成了预定的时间段里保管文件的条件后才能拿到支付款。托管主机也需要提交一定的押金,如果一个托管主机没有完成合约,它不仅得不到支付款,而且还会失去押金。在文件上传时,上传者清楚这个系统有很强的抗虚假托管主机,以及这些虚假托管主机会受到很严重的金钱惩罚。区块链让这种合约成为可能。

第三方应用和Sia平台用户都有权发布在文件存储上的智能合约。这种特性就使得上传者和主机在存储要素上达成共识,包括存储期限、付费计划和总额,并且可以将信息嵌入到区块链中,自动建立一个不可更改的合约。当合约到期时,主机就会提交一个存储证明至区块链,显示它仍然是合约定义的文件。如果证明是有效的,上传人员的钱将被支付到主机,主机将返回抵押品。但是如果主机提交了无效的证明,或者没有提交证明,那么所有的钱都将还给上传者。

2.应用场景

Sia最大的优势之一是为云储存引进了一种自由市场机制。今天,要成为一个云储存提供者意味着要建立品牌、建立信誉,配以客户服务和支持系统,并且往往需要建立一整套生态系统。Sia消除了所有这些成本消耗。如果你有一个硬盘和互联网连接,你只需要把你的电脑与Sia平台接通就可以开始接受云储存合约和业务。其他人不需要知道你是谁或信任你,你也不需要宣传自己和处理客户服务事项。这有些像比特币的挖矿,你只需要简单地接通电脑,就可以开始挣钱。有便宜资源的人们可以通过向世界各地提供廉价的云储存来谋取巨额利润。在Sia系统里,没有一成不变的供应商和隐私规则(因为在Sia中隐私是彻底的和自动的),只有一种纯粹为储存和宽带而建的自由市场。我们相信这会导致现有市场价格的急剧下降。在测试平台里,我们已经可以看到储存的费用非常低(以现在测试平台中的价格计算,即使使用标准的8倍备份,它的价格也只是传统云储存价格的3%)。

文件内容的分销商(如Netflix、Spotify,或YouTube)能够通过使用Sia的内容分销网而获益。当前的文件内容分销网成本高而且有大量的重复,并且在许多服务器上运行,且这些服务器都是由单一中心来控制的。Sia则能够给互不信任的托管节点付费并使用加密合约来强制执行市场供求协议,这样一来,Sia可以把云储存业务外包给这些托管节点。在使用Sia的时候,文件内容的分销网已经被内置于Sia之中。它还可以为有争议的业务提供一定的保护。比如,Comcast试图遏制Netflix的流量运行。在Sia中,所有流量运行都相同,Comcast将很难筛选并遏制某些流量运行。Sia的自由市场模式也将意味着对于宽带密集型的服务业务来说,分销成本可能有实质性的下降,因为便宜的节点将被优先选用,这也意味着高价的托管节点将可能根本得不到业务(从而增加了降价的压力)。

未来超高速的互联网还会带来一些有趣的可能性。一个超高速的互联网的连接将和固态硬盘连接一样快。使用Google光纤或类似的产品,你的电脑可以不使用硬盘,而可以直接从网上下载所有的东西且其速度和使用硬盘一样快。你将可以把整个电脑上的软件都储存在Sia上,根本就不再需要其他诸如硬盘类的储存方式,并能达到同样的效果。这意味着你可以在世界任何一个角落启动和运行你的个人运行系统和设置,而无须使用任何硬盘设备,如USB(通用串行总线)和CD(光盘),你只需一个简单的互联网连接即可。这种情况一般不会发生在传统的运行系统里,由于其极端的滞后性,如果你能设置一个内存磁盘运行系统(即整个运行系统在一个内存上),并时不时地让它和云储存服务同步,这样速度就不会因为没使用硬盘而受到影响。

比特币的潜在前景之一是把广告从互联网上消除,并用一种付费墙取而代之。比特币可以使这种付费墙设施比任何现有的付费墙都更简单方便。它能使一个用户只需付零点几分钱就可以浏览一个需付费浏览的(但没有广告)网站一定的时间,但这个用户可能再也不会浏览这个网站。如果使用比特币,这种情况可以以一种去中心化的形式来完成,但如果这个网站和这个用户不需要在同一家付费服务公司里,他们只需要在同一个去中心化的付费网络中即可。启动这种服务只需要相当短的时间。然而这里有一个很大的问题,即从免费服务到收费服务的转移。即使它已经消除了广告,但它需要你真的花钱,这会造成巨大的心理障碍,即使这种费用每月不过几分钱。从心理上讲,人们也不喜欢付大量的微小额度款项。

在Sia生态系统中,从一开始,这种付费模式就被强制使用。在这个去中心化的系统里没有免费储存,也没有免费的5GB(千兆)试用,无论它多么便宜。小额度的免费使用和Sia这种机制不相称。Sia上的储存和使用是仪表计量付费制。值得庆幸的是,在我们今天的社会生活里有许多成功的仪表计量付费的例子。第一种重要的例子是先用后付的模式。你的公用事业公司就使用这种模式。当你打开电灯时,当你洗澡时,当你使用洗碗机时,你的公用事业公司实际上在向你处收取一些少量费用。在一个月的使用过程中,这些小额费用会积累成一笔可观的费用,但是你已经习惯了这种方式,而且总体上你大致清楚在什么情况下账单会比较贵。而你在月底会乐意付水电费。第二种模式是先付后用。给汽车加油就是一个不错的例子。每次当你开车时,你会意识到你会消耗汽油而且不久就需要加些油,而且加油时你得一次性付清油费。但你依然乐意开车,因为你知道这是物有所值。

在以上两个例子里,关键是你并没有边使用边付费,而是隔一段时间付一次费。你知道每当你使用时你都在花钱,但你只需在月底付一次钱。当缺钱的时候,你会限制你的消费以免账单费用过高。这些模式很适应人们的心理条件。Sia选择了加油的模式来计算消费。当你开始使用Sia的时候,你得先在你的账上充值(相当于加油),而且你能知道充值后大概可以用多久。当你账上的钱快用完的时候,你会得到一个“低油量”的警告提示你需要再次加油了。由于Sia有内置的付费通道,从未知的服务器和单位下载资料不需要设置任何的时间。只要上传者和储存主机维护者双方均在同一个全球性支付网络中(这个网络由许多相互并不信任的单位组成),他们相互之间可以进行及时且安全的钱款转移。这种付费网络可以有利于上传和下载。

它还完全可以使网上浏览的体验变得更加美好。Sia的付费网络并不只限于去中心化的储存业务,而且内容和资料并不需要直接从Sia的去中心化网络里下载。在使用Sia时,你可以访问和管理中心化网站中的付费墙,以便消除广告并且能够给网站维护者带来更多的收入来源。

目前,Sia的核心焦点是去中心化云储存系统,更具体地说,它就是一种去中心化的对象(objects)商店。在这个平台上,你可以存放和领取各种各样的文件,并能上传只由一个散列组成的一个查询内容。上传简单,且保证文件安全简单,把文件在电脑间传递(如你和朋友之间)也十分简单。寻找你想要的文件也较为容易,而且最重要的是,绝对不会让用户担心上传的文件是否丢失。

Sia也发布了与Crypti合作的消息,Crypti是灵活的后台应用开发平台。在这项合作中,Crypti的工程师可以集成Sia的API,访问Sia的数据存储客户端。作为Sia去中心化应用开发的存储层,Crypti已经集成了Sia。Sia提供了API,可以上传文件到存储网络。Crypti是一个灵活的平台,可以集成多个后台,但是Sia是第一个去中心的尝试,允许开发人员创建实实在在的非信任Crypti应用。

最开始的Sia设计针对安全性、隐私权和数据的完整性。然而在建立这个网络的过程中,Sia也建立了一个开放的市场,在这里任何托管主机都可以参加,并且纯粹以商业信誉来论好坏。一个托管主机的等级将取决于它的速度、价格和可靠性。托管主机将无须考虑客户服务、品牌建立或法律条约等成本花费,托管主机只需在一个层面竞争:在技术上谁更好。其结果将是一个高度竞争的、价格不断趋于下降的、更加可靠的和不断提速的网络。Sia的目标不仅仅是最安全的云储存平台,而且还是最快的和最便宜的平台。在早期,可以看到Sia的价格只占传统云储存平台的10%~20%。目前,Sia云存储网络售价是每TB(百万兆)每月3美元。据网站所述,该网络上已经存储有超过1TB的数据。

Sia网络的超级并行性意味着上传和下载速度可以满足绝大部分连接要求。大型分布式节点整列意味着Sia是一个强大的CDN(内容分发网络)。广义网上不存在编程逻辑,使得Sia在面对电力中断方面更具灵活性,比如在电力供应中断和发生自然灾害的时候。Sia网络在具体实现上的各方面都是非常先进的。

总之,Sia是一个基础设施,它为所有需要远程储存的应用软件打下基础。类似于去中心化的存储项目Filecoin和Storj,Sia的目标是建立一个非信任的、具有容错能力的文件存储服务。无论你是备份你的计算机,传输你的影视文件,还是同步几个机器间的文件,Sia所建立的这个基础设施在将来可以确保数据的安全。

(四)IPFS

IPFS(The Inter Planetary File System)是一种点到点的分布式文件系统,它连接的计算设备都拥有相同的文件管理模式。从某种意义上来说这个概念跟Web的最初理念很类似,但是实际上IPFS更像是互相转发Git目标的单个BitTorrent用户群。IPFS具备成为internet子系统的素质,通过合理配置可以完备甚至替代HTTP(超文本传输协议)。这听起来已经有些不可思议,但其实它可以做到更多。

IPFS的开发目前处于alpha试验阶段,还没能替代现存的网站存储系统。就像其他复杂的新技术一样,有许多地方需要进行改进。但IPFS不是空想,它一直在实际运行着,任何人都可以试着在自己的电脑上配置IPFS,为访问用户提供服务。尽管IPFS的开发还不十分成熟,但有人认为在未来,IPFS将会取代HTTP。

IPFS从根本上改变了HTTP查找的方式,这是它最重要的特征。使用HTTP查找的是位置,而使用IPFS查找的是内容。例如,服务器上运行着一个文件https://neocities.org/img/neocitieslogo.svg,遵照HTTP协议浏览器首先会查找服务器的位置(IP地址),随后向服务器索要文件的路径。这种体系下文件的位置取决于服务器管理者,而用户只能寄希望于文件没有被移动,并且服务器没有关闭。

IPFS的做法则是不再关心中心服务器的位置,也不考虑文件的名字和路径,只关注文件中可能出现的内容。把neocitieslogo.svg文件放到IPFS节点,它会得到一个新名字:

QmXGTaGWTT1uUtfSb2sBAvArMEVLK4rQEcQg5bv7wwdzwU

这是一个由文件内容计算出的加密哈希值。哈希值直接反映文件的内容,哪怕只修改1比特,哈希值也会完全不同。当IPFS被请求一个文件哈希时,它会使用一个分布式哈希表找到文件所在的节点,取回文件并验证文件数据。

IPFS是通用目的的基础架构,基本没有存储上的限制。大文件会被切分成小的分块,下载的时候可以从多个服务器同时获取。IPFS的网络是不固定的、细粒度的、分布式的网络,可以很好地适应CDN的要求。这样的设计可以很好地共享各类数据,包括图像、视频流、分布式数据库、整个操作系统、模块链、8英寸软盘的备份,还有最重要的——静态网站。

IPFS文件还可以抽象成特殊的IPFS目录,从而标注一个可读的文件名(透明的映射到IPFS哈希),在访问的时候会像HTTP一样获取一个目录索引。在IPFS上建立网站的流程和过去一样,而且把网站加入到IPFS节点的指令只需要一条:ipfs add-r yoursitedirectory。网页间的连接不再需要人去维护,IPFS自带的查找可以解决。

IPFS不会要求每一个节点都存储所有的内容,节点的所有者可以自由选择想要维持的数据。就像书签一样,在备份了自己的网站之后,自愿为其他关注的内容提供服务,所不同的是,这个书签不会像以前一样最终失效。

IPFS节点间的拷贝、存储和网站支援都很容易,只需要使用一条指令以及网站的哈希,例如:

ipfs pin add-r QmcKi2ae3uGb1kBg1yBpsuwoVqfmcByNdMiZ2pukxyLWD8

剩下的IPFS会搞定。如果IPFS得以普及,节点数达到一定规模,即使每个节点只存放一点点内容,所累计的空间、带宽和可靠性也远超HTTP能提供的。随之而来,分布式Web将会变成地球上最快、最可靠、最大的数据仓库,人类知识也就再也不会湮灭,亚历山大图书馆永远不会倒塌。

IPFS哈希只能用来表示不可变数据,因为一旦数据改变,哈希值也会改变。从某种意义上来说,这是保持数据持续性的最好设计。但是也需要一种方法来标记最新更新网站的哈希,这种方法称为IPNS。

IPFS哈希是网站通过哈希公钥生成的,相对的IPNS使用私钥来标记IPFS哈希的引用,像比特币地址就是一种公钥哈希。IPNS公钥指向的位置是可变的,公钥的值则是保持不变的。随着IPNS的引入,网站升级的问题可以顺利地得到解决。

由于IPFS/IPNS的哈希值都是很长和难记的字符串,所以IPFS兼容了现存的域名系统(DNS),即可以通过可读的链接访问IPFS/IPNS内容。其使用方法是在nameserver上创建一个文本记录,插入网站的哈希值。

IPFS还计划支持Namecoin。Namecoin从理论上完全实现分布式Web的去中心化,整体的运行中不再需要中心化的授权。支持Namecoin的IPFS不再需要ICANN、中心服务器,不受政治干涉,也无须授权证书。这听起来难以置信,但却是今天可以实现的技术。

IPFS在实现上加装了HTTP网关,使现有的浏览器也可以访问IPFS。因此无须等待,现在就可以开始使用IPFS作为存储、分布和搭建网站的设施。