现在我们最熟悉的存储单位当然是 MB、GB,以及正在普及的 TB,那么再往上一个数量级的 PB 又是什么样子呢?一家名叫 Aberdeen 的公司近日推出了一套最大容量可达 1PB 的商业存储系统“Petarack”(名字不错),而价格“只要”49. 5 万美元。
该系统包含八个 JBOD (磁盘簇),而每个 JBOD 内有 45 块近线 nearline SAS 硬盘,单个容量 3TB,因此总共有 360 块硬盘、1080TB 容量。
不仅如此,系统内还有空间放置第九个 JBOD 和两个 HBA 卡,容量能因此再增加 135TB 而达到 1215TB,不过默认情况下空闲的 PCI-E插槽会留给 10Gb 以太网卡或者光纤 HBA。
大多数硬件 RAID 控制器都自带处理器,用于存储任务的加速,而多数现代 6Gbp RoC 都是双核心配置,频率最高大约1.2GHz。虽然它们都宣称可以通过扩展器支持最多 256 个设备,但是一旦连接上十几个,就会成为性能瓶颈,此外缓存容量也有限,都在 256MB-4GB 之间,这是大型存储引用必须解决的问题。
Petatrack 在每个机柜的两个存储服务器内都使用了两颗六核心的 Intel Xeon X5670 2.93GHz,默认各自配备 48GB DDR3 内存,最高可以扩展到 192GB。之所以用双路服务器是出于冗余目的,一个失败了另一个会自动介入,此外还能提供更多 PCI-E扩展插槽位。
每个 JBOD 都包含两个扩展器,各自连接一个存储服务器作为冗余。SAS 硬盘的两个端口也是如此,同样是为了冗余。不管哪个服务器或者 HBA 掉线了,总能有其它数据通道顶上。
震动也是这种大规模多硬盘系统必须考虑的问题,不然就会遭遇性能下滑(Aberdeen 声称会有 50%)、数据错误、硬盘损坏、寿命缩短等麻烦,3TB nearline SAS 硬盘就是目前的最佳选择。如果需要更高的性能,15000RPM SAS 硬盘和 SSD 固态硬盘也都是支持的,甚至能够多种类型共存。
网络连接方面,默认是通过两个 10Gb/1Gb 以太网控制器来支持 iSCSI,而如果你有光纤网络,也可以在不破坏授权的情况下进行使用。
每每说起这种大家伙,肯定会有很多人拿耗电量说事儿。Aberdeen 给出的数据是满容量运行大约会消耗 7000W。该系统使用了两个 40A 移动式插座,每个分出两个 20A 电路,由这四路分担供电。
软件上使用基于 OpenSolaris 内核的 GNU/Debian 用户界面来创建 RAID 阵列,而可选的 RAID 方案有:Stripe、Mirror、RAID-Z1(类似 RAID 5)、RAID-Z2(类似 RAID 6)、RAID-Z3,其中最理想的是 RAID-Z2。
文件系统选择了 128-bit ZFS,其企业可靠性也是久经考验的。
跨平台共享从来都是老大难。可以在 Linux 系统下创建 CIFS,Windows、Mac 系统都能访问,不过 Linux 管理员也通常喜欢NFS 共享,并使用访问控制清单来管理用户授权。

VMware 管理员也喜欢 NFS 共享。vSphere 4.1 的区块级别存储限制是 2TB 分区,vSphere 5.0 则扩大到了 64TB,NFS 共享就无此限制。
性能么,持续、随机读写都能超过 500MB/s,持续读写也可以接近 400MB/s,只有随机写入稍慢,150MB/s左右的样子。
IOPS 吞吐性能同样不俗,持续读取接近 14 万,持续写入也有 10 万,随机读取超过了 12 万,随机写入则不到 4 万。












