鱼和熊掌并非不可兼得
存储设备的容量更迭可谓日新月异,从MB到GB再到TB感觉不过短短数年,并且仍在不断增长。
不过,我猜你对这些情况都不会感到意外。不论是个人数据、工作数据和企业数据,我们记录、存储和管理的数据越来越多。
那么如何在存储海量数据与高效访问这些数据之间保持平衡呢?
对于与工作相关的数据,我有方案可选——即使是超大型数据集,也能应对自如。
设置
扩展数据库时,无论是本地还是云中的数据库,性能都是当务之急。如果性能不高,大规模数据库不过就是一种活动/半活动归档。
如果整个数据集很小且内存 (DRAM) 可以容纳它,那么性能要求就不会太高,存储系统的能力也就没那么重要。但是,伴随着巨大的数据增长,在经济实惠的前提下,内存能够容纳的数据量越来越小。再加上人们对更快速、更详细的分析的需求不断增长,我们已经走到了数据驱动的十字路口:我们需要高性能、高容量和经济实惠。
企业级SATA固态硬盘可以提供帮助。使用这类固态硬盘进行构建,我们可以确保Apache Cassandra®部署不会过时,能够在活动数据集增长过程中保持正常运行,同时在存储容量基础上进行扩展。Cassandra支持大规模扩展,再加上数TB、高IOPS的企业级SATA固态硬盘,让我们可以构建具备超大容量、超高敏捷性和超强功能的高容量NoSQL平台。
注:鉴于Cassandra部署的范围很广,美光测试了多个工作负载。
应用1
企业级固态硬盘满足日益增长的需求
使用旧式普通硬盘存储构建Cassandra节点时,通过向集群中添加更多节点实现横向扩展,通过升级到更大的硬盘实现纵向扩展。有时则要执行上述两种操作。
添加更多旧式节点很有效(在一定程度上),但很快便会变得不实用。我们获得了容量和少许性能提升,但随着不断添加节点,集群变得越来越大、越来越复杂,占用的机架空间和支持资源也越来越多。
升级到更大的普通硬盘有点效果(也是在一定程度上),因为每个节点和每个集群会获得更多容量,但这类升级提供的性能提升也是有限的。
这两种方法的性能成本都很高昂,而且无法随增长实现有效扩展。
Micron® 5200系列等高容量的快速固态硬盘正在改变设计规则。一个固态硬盘的容量可达数万亿字节 (TB)、吞吐量可达数兆字节/秒 (MB/s) 且IOPS可达数万,因此高容量的超快速固态硬盘能带来新的设计机会和性能阈值。
应用2
固态硬盘集群:来自庞大数据集的真实结果
在规划下一代高容量、高需求的Cassandra集群时,固态硬盘可以提供惊人的容量和极具吸引力的结果。图1a-1c总结了美光测试过的存储配置。
测试使用了Yahoo! Cloud Serving Benchmark (YCSB) 工作负载A–D和F来对比三个4节点Cassandra测试集群配置:
固态硬盘配置1:1个Micron 5200 ECO(每个3.8TB)
固态硬盘配置2:2个Micron 5200 ECO(每个3.8TB)
旧式配置:4个15000RPM普通硬盘(每个300GB)
注:鉴于 Cassandra 部署的范围很广,美光测试了多个线程。
在节点数相同且每个节点配备一个固态硬盘的情况下,与旧式配置相比,1个固态硬盘测试集群的容量可以增加3倍(2个固态硬盘测试集群容量可增加6倍)。另外,通过测量发现,接受测试的每个固态硬盘测试集群的所有工作负载均有重大性能提升,最小提升1.7倍,最大提升10.7倍,同时延迟缩短且变得更一致。
应用3
固态硬盘集群提供更一致的响应
读取响应一致性:很多Cassandra部署高度依赖快速一致的响应,因此美光对比了每个测试集群和工作负载的第99百分位读取响应时间。下面显示了每个配置的第99百分位读取延迟。
A
工作负载
频繁执行更新操作的工作负载,其中总I/O的50%为写入数据操作。在应用级别,此类工作负载类似于记录最新会话操作。
B
工作负载
以读取操作为主的工作负载(95%为读取操作)。在应用级别,此类工作负载类似于向现有内容中添加元数据(例如标记图片或文章)。
C
工作负载
只读工作负载。 在应用级别,此类工作负载类似于当配置文件在别处构建时,读取用户配置文件或静态数据。
D
工作负载
读取最新条目(最新记录是访问最频繁的)。在应用级别,此类工作负载类似于读取用户状态更新。
结语
高容量、高性能固态硬盘可以帮助Cassandra实现惊人成果。无论是扩展本地或是基于云的Cassandra部署以实现更高的性能还是更快速一致的读取响应,固态硬盘都是理想选择。
当内存能够容纳数据集时,我们可以获得较高的性能,但巨大的数据增长意味着内存在经济实惠的前提下能够容纳的数据越来越少。
我们正处在一个十字路口:业务需求促使我们寻求更高性能,而数据增长促使我们寻求经济实惠的容量。综合来看,答案很明确:企业级固态硬盘能带来出色成果,帮助满足性能需求和数据增长需求——鱼和熊掌并非不可兼得。
在数据中心内部署固态硬盘是一种能够降低总体拥有成本 (TCO) 的高价值方案。如果想了解这种配置与其他配置的对比情况,请使用美光科技的Move2SSD TCO工具(点击阅读原文)预估与现有架构相比,部署固态硬盘能实现的成本节约。