• s1.png
  • s2.png
  • s3.png
  • s4.png
  • s5.png
s1.png
曙光 ParaStor300S
ParaStor300S是曙光公司针对大数据时代的用户特点,面向海量非结构化数据存储需求而设计的一款可横向扩展的高端分布式存储系统。ParaStor300S可广泛应用于生物信息、气象预报、环境监测分析、地震监测、能源勘探、视频监控等领域。
联系客服

单一命名空间,多协议并发访问

全局单一命名空间可以为用户构建EB级容量的虚拟存储池,所有客户端可以在同一个命名空间下共享访问所有的数据,可以简化海量数据管理的复杂性。

ParaStor300S架构中,存储节点构成节点池,同一节点池划分为多个存储池,将物理资源进行统一管理和池化,在存储池的基础上再次划分为不同存储卷(文件系统),实现多层级细粒度的资源管理方式。

ParaStor300S

ParaStor300S对外支持多种存储访问协议:

⚫ POSIX:提供符合标准POSIX语义的文件系统接口,是ParaStor300S提供的内核态的Linux私有客户端访问协议,一般适用于高速网络的高性能计算应用领域。

⚫ 集群NAS:通用的网络文件系统接口,支持NFSCIFS/SMBFTP;业务客户端无需安装任何代理程序,按照标准协议挂载后,即可访问;使用简单便捷,适用于绝大多数的非结构化数据共享的场景。

⚫ ISCSI:对外提供ISCSI标准块存储服务。

⚫ S3:兼容AmazonS3访问接口,适用于对象接口应用场景。

⚫ HDFS:提供大数据接口

⚫ 同一集群可以同时提供POSIX、集群NASISCSI块、S3对象接口,HDFS,满足前端不同的业务应用。

 

性能卓越,线性增长

ParaStor300S是一款基于对象的分布式集群系统,数据切片成固定大小的对象,条带化地分布到多个存储节点的多个磁盘上,提供并发的传输通道实现并行的I/O访问,有效地提高了存储系统的读写带宽和IOPS。同时系统聚合性能随着节点规模的增加而线性增长,消除传统的Scale-up纵向扩展存储架构的性能局限性。

除此之外,ParaStor300S通过多项技术进一步提升性能:

⚫ 内部高速互联:集群内部网络采用高速网络,基于高速传输协议,获得更高的带宽、更低的延迟。

⚫ 内核态POSIX协议:在高性能应用领域中,可以采用内核态的私有客户端协议,并发访问能力更强。

⚫ SSDCache:存储节点配置一定数量的SSD,作为本地节点的二级读缓存,提升数据随机访问性能。

 

全冗余架构,稳定可靠

可靠性是存储系统的基本要求,尤其对于中大规模的分布式系统,稳健性更是重中之重。ParaStor300S采用冗余架构设计,从部件、网络、节点、数据冗余等各个层面保证数据的安全性及系统的稳健性。

⚫ 部件可靠性

ParaStor300S基于曙光服务器构建,选用的是曙光当前阶段最为成熟、稳定且市占率很高的硬件产品,主要部件均是冗余配置,单个部件的故障不会影响整个节点的正常运行。同时ParaStor300S系统的WebUI管理界面集成了部件的监控功能,部件发生故障,将给出准确的告警信息,便于用户及时定位维护。

⚫ 网络可靠性

存储系统采用冗余网络拓扑,任一链路发生故障,均不影响系统的正常服务。

⚫ 节点可靠性

所有节点并行提供服务,在冗余规则之内发生节点故障,不影响存储服务。

⚫ 数据冗余

ParaStor300S支持多副本、EC纠删码两种数据冗余方式,可以针对节点池设置不同的冗余策略,保障数据一致性。

快照管理

ParaStor300S支持基于文件/目录的快照技术,针对同一文件或目录创建多个时间点的文件映像,实现对快照目录/文件的内容保留。通过快照回滚,恢复特定时间点的数据。

单一集群内文件快照数量最多支持20000个;支持对于目录的嵌套快照,并具有丰富的快照管理策略,支持按照每天、每周、每月、每年的粒度设置定期策略;

快照作为一种备份容灾技术,可以进一步保证用户的数据安全。

SSDCache

SSD相较于机械硬盘,带宽及响应时间有着明显的优势,并且容量远大于普通内存。将SSD作为缓存资源,可以显著降低存储系统的响应时间,有效提高数据的访问频率。

ParaStor300S系统中,存储节点配置一定数量的SSD,组成介于HDD与内存之间的二级本地缓存池。

SSD作为读缓存时,利用SSD盘对随机小文件读取速度快的特点,通过智能算法将访问频度高的随机小文件热点数据存放到SSD上,应用程序再次访问该数据时,可以直接从SSD上获取。由于SSD盘的数据读取速度远远高于机械硬盘,因此可以显著缩短热点数据的响应时间,从而提升系统的性能。

分级存储

数据生命周期的不同阶段,数据存在特定的冷、热属性,同时存储系统中存在不同速率、性价比的存储介质。分级存储功能可以将数据存储在不同的介质层中,并可以按照既定策略实现数据在不同层级之间的智能流动,在成本较低的情况下在一定程度上提升系统的性能。

ParaStor300S资源组织采用两级池化的方式,第一级是将选取节点构成节点池,第二级是选择节点池中的存储介质构成存储池,基于存储池创建存储卷,即文件系统。当存储池存在不同的介质类型时,可以启用分级存储功能,进而实现文件系统在不同层级上的数据迁移。

存储池可以从同一节点池中构建,可以跨不同的节点池构建,对应到分级存储将会有两种不同的配置方式。第一种,每个存储节点配置不同层级的介质,将存储节点加入到同一节点池,进而创建存储池及文件系统;适用于不同类型盘的数量较为悬殊的情况;第二种是,两种类型的节点分别配置不同的存储介质,两类节点分别创建节点池,存储池跨两个节点池创建,此情况要求节点池的数据冗余方式(副本或纠删码)相同。

ParaStor300S中分级存储最多支持4个层级,分别是极致性能型(NVMeSSD)、性能型(SATASSD)、均衡型(10krpmSASHDD)、容量型(7.2krpm SATA/NL-SAS HDD)。

当启用分级存储后,新建文件系统时可以指定优选层级,即指定数据优先写入的层级。当写入的数据量大于优选层级的容量时,将按照系统默认的策略写入到其他层级。对于已经写入的数据,可以基于文件系统/目录设置数据迁移策略,具体包括文件名、文件大小、修改时间、访问时间、元数据访问时间等。

远程复制

ParaStor300S支持基于快照技术的异步远程复制。支持多套集群之间的目录级别复制,支持11复制、1对多复制(最大为1:3)、多对1复制(最大为32:1)、双向复制。

基本流程为:

1) 建立远程复制关系(复制Pair),确定参与复制的节点集合(复制区域)、复制链路(复制通路)、以及复制Pair的本端目录(主站点)、远端目录(从站点)等;设置复制周期等策略。

2) 主站点数据一次性全复制到从站点,即初始同步。同步前,在主站点目录创建快照,保留一致性点。

3) 按照既定复制策略,周期性将增量数据同步到从站点。

4) 复制过程中故障导致中断,故障消除且系统恢复正常后,尚未复制的数据继续传输,即支持断点续传。

5) 从站点目录默认为只读,当主站点目录故障后,手动将前端业务切换到从站点,从而实现数据容灾保护。

统一管理,简易运维

提供基于Web的图形化监控管理界面,提供系统配置管理、监控告警等功能,直观易懂的图形化界面方便用户实时监控系统的状态,简化了安装和维护过程,提高了管理效率。

同一Web界面可以管理多套ParaStor300S,便于多集群的统一运维。

北京丰祺捷盈信息系统有限公司

公司地址:北京市海淀区西四环北路158号

办公电话:010-61943678

公司邮箱:FQJY@fengqijieying.com