11月1日,在2023云栖大会上,阿里巴巴平头哥发布旗下首颗SSD主控芯片镇岳510。
该芯片为云计算场景深度定制,实现4μs超低时延,比业界主流降低30%以上 ,误码率低至10^-18,比业内标杆领先一个数量级。
镇岳510将率先在阿里云数据中心部署,可应用于AI、在线分析、在线交易、大数据分析、高性能数据库等业务场景。
为何要自研SSD主控芯片?云计算对存力提出了更高的需求
云计算符合冯诺依曼架构:数据从存储设备中取出,通过网络传送到计算单元,运算结果通过网络传输至存储设备中保存。
算力、网力、存力,共同构筑了云计算的基础。
为了满足云上业务的迅猛发展,以CPU为代表的通用算力,以GPU、NPU为代表的的AI算力,以指数级迅速增加;而网络也从25GE、100GE、200GE快速演进,并将进入400GE、800GE时代。
以SSD为代表的存力,同样面临了新的挑战和诉求。
●极致的性能。
SSD是计算数据的来源与结果数据的目的地,其读写吞吐速率的高低,将制约整个计算系统的性能。
●复杂负载下的稳定时延。
时延是SSD从收到命令到返回命令响应的耗时。云上为了提高并发能力,业务请求通常会被拆分为多笔子请求分散到众多SSD并发执行。任何一块SSD的时延发生抖动,都会造成整个业务请求的延迟。
●更优的TCO。
绿色、减碳是云数据中心的一贯追求。如何提升能效,以更低的功耗,提供更高的性能,是SSD的重要挑战。
●更高的存储密度。
提高数据中心资源利用率是云的核心诉求。提高SSD的存储密度,在单块SSD内提供更大的存储容量,可以有效减少所需部署的服务器数量、交换机/路由器数量。
随着云技术进入深水区,云开始与底层芯片全方位融合联合设计,提供更好的用户体验。
第一:消除SSD接口税。通过存储软件与NAND特性完美契合,达到数据排布的最优化,后台操作的最小化。
第二:全链路QoS优化。延迟敏感型与带宽敏感型IO实现了精细化区分处理,提升延迟敏感型IO的SLA。
第三:智能卸载。可靠性计算卸载至SSD,实现全路径存储语义校验,同时也减轻了服务器主机算力开销。
随着这一系列云计算对存力提出的新的需求的出现,也使得对于SSD主控芯片的能力的要求也越来越高。基于此,平头哥选择自研了更符合“云计算需求”的SSD主控芯片镇岳510。
镇岳510发布:内置玄铁910 RISC-V多核CPU,误码率领先业界标杆一个数量级
和CPU一样,SSD是计算机系统的核心部件,主控芯片作为SSD的「大脑」,负责主机交互、协议解析与执行、数据读写、数据纠错、数据管理等核心任务,不仅直接影响整个系统的性能,还保障了业务的安全与稳定。
镇岳510则是平头哥旗下第一颗SSD主控芯片。
镇岳510支持先进的PCIe 5.0接口,支持DDR 5.0技术,内置玄铁910 RISC-V多核CPU,采用平头哥自研紧耦合芯片架构,对SSD任务进行高度抽象,可固化任务硬化为加速算子以提升性能,FTL关键任务则运行于玄铁910CPU以保持灵活性。
镇岳510每秒可处理高达340万笔IO,一枚镇岳510的性能,相当于1万块高性能HDD的性能总和。
此外镇岳510拥有极高的能效比,每瓦功耗可提供42万笔IO访问
。以一个部署了10万块SSD的数据中心为例,相比目前主流的PCIe 4.0SSD,镇岳510在相同的性能下,仅主控芯片即每年节省260万度电.
按照一度电排放0.785千克二氧化碳计算,每年可减少二氧化碳排放2千吨。
镇岳510内置创新的IO自动化处理机制,前端IO解析与处理,由专用硬件模块自动完成,实现了业界领先的超低的时延(4μs),可以带给应用极佳的体验,比业界SSD降低30%以上。
不仅如此,镇岳510芯片内实现了IO/SYS/GC的全链路隔离,极大的降低这些任务之间的相互干扰,提供了既低又稳定的时延表现。
镇岳510内置了平头哥自研的高性能LDPC纠错算法,编码效率逼近香农极限,同时ErrorFlow相比业内SSD更优一个数量级;
同时借助平头哥自研闪存电压预测算法,可以在各种闪存的不同工况、寿命、温度等条件下,准确预测闪存电压漂移,进一步降低LDPC解码器的输入误码率。
它实现了低至10^-18的UBER,相当于每读取百亿亿笔数据,才可能有一笔数据纠错失败。
镇岳510做了哪些定制?
镇岳510不仅具备更强存力、更高可靠等特点,还通过为云定制,带来更优秀的存储体验。
在传统的系统方案中,SSD与存储系统分离设计。
SSD负责底层闪存数据排布,但无存储语义而无法达到最佳排布;SSD负责后台任务,但无法判断最佳启停时机;而存储系统有存储语义却无法排布闪存数据,有最佳时机却无法启停SSD后台任务。
上下的割裂给整个存储系统的性能与寿命带来了额外消耗,这被称为“SSD接口税”。
因此ZNS协议被发展出来,通过将盘内FTL层上移至存储系统,达到了存储系统与闪存特性的完美匹配,消减了“SSD接口税”。
2021年5月,ZNS协议被收入NVMe规范2.0版本中,并得到了SPDK、Linux以及各设备商的支持。
镇岳510完美实现了ZNS协议,通过灵活的硬件表项加速保持了高IO性能,而Zone分区状态则交由玄铁910CPU维护,保留了对新协议的灵活性。
此外,镇岳510定制了Last Sector 随机写功能,实现了小报文的多次反复下盘,简化了ZNS的应用难度。
数据请求可以分为带宽敏感型与时延敏感型,不同的请求应予以不同的处理策略,才能达到业务最佳SLA。
NVMe规范中制定了以队列为粒度的标准SQ调度机制,但其灵活性较差,对于业务种类复杂、追求灵活可配的云存储系统来说,它并不是最佳选择。
镇岳510在支持NVMe标准的SQ调度机制的同时,额外定制了基于IO粒度的优先级调度机制,允许系统按IO打标,优先级种类多达8级,结合云存储系统,能够更好的保障延迟敏感型业务的服务质量。
云存储系统的完整数据链路 ,从计算端开始,通过网络到存储服务器,再通过内部互联到达SSD。
为了保障数据的高可靠,全链路应采用语义一致的完整性校验。
但NVMe规范只规定了以Sector为单位按照T10 DIF/DIX的校验机制,与存储系统的语义并不相同,因此SSD的校验与存储系统的校验产生了差异。
镇岳510以IO为粒度,遵循上层存储语义进行校验,补齐了整个存储系统的数据链路校验的最后一环。
不仅如此,镇岳510还支持以存储语义对内部数据进行后台巡检,而无需再读出至服务器,节省了宝贵的PCIe带宽、服务器内存带宽与CPU算力。
据介绍,镇岳510将率先在阿里云数据中心部署,可应用于AI、在线分析、在线交易、大数据分析、高性能数据库等业务场景。
得益于基于镇岳510的SSD与阿里云数据存储底座——飞天盘古平台的软硬协同设计,提升了数据可靠性、SLA以及存储效能,构建了从芯片到系统的全栈自研分布式存储。
此外,镇岳510提供的ZNS能力与飞天盘古存储引擎协同,增强了云存储的灵活性,推进了数据中心往软件定义闪存方向发展。
小结:
过去5年,平头哥已推出多款算力芯片,其云原生处理器芯片倚天710已在阿里云数据中心规模化部署,算力性价比提升超30%,已服务数千家电商、短视频、在线教育等领域客户。
此次镇岳510的问世,意味着平头哥的芯片产品家族从算力扩展到了存力领域,进一步为云计算行业提供高性价比的技术底座。
平头哥产品总监周冠锋也表示:“算力、网力、存力共同构筑了云计算的基础,算力和网络在过去几年已实现快速演进,以SSD为代表的存储技术也必须与云计算软件系统融合设计,为企业用户带来更优秀的存储体验。”
token.im