近年来,随着国产数据库的不断成熟,以及在性能、可用性、稳定性、易用性等方面的不断突破, FusionDB 等国产数据库在电信和金融等行业已经得到广泛应用。而伴随着中国经济的快速发展与企业云化进程的不断加快,企业更加倾向于采用高性能的国产化数据库服务以及数仓服务,来满足海量、实时、在线的数据处理需求。
“数字化转型进程的加快驱动着数据的爆发式增长,用户对于数据库的性能有着越来越高的要求。通过在第四代英特尔® 至强® 可扩展处理器上采用英特尔® Open Analytic Toolkit、英特尔® QAT等技术进行优化,我们增强了 FusionDB 在数据库索引、物理备份等场景下的性能表现,这有利于用户在高效应对性能敏感型业务的同时,保护在数据库方面的投资。”
(资料图)
韩雨发
超聚变算力服务产品部部长
“超聚变数字技术有限公司(以下简称:超聚变)推出了基于第四代英特尔® 至强® 可扩展处理器的 FusionDB 数据库解决方案。该方案释放了第四代英特尔® 至强® 可扩展处理器在加速数据处理方面的巨大潜力,并采用英特尔® Open Analytic Toolkit 和英特尔® QuickAssist(英特尔® QAT)等技术对 FusionDB 数据库进行了优化,解决了数据库面临的多个性能瓶颈,打造了高性能数据库系统,为用户提供了流式、实时、离线、在线数据聚合等灵活的混合分析能力。
“部署高性能数据库已经成为组织释放数据价值的重要方式,这依赖于软硬件协同创新优化。通过与超聚变合作,我们为金融、政务、电子商务等行业用户提供了卓越的高性能数据库选项,助力用户释放数据价值。我们也希望进一步提升双方的合作深度,加速基于第四代英特尔® 至强® 可扩展处理器的方案创新,赋能数字经济发展。”
李亚东
英特尔中国政企及全球 OEM 解决方案事业部总经理
第四代英特尔® 至强® 可扩展处理器与英特尔® 技术优化性能
为了进一步增强 FusionDB 数据库性能优势,超聚变与英特尔从硬件升级、软件优化等多方面进行了合作。在硬件层面,超聚变选择了搭载第四代英特尔® 至强® 可扩展处理器的数据库服务器作为基础验证平台。
第四代英特尔® 至强® 可扩展处理器通过创新架构增加了每个时钟周期的指令,每个插槽多达 60 个核心,支持 8 通道 DDR5 内存,有效提升了内存带宽与速度,并通过 PCIe 5.0( 80 个通道)实现了更高的 PCIe 带宽提升。第四代英特尔® 至强® 可扩展处理器提供了出色性能和安全性,可根据用户的业务需求进行扩展。借助内置的加速器,用户可以在 AI、分析、云和微服务、网络、数据库、存储等类型的工作负载中获得优化的性能。通过与强大的生态系统相结合,第四代英特尔® 至强® 可扩展处理器能够帮助用户构建更加高效、安全的基础设施。
第四代英特尔® 至强® 可扩展处理器内置了英特尔® In-Memory Analytics Accelerator(英特尔® IAA)、英特尔® 高级矩阵扩展(英特尔® AMX)、英特尔® Data Streaming Accelerator(英特尔® DSA)、英特尔® QAT 等高级硬件能力,能够加速 AI、数据分析、数据加解密等场景下的处理能力,满足用户的多样化算力需求。
在该平台的支持下,超聚变针对 FusionDB 数据库在索引访问、端到端备份中的缓存机制等方面的瓶颈,与英特尔协同开展了软件优化工作:
采用英特尔® Open Analytic Toolkit 优化布隆索引访问性能
Postgres 内核默认使用 B-Tree 索引。为了提升 FusionDB 数据库的索引性能,超聚变首先使用布隆索引替代 B-Tree 索引,实现了一定的性能提升。为进一步优化布隆索引的访问性能,超聚变通过英特尔® Open Analytic Toolkit 应用了 AVX512 这一重要特性,以使用处理器的单指令多数据 (SIMD) 指令对索引过程进行矢量化,从而优化性能。英特尔®高级矢量扩展512(英特尔® AVX-512)是一套创新的指令集,提升了指令的吞吐能力,能够更好地应对庞大的数据量以及数据库中高维数据所带来的性能压力。
在实际优化过程中,超聚变利用英特尔® AVX-512 的矢量化方式,对 FusionDB 数据库中创建索引和索引查询的过程进行加速。在创建索引的过程中重点解决了数据哈希矢量化问题,从而实现了并行生成每列数据的布隆位图。在索引查询过程中实现了多路并行的布隆位图比较,并支持变长布隆位图。
超聚变针对 FusionDB 数据库索引执行时间测试的数据如图 2 所示,从数据可以看出,在启用英特尔® AVX-512 之后,索引性能最高提升 1.67 倍。
采用英特尔® QAT 提升物理备份性能,节约空间
物理备份是分布式数据库的一个常用场景,为了提升备份效率,超聚变对于 FusionDB 数据库备份缓存机制进行了优化,将备份缓存从 8kb 页面调整为 64kb 页面,从而降低了缓存的增量,提高了吞吐率,更有效地发挥资源性能,大幅提升了全量备份和增量备份等性能。
为了进一步提升FusionDB数据库备份效率,超聚变利用英特尔® QATzip 对于 FusionDB 数据库 gs_probackup 中原有的缓存机制进行优化,在保证前向兼容的前提下,添加可通过参数配置大小的物理备份缓存,使得 CPU 能力得到充分的发挥,进一步提升了全量备份和增量备份性能。
此外,超聚变还对比了当 NVMe 盘缓存大小均为 256KB,全量备份数据量均为 102 GB,并发数为 4 时的 QAT 与 lz4 压缩性能比较。测试数据如图 4 所示,英特尔® QATzip 均能够有效提升数据压缩效率,提升数据备份恢复速度。
在使用英特尔® QATzip之后, FusionDB数据库可以实现50%左右的压缩率,进一步降低了对于存储空间的占用,有助于降低存储成本,提升数据库系统的投资回报率。
方案优势
超聚变与英特尔的联合优化解决了 FusionDB 数据库面临的多个瓶颈,在布隆数据索引、端到端文件备份等场景中提升了数据库的性能表现,能够为用户带来以下优势:
提升索引访问性能,高效支撑性能敏感型业务
通过采用第四代英特尔® 至强® 可扩展处理器并使用英特尔® Open Analytic Toolkit 进行软件优化, FusionDB 数据库能够加速索引访问速度,更有效地应对大规模业务在吞吐、时延方面的挑战,提升业务服务能力。
加速数据备份效率
通过利用英特尔® QAT 加速, FusionDB 数据库可缩短备份恢复时间,降低业务迁移成本,减少业务备份中断时间,同时还可通过英特尔® QAT 硬件引擎卸载 CPU 的压缩任务,降低对系统性能的影响。
降低备份存储成本,提升数据库的投资回报
在使用英特尔® QAT 加速压缩之后, FusionDB 数据库实现了更高的压缩率,有助于节省存储空间,降低支出。此外,超聚变提供了基于第四代英特尔® 至强® 可扩展处理器的 FusionDB 数据库一体机解决方案,能够实现更深入的集成与优化,可以帮助客户降低部署与调优的时间成本。
如果您想要了解该解决方案的详细信息,请关注英特尔开发人员专区微信公众号在后台回复“FusionDB”,即可获取相关资料。
标签:
下一篇:最后一页