Ahan Blog

「生命在于体验和传承」

2011【SOSP】Windows Azure Storage: a highly available cloud storage service with strong consistency

写在前面: 论文介绍了微软 Azure 存储(Windows Azure Storage,简称 WAS)的整体架构,虽然是2011年写的,但是对于云存储仍然十分具有参考价值。本篇论文的其中一个作者Jiesheng Wu目前正是阿里云的存储负责人。国内的阿里云、字节的存储架构,都很大程度上受到 Azure 存储架构的影响,特别是盘古和 Bytestore,整体架构几乎是照搬 Steam 层。...

2023【FAST】PERSEUS: A Fail-Slow Detection Framework for Cloud Storage Systems

摘要 Fast’23 Best Paper:https://www.usenix.org/conference/fast23/presentation/lu 背景 What is Fail-Slow?——Still functioning bug with lower-than-expected performance 设备可用但是远低于预期的性能 以SSD为例,SSD有读写寿命...

2023【FAST】More Than Capacity: Performance-oriented Evolution of Pangu in Alibaba

paper 总结了阿里云盘古2.0的性能优化的演进和方案,对我们设计一个存储基座有非常好的参考价值。 背景 盘古1.0:主要面向容量,以 HDD 为主,基于 ext4文件系统、kernel TCP; 面对新硬件的高性能,例如 nvme SSD、RDMA 网卡等新硬件,传统的软件无法充分发挥出新硬件的性能优势,因此有了盘古2.0. 盘古的架构: 盘古2.0的核心优化:Low ...

2019 QZFS: QAT Accelerated Compression in File System for Application Agnostic and Cost Efficient Data Storage

问题背景 本文介绍了一种名为QZFS的文件系统,它集成了Intel R© QAT加速器,用于在ZFS文件系统中进行数据压缩,以提供应用无关和成本高效的数据存储。文章的背景是,在大数据处理和云计算等领域,高存储I/O性能和低总成本是两个重要的优化目标,但这两个目标往往难以同时实现。数据压缩被认为是一种有效的解决方案,但压缩任务会消耗大量的计算资源,可能会影响应用程序的运行。因此,本文提出了在...

稳定性概述

什么是稳定性? 在当今数字化浪潮中,越来越多的企业正在依赖云服务或内部基础设施来支持其日常运营和发展。IT 基础设施的稳定性,对企业的影响也日益增大。特别是云服务,已经慢慢成为企业基础设施中的”水和电“,是不可或缺的一部分,一但这些 IT 基础设施长时间宕机,对企业会造成巨大的影响。 我们来看几个实际的案例: 2023年11月27日晚间,多名网友在社交平台反映滴滴出行App疑似故...