固态盘系统经常出错 更正硬盘MediumError

本文内容非商业用途可无需授权转载,请务必注明作者、微博ID:唐僧_huangliang,以便更好地与读者互动。

在前一个晚上写了《低温杀手?Exadata硬盘20℃降速问题分析》之后,有位希捷的工程师朋友说里面有点问题。为了消除误导,今天不得不发一篇更正,毕竟在硬盘专家的眼里,我其实是个外行:)

MediumError是什么问题,严重不?

固态盘系统经常出错 更正硬盘MediumError(1)

十多年过去了,我还能把Medium看成Media,英文不好真可怕…

首先需要澄清一下,Medium Error不是介质错误,不要看成“Media”,人家《鲜为人知的Exadata存储性能秘密》一文里面可是半点没有写错。先不说这次有没有被啥误导,其实自己早在15年前就查过这个单词——“中等错误”。那么什么是

Medium Error呢?

下面我想引用一位兄弟的话:

“(Medium Error)就是不咸不淡的错误:)存储系统认为造成数据错误和丢失的是严重的介质错误,其他振动高低温等可能引起错误的就是中等错误了。”

我画的这个图可能又误导大家了:(

“这个更像是被测硬盘的LBA范围不同——比如会不会LUN0_5从由盘片外圈30%的位置到内圈之间测试,而其它盘从20%的位置开始测试呢?”——在上一篇做出这个猜测时,我承认不够严谨,有点想当然以为“Exadata存储性能”一文中Exadata Cell02节点上使用的都是同品牌型号的硬盘了。

固态盘系统经常出错 更正硬盘MediumError(2)

当我意识到这块硬盘的品牌与其它不同时,这个性能差距就很合理了,根本就没温度啥事情

事实上,原作者石云华先生清楚地交待了这个节点上只有LUN 0_5对应硬盘槽位上使用了希捷ST3600057SS,而其它盘应该都是日立的。

固态盘系统经常出错 更正硬盘MediumError(3)

从温度跟踪来说也是这样,报告低于20℃的是Cell02节点而不是某一块硬盘,也就是说在同等温度下只有希捷那块盘出现了问题。

虽然我们习惯于在一组RAID、一个磁盘组中尽量使用同一品牌型号的硬盘,但像Exadata这样至少3个Cell存储节点,以及一些多盘位服务器/JBOD机箱、跨机箱组建RAID、宽条带化磁盘池的情况,容易出现不同品牌硬盘混用的情况,好在同一时期同规格转速HDD之间性能差距相对小,要是SSD会比较麻烦一些。

“短击”技术及其智能应用

固态盘系统经常出错 更正硬盘MediumError(4)

写错了要承认,但有的技术观点我还想坚持下。上图引用自《Cheetah15K.7 SAS Product Manual, Rev. B》,每款硬盘的平均、道间(Singletrack)和全程寻道时间都是类似的情况。

固态盘系统经常出错 更正硬盘MediumError(5)

除了不惜容量手动“短击”之外,也有存储系统针对HDD这一特点进行了优化,比较有代表性的就是DellSC(Compellent)。当然,有人可能会说今天普遍用SSD提高性能,这个Fast Track技术的价值不大了?其实现在有的自动分层存储技术上,依然有当初数据调度的影子。用过就会感觉出区别,大家都在与时俱进嘛。

对比希捷/日立规格参数,您怎么看?

既然到了这一步,不妨再比较下硬盘参数来验证下前面的性能观点。

固态盘系统经常出错 更正硬盘MediumError(6)

204MB/s的外圈传输率在我记忆中仍然深刻,当Cheetah15K.7刚推出时固态盘还不太普及且平均容量不大,如今随便找块SSD就可以全面秒杀15K硬盘。

让我们暂时先记下3.4ms的平均读寻道时间,这个指标直接与IOPS相关。

固态盘系统经常出错 更正硬盘MediumError(7)

尽管“Exadata存储性能”一文中并未提及日立的硬盘型号,但我判断有可能是Ultrastar 15K600系列。对比手头的资料,日立这款盘的内外圈传输率均比希捷Cheetah 15K.7略低,读寻道时间也写的是3.4ms。

这个寻道时间加上2ms的15K硬盘平均旋转延时,计算出IOPS是185,测试中达到400左右的水平需要增加QD(队列深度),也许当年在这块技术上希捷略胜一筹吧。

我再拍下脑袋,日立(HGST)15K600会不会后来有过升级传输率提高了呢?

最后给大家推荐几篇我之前写过硬盘方面的文章,如果是已经读过朋友,那我更应该感谢您的关注和支持了!

3.5寸万转复活,却难阻硬盘技术日暮西山

从硬盘设计思想到RAID改良之道

这些硬盘参数你都懂吗?(上)-从案例引发的讨论

OCP开源硬件2:SMR硬盘技术路线之争

OCP开源硬件1:IP硬盘&存储密度

注:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。进一步交流技术,可以加我的QQ/490834312。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)

尊重知识,转载时请保留全文。感谢您的阅读和支持!《企业存储技术》huangliang_storage

原文链接:http://mp.weixin.qq.com/s?__biz=MzAwODExNjI3NA==&mid=2649775168&idx=1&sn=ddd13c3560eb1c93b83b86ebb1e7eb52&chksm=83773d1db400b40bc12cec357555984e0048125b97049261105e0a1449d41d24597e382a1bd6#rd

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页