这几天两件事闹的人心惶惶,第一件就是Intel酷睿13代、14代CPU的问题,我们稍早推送的《还没结束!酷睿13代、14代稳定失常的原因越来越迷了》有详细内容,这里略过。另一件事是昨天AMD宣布锐龙9000系列CPU延期上市,原因是要解决潜在的封装错误,尽管只延了不到15天,但是相信不少人都会有“这究竟是怎么了”的想法。实际上,与历史上最严重的CPU翻车事故相比,这两件事还真排不上号呢。
你以为最近的热梗13.8比13.11小是假的?真有CPU算不清楚数——1994年推出的Pentium就是这么个大聪明。比如计算962306957033÷11010046,正确结果应该是87402.6282027341,但是在有缺陷的Pentium CPU上,这个计算的结果会变成87339.5805831329。
这个问题的核心是Pentium CPU的FPU浮点计算单元有严重缺陷,会影响到浮点除法运算指令。比较离谱的地方在于,在Pentium CPU推出的几天之前Intel技术人员就已经在测试中发现了这个错误。但是,他们认为这种“90亿次除法运算中才可能出现1次错误”的问题不严重,于是就当什么都没发生了……
结果呢?售卖了一年多之后,在用户以及竞争对手的压力下,Intel不得不在1994年12月宣布召回了受影响的CPU。最后的最后,官方玩梗是最为致命的:Intel将部分存在缺陷的CPU做成了钥匙扣……
千禧年之际CPU的1GHz频率之争愈演愈烈,AMD率先推出1GHz Athlon速龙CPU后,不甘示弱的Intel拿出了自己的1GHz Pentium3。但是这怎么能让Intel满足呢?“我不仅要推出自己的1GHz Pentium 3,我还要超过1GHz!”于是1.13GHz Pentium 3上市了——不为别的,我要告诉各位,我失去的一定会拿回来!
代号Coppermine铜矿的Pentium 3算得上是一款能耗比出色的产品。只是Intel过于心急了,新上市的1.13GHz Pentium 3不久就被用户发现运行软件死机、不稳定。对此Intel放出了一版BIOS作为应对,但无济于事——这时有人发现,把它的FSB前端总线频率从133MHz降低到100MHz,CPU运行频率降低到850MHz的时候,什么事情都没有了!
这个致命问题的核心原因就是这么“质朴”:Intel为了能在GHz大战中“找回面子”,通过强行提高了0.05V电压将Pentium 3频率提高到1.13GHz,再说白一点,就是官方超频玩过头了。结局也是喜闻乐见的:Pentium 3 1.13GHz CPU在上市仅仅一个月后就被召回了,而且因为代号是Coppermine铜矿,这款CPU后来被戏谑的称为“矿渣”。
90nm是一个重要的制程工艺,因为在这一代制程工艺上有两款CPU翻了车。在130nm制程工艺的Northwood Pentium 4大获成功之后,所有人都对后继者翘首以盼。于是Intel推出的全新Prescott Pentium 4就顺利成为了“新王”——现实是它“背刺”了自己……
Prescott Pentium 4推出后立刻就有用户发现,这款采用90nm制程工艺的新CPU竟然比130nm的老款Northwood Pentium 4还要热:Prescott每个时钟周期比Northwood多产生大约60%的热量!造成这个问题的主要原因,就是90nm的制程工艺存在缺陷——晶体管漏电问题无法有效解决,CPU内部大量二极管电路超正常水平的发热。
而且因为是NetBurst架构产物,Northwood Pentium 4为了实现高频率(最高3.8GHz)流水线长达31级。那么它究竟有多拉胯呢?超频到5.2GHz后的Prescott Pentium 4才能与Athlon FX-55的性能基本相当,然而后者频率仅为2.6GHz。更不可思议的是,Intel头也不回的推出了Smithfield Pentium D——用两个Prescott核心“粘起来”的胶水CPU,同样“继承了”漏电问题的超级火炉,还能说点什么呢?
AMD也曾经出现过大纰漏:这就是B2步进的Phenom羿龙CPU。K10架构的Phenom CPU备受关注,尤其是它首创了L3缓存设计——现在CPU的L3缓存有多重要无需多言。然而成也萧何败萧何,AMD不曾想到的是这个L3缓存设计反而出现了问题,即大名鼎鼎的TLB Bug。
TLB是一个高速页表缓存器,它负责的工作就是虚拟内存和物理内存间的映射管理——B2步进的Phenom上,二级缓存TLB被的映射关系表被错放到了三级缓存TLB里,CPU核心在读取的时候就会出现差错,简单点说就是CPU找不到正确的虚拟内存数据和物理内存的映射关系,这样一来电脑就会出现无响应、死机等症状。
这个问题的补救措施是AMD通过BIOS更新来修复问题,大概机制就是告诉TLB不要在缓存中查找映射关系表。这样固然解决了错误导致的无响应、死机问题,但是这样会让内存延迟大幅提升,降低性能。问题直到B3步进的Phenom CPU才解决,然而时不我待,面对Core 2 Duo的强势性能表现,AMD就此进入了一段极为艰难的时期。
酷睿微架构的成功让Intel意气风发,经历了四代发展后,大家对酷睿第五代CPU翘首以盼,然而让大家失望了——“虚假”的Broadwell翻.车.了。
大家可能对酷睿第五代CPU没什么印象,这是因为桌面端的Broadwell就没出几款——桌面端的Broadwell其实是移动版“移植”来的,真正的桌面版Broadwell早就被取消了(如同Meteor Lake-s被取消一样,代号Meteor Lake的酷睿Ultra只有移动版)。而且酷睿第五代CPU的价格也极为昂贵,原因自然是Iris Pro核显和L4缓存设计让成本飞升。
但是,拥有超强核显和L4缓存设计的酷睿第五代CPU并没有获得良好声誉,很多用户发现它拥有很高的蓝屏死机几率,例如在安装Office 2016或者安装Steam游戏时就会发生故障,报错MCE( Machine Check Exception,机器异常检查)。经过检查,人们发现只要在主板BIOS中关闭深度SpeedStep状态就不会出现蓝屏死机等问题了。好在,这个问题并没有那么难解:Intel很快就提供了解决方案,通过升级BIOS更新微代码的方式就可以修复问题。
历史上最严重的CPU翻车事故并不在桌面电脑上,而是在XBOX 360游戏机上,这就是最著名的三红事件。
2005年微软在委托代工生产Xbox 360游戏机的时候,CPU(IBM定制版XenonCPU)和GPU芯片(ATI Xbox 360 GPU)采用了当时全新的无铅焊接封装技术,并且采用了新的90nm制程工艺(记得前面说的吗?),但是没有充分考虑到无铅焊接生产工艺与传统有铅焊接技术差距,硅片(就是通常说的芯片晶体)和基片封胶用的材料、粘合剂不匹配,长期运行的积热导致应力改变挤压内部焊点(无铅工艺),温度的反复变化又让封胶偏软的问题暴露无遗,结果就是晶体和基片之间“脱离”——没有任何一台双90nm(CPU+GPU制程工艺)的XBOX 360游戏机能活到最后。
最终表现是Xbox 360出现报错三红指示灯,这就是历史上最著名的三红事件,微软最终付出的代价是30亿美元的巨额善后费用。
为什么称其为历史最严重的CPU翻车事故?因为有调查显示,Xbox360总返修率高达68%!高达30亿美元的善后费用包含维修、更换,以及保修期从一年延长至三年等等。除此之外,微软两次重新设计主机,从90nm制程工艺(CPU+GPU)改进至65nm(65nm CPU+90nmGPU)然后是双65nm(CPU、GPU)才彻底杜绝——从2005年年底发售后出现诉讼计算,微软总计花费了3年时间+30亿美元处理,要不是财大气粗,换成别家公司可能真的难以承受。
这还不是最搞的,最搞的事情是直到2021年12月,微软才通过纪录片《开机:Xbox 的故事》公布了三红问题的真正原因,就是我们前面提到的细节。2024年7月29日也就是下周一,XBOX 360应用商店将正式关闭,属于它的故事终于结束了……