何谓P-rating时钟标示
第一代CyrixⅢ仍旧采取P-rating(PR)的时钟标示法则。PR是从Cyrix研发处
理器时所采取的时钟标示法则:它是以对映某款主流处理器的实测性能
数值,以该处理器的时钟版本作为P-rating时钟标示。而CyrixⅢ目前全系
列锁定以CeleronP-rating基准,第一代Cyrix-PR533处理器的性能,经过像
是Winstone99这类软件的测试(通常只有BusinessWinstone99的数值),大
致跟533MHzCeleron处理器(66MHz外频)的实测性能相当。
至于CyrixⅢ的PR数值,与真实时钟的对映关系是如何呢?有一个简单的计
算方式,就是以PR标示的时钟速度,减去100MHz之后的数字,就是该芯
片的真实时钟速度。下表则是第一代CyrixⅢ的真实时钟资
料表:
-----------------------------------------------------------
表一第一代CyrixⅢ处理器,Joshua核心的真实时钟资料表
----------------------------------------------------------
P-rating标示时钟 PR433 PR466 PR500 PR533
真实时钟(MHz) 333MHz 350MHz 400MHz 433MHz
外频与倍频率 133x2.5 133x2.5 133x3 133x3
100x3.5 124x3.5
工作电压 2.2V 2.2V 2.2V 2.2V
■第二代CyrixⅢ(Samuel)台北计算机展悄然现身!!
在六月五日到九日的台北国际计算机展,威盛第一次展示新的CyrixⅢ处
理器,并且发布新闻稿指出,这是新一代核心的设计,真实时钟已经狂
飙到667MHz以上了。
照片CyrixⅢ-533MHz与CyrixⅢ-667MHz
如果在三个月前,以Joshua为核心的第一代CyrixⅢ,真实时钟还卡在333
~433MHz左右,短短一季就突然逼近700MHz的时钟关卡,而且耗电量还
大幅降低,因此威盛的新CyrixⅢ着实引起笔者的高度兴趣,开始密集的
搜集这款处理器的相关新闻。
其实这个最高时钟高达667MHz的新CyrixⅢ,正是原先威盛(或说威旭)另
一个Centaur微处理器研发小组的Samuel处理器核心,完全的走向高时钟
设计。大约是在二月24日德国汉诺威(HannoverCeBit)计算机/通讯大展时
,威盛首先透露关于Samuel处理器的风声。最近发表的667MHzCyrixⅢ,
可是真真实实的跑出667MHz的工作时钟,有关第二代CyrixⅢ性能大幅向
上提升的秘密,稍后再为各位读者揭露。
为什么采用Samuel(或者说Winchip4)全新核心设计的新处理器,仍然要叫
CyrixⅢ,而不叫WinChipⅢ或WinChipⅣ之类的名称。据威盛表示,由于
Cyrix处理器当年曾经进逼Pentium的性能王位,Cyrix这个商标名称比较响
亮,在通路市场上也比较好推广,因此新一代采用Samuel核心的处理器
,仍然以CyrixⅢ为产品名称,而不取WinChip4或Samuel,至于媒体(例如
笔者)则会以第二代CyrixⅢ、CyrixⅢ(Samuel)或直接以Samuel处理器来称
呼。
而第一代CyrixⅢ(Joshua)又该如何呢?据威盛表示,第一代标示PR时钟的
CyrixⅢ,将随着OEM厂商随机、随主机板出货,以Barebone系统的搭售
主攻低价市场,而不走一般的零售通路市场。也许我们可以这么残忍的
说:「还没开始(在市场上贩卖),就已经结束了。
■威盛的另一只CPU设计奇兵─Centaur团队
要提到这款新Samuel核心的第二代CyrixⅢ,我们不得不提起Centaur这个
微处理器研发团队,他们过去的研发理念、事迹以及技术上的作品,因
为这跟我们要讨论的第二代CyrixⅢ是息息相关的。
以往CPU设计潮流是朝向译码/执行电路密集化、复杂化的方式迈进。每
颗CPU电路设计上,尽可能挤下更多的晶体管,来设计更多的译码/执行
的管线,并且去实作一些来自于微处理器理论级的复杂技术,像是
SuperScalar超纯量架构非循序/超车执行(OutoforderExecution)、缓存器动
态命名等技术,不但增加日后除错的困难度与耗电量,对于增加了百分
之几十、甚至几倍晶体管数量,性能却不见得呈现等比例的增加的现象
,厂商对此却没有明显的讨论,甚至略而不提。
在1995年,由葛瑞?亨利(GlennHenry)创立的Centaur公司,其旗下处理器研
发小组,就是要致力于打破这样的「越趋越复杂」电路设计的概念。从
以前第一代WinChipC6、第二代WinChip2、第三代WinChip3到被并购之前
从事的第四代WinChip4处理器,都是秉持着一个「小巧、简单」的原则,
整个CPU的设计也走向环保、低耗电与性能/晶体管的平衡性去努力。
最近TransmetaCrusoe处理器的成功,更验证了这股精简电路的设计理念
,以塑造环保/低耗电的处理器为设计风潮,可能是21世纪第一个十年
的主流价值,甚至会成为最具关键性的CPU设计的主导力量也说不定。也
许笔者太早下定论,但读者不妨拭目以待。
1997年Centaur后公布WinChipC6的原形芯片,由于该公司性质属于
Fabless(无晶圆工厂)的IC电路设计公司,随后加盟IDT集团,由IDT负责
Winchip处理器的制造与销售。Centaur在97年加盟IDT后的第一颗x86CPU
代表作─WinChipC6,是去年(97年)5月20日公布,于六月台北国际计算机
展时,出现WinChipC6的ES,真正量产供货的时间则延至当年第三季(十月
份)。
初期第一代WinChipC6初期仅有150、180MHz,到97年底才推进到200MHz
的版本,受限于工作时钟较其它家CPU时钟的落后态势,一开始
WinChipC6并没有在市场上引起多大的瞩目。
但是GlennHenry的处理器却创下了极为小巧的晶圆面积,换句话说,它用
最少的晶体管数量,去达到(或逼近)其它竞争对手同级处理器的性能。
■小巧简单的晶圆线路设计
晶圆面积小,相对的耗电量就可以变小,在同样一块硅晶圆在下可以切
割出更多的芯片,连带使制造成本大幅下降。笔者当年印象很深刻的是
,在当时IDT/Centaur在制程/产能样样不如CPU双雄Intel、AMD的现实态
势下,IDT/Centaur居然能以0.35μ制程,创造88mm2大小的WinchipC6晶圆
电路;连第二代WinChip2与WinChip2-3D,以老旧的0.35μ制程制造,晶
圆面积还是压到100mm2以下,后期以0.25μ制程下,WinChip2晶圆面积
更微缩到58mm2,一直维持着全球最小x86兼容处理器的晶圆面积的记录
。
随后AMD与IDT、Cyrix达成3Dnow!指令集的授权协议,也运用到第二代的
WinChip2-3D处理器。WinChip2-3D可说是该公司比较成功,且引起回响的
低价处理器。它以支持旧单电压(Vcore=3.3~3.52V),适切的性能/价格比
值,不但价格低廉,还提供3Dnow!指令的加速能力,连96年出现的
440FX-Pentium主机板也还涵盖在它的升级火网中,因此在98年中,
WinChip2系列曾经是玩家心目中,最不挑主机板的经济升级型CPU。
Centaur与IDT当时锁定的价格策略,是以比同时钟/同性能的AMD处理器
价格便宜10%为策略,相当于Intel同类型处理器的67.5%的价格。当时
AMDK6、CyrixMⅡ处理器抢占一千美元以下的计算机市场,IDT/Centaur则
联手抢占六百、五百美元以下的超低价计算机市场。
在那时,Centaur也有打算要将处理器与传统北桥芯片组「整合在一起」
的打算,这个整合主机板传统北桥芯片与Winchip2处理器的代号称为
WinChip2-NB,有许多芯片组大厂也纷纷向Centaur公司接洽(其中一家就是
威盛)。虽然不知因为什么原因,双方当时并没有谈成,Winchip2+NB的计
画也因而暂告中止,不过也因为这次的牵线,为日后的威盛并购Centaur
公司下了最佳的脚注。
■创业界之先的非整数倍频
随后微处理器的市场又陷入MHz时钟激战,Intel处理器一举跨越400MHz
时钟大关,同时也开始主推100MHz外频的主机板平台,至今仍然风评不
赖的440BX芯片组,就是在当时应运而生)。而AMD、Cyrix的Socket7阵营
也随即调高100MHz外频,以新的Super7(Socket7+AGP+100MHz)严阵以对
。为了在有限制程、有限的时钟内调升性能,Centaur设计小组几乎使尽
全力,在WinChip2后期曾提出一种「非整数倍频」(FractionalBusMultiplier)
的机制,是微处理器第一次有所谓的2.33x、2.66x、3.33x等非0.5x倍数的
倍频率。
如此设计的用意是:在当时Super7架构,外频已经定义到最高100MHz的
情况下,即使CPU时钟仍卡在266~333MHz范围内,不需要以调降外频(如
Celeron的66MHz、K6-2某个时期的95、97MHz)的方式处理。外频依旧可以
锁定到最高的100MHz,使得Winchip2处理器的整数性能、对外I/O可以被
极致化的发挥,如果以汽车引擎的设计来比喻,非整数倍频的WinChip2发
挥了「低转速、高扭力」的表现。
Family Model Stepping CPUID, EDX bit31
----------------------------------------------------------------
WinChip C6 5 4 0 或 1 =Off, 不支持
WinChip2 5 8 0, 5, 100 =Off, 不支持
WinChip2 (2-3D) 5 8 0, 5, 100 =On, 支持
WinChip3 5 9 0 =On, 支持
Winchip4(Samuel)6 6 5 =On, 支持
-----------------------------------------------------------------
注:Stepping值与时钟、制程与代工厂商不同而有所变动
■WinChip3「三声无奈」
笔者曾经在去年第一季,有接触到IDT/Centaur秘密以0.25μ制程制造的第
三代处理器─WinChip3。这个版本将首度把CPU核心的L1Cache加大到
128KB,资料/程序各增加为64KB,据WinChip3设计者表示,以同时钟作
为基准,L1Cache加大到128KB时,加速效果会比单纯把128、256KB的
L2Cache设计到晶圆内部还要好,同时节省晶圆面积与降低耗电量。往后
这个准则被应用到WinChip4以及Samuel核心的开发。
这颗WinChip3处理器性能由于L1Cache增加一倍,加上FPU/MMX处理单元
增加,整体执行性能较同级Socket7处理器强悍。而Centaur此时也第一次
引进了PerformanceRange(类似CyrixP-Rating),Winchip3-PR300的真正时钟
仅250MHz,但性能足以跟300MHzSuper7处理器相媲美。照原定的计画,
在WinChip3要推进到PR400的速度。
但是此时Cenatur心血结晶,却卡在IDT晶圆厂的烂制程而无从发挥产品时
脉(另一个难兄难弟Cyrix,也是卡在NS当时的晶圆制程,到被并购之前,
也是才推进到PR350(约300MHz)。
照片WinChip3芯片(200MHz、PR-233)
随后Intel低价处理器Celeron攻势凌厉,压挤到AMDK6、K6-2的低价计算机
市场的空间,连同其它Cyrix、IDT/Centaur受到影响,而
WinChip2/WinChip2-3D与WinChip3也一直晶圆代工厂的制程因素,卡在
266MHz~350MHz的频率无法提升,因而逐渐流失市场,也导致了往后
IDT易手、威盛入主的局面。
■Samuel的前身WinChip4
在98年10月MicroProcessorForum98微处理器论坛中,GlennHenry揭露了全
新IDTWinChip4的架构。预计而99年第二季结束之前,全新核心设计的
WinChip3将会以500MHz雷霆登场。WinChip4是一个重新设计过的CPU,
它把核心从单一x86译码/执行管线(oneway,scalarcore)的架构,扩展为两
线路超纯量架构(2wayx86SuperScalar),这两个平行译码执行线路完全是
独立并行的。
WinChip4也首先引进了超长管线的概念,WinChip4原始设计的管线阶段高
达11阶(K7为10阶),预留WinChip4日后时钟的调升空间。因为GlennHenry
对于自己的艺术结晶,被晶圆厂把时钟做差、做慢而导致不受市场青睐
的状况,已经受够了!!
原先Winchip4打算以0.25μ制程制造时,真实的工作时钟可以从400MH起
跳,最高到500MHz;将来引进预料引进0.18微米制程以后,WinChip4的
时钟速度能够进一步往上攀升,可以一举突破500MHz的门槛,甚至迈向
700MHz。这一点在后来CyrixⅢ(Samuel)以WinChip4为核心,确实以0.18μ
一举突破533MHz,甚至可以往上调升到733MHz,而获得了初步验证。
至于在快取容量方面,WinChip4的L1Cache还是维持在128KB(程序/资料
快取各半),没有考虑内建L2Cache,理由显然跟WinChip3的设计理念是完
全相同的。只不过它的L1Cache索引机制改成4waysetassociative,再辅以
较多的地址转换预视表(TranslationLook-aheadBuffers,TLB),以增加快取的
集中率与位址转换速度,来弥补欠缺L2高速缓存的整数性能差距。
WinChip4还设计了两种类型的分歧/条件跳越预测区(JCCPredicator),可
以把分歧跳越的命中率,平均提高到95%左右。
WinChip4第一个成品,原本预定会在99年上半年结束前出现。可是
Socket370架构的Celeron与Super7架构的低价处理器K6-2、K6-Ⅲ厮杀激烈
,连AMDK6-2出货不顺都造成亏损,NS/Cyrix、IDT/Centaur自然是不支倒
地,当NS有了出售Cyrix、退出竞争惨烈的x86CPU市场时,而WinChip4的
计画也因而耽搁下来。
威盛入主之后,笃信基督教的陈文琦,将这个Centaur进行中的WinChip4
略为修改,重新以GTL+协议、改走P6Bus的接口设计,同时新增加
100/133MHzFSB规格,这个小改版的新核心计画被称为Samuel,就是今日
第二代CyrixⅢ(Samuel)的由来。
■战略大改变─先拉时钟、再拉性能
前面也提到,核心代号为约书亚(Joshua)的上一代CyrixⅢ,虽然其晶圆内
建64KBL1Cache,以及256KBL2Cache,从规格上来看是很漂亮,大致跟
PentiumⅢ(Coppermine)相当,而且具备低时钟、高整数性能的特性,真实
时钟为433MHz的CyrixⅢ-PR533,即使在Cyrix惯用的
PerformanceRating(PR)标示下,还可以「越级」跟533MHzCeleron处理器在
整数性能方面一较高下。
但是过于复杂的线路设计,使得0.18μ微米制程下,CyrixⅢ就此止于
433MHz而已,再高时钟似乎也上不去了。再加上Joshua推出时程一再延
迟,Intel低价计算机市场上的Celeron已经推进到667MHz,而AMDDuron更
推进到700MHz,在时钟上的竞争力毕竟薄弱了许多!
而此时威盛的做法,必须从主打低价IA市场、低时钟CPU市场的策略再度
修改,改为先追上时钟,再追上性能的战略。而一向以电路精简、晶圆
面积小巧而著称的Centaur微处理器研发团队,秘密研发的Samuel核心就
开始接手了。
第二代CyrixⅢ与第一代CyrixⅢ的差异,除了可以从外观的CPU频率编号(
第一代为PR、第二代为真实时钟),工作电压(第一代2.2V,第二代1.9V)看
出来。当然,用类似WCPUID这类CPU侦测工具软件,是最清楚不过了。
目前的CyrixⅢ是陶瓷/晶圆镀金散热的封装(CeramicPin-GridArray,CPGA),
工作电压则是1.9V,威盛不排除推出PBGA或BGA封装的CyrixⅢ处理器,以
减小它的封装体积(厚度),对于攻占IA或超薄型笔记型计算机会有所帮助
。不过主机板得支持1.9V,同时也要有新版本的BIOS韧体码,才能支持这
颗CyrixⅢ(Samuel)处理器。
据威盛表示,目前代工生产CyrixⅢ的晶圆厂商有两家,一家当然是NS,
另一家则是台积电(TSMC)。只要市场反应热烈,日后要追加产能是不虞匮
乏的。
(欲知后事如何,且听下回分解,呵呵)
下集:细说第二代CyrixⅢ(Samuel) 大灰熊
2000.08.01
|