英特尔新一代显卡架构Larrabee解析
独特的显存架构
在显存控制器方面, AMD和NVIDIA的GPU使用的是64bit的显存控制器,并且在芯片内只有一组控制器。鉴于INTEL的Larrabee采用多核心设计,内部需要更多的显存带宽, Larrabee将采用1024-bit双向环形总线,单向传输位宽为512-bit。在加上GDDR5显存的助力,Larrabee将会有不错的性能表现。目前的GDDR5显存颗粒还十分昂贵,不过相信到了2010年的时候,会迅速普及,价格自然也会降低到一个比较合理的价位。

嵌入式存储架构
值得一提的是,AMD公司已经在它的GPU中放弃了他们的环形显存控制器架构,转而采用更先进的片上嵌入式存储,因为他们的GPU需要更加强大的存储带宽。AMD认为环形的总线会将数据直接排挤送出,这种线路设计会相对简单许多,它可以大幅减少芯片的复杂程度,不过他的缺点也比较明显,它需要一根很长的电线贯穿整个芯片。并且无论接收方是否需要,都为所有的接收端提供了较高的数据带宽。因此如果内存接收方需要更高的内存,或者需要提高系统总线的带宽的话,提供一条双向的带宽就可以轻松解决。INTEL可能有比AMD更高明的环形总线方案。因为Larrabee支持超高速相关性缓存,并且可以跨越核心通信。L2高速缓存可以被分割为2个部分,同时可以用环形总线保持他们数据的一致性。这样可以促进信息更好的被传递,也让繁重的数据处理变得更加轻松。如果Larrabee所有的处理核心都通过一个双向的环形总线连接,每个方向提供512bit的位宽。这条总线的工作频率,可能与Larrabee的主频相同。我们假设一下Larrabee的运行频率为2GHz以上,那么这条总线将会提供非常高的带宽吞吐量,而且它的工作频率要远远高于AMD的GPU。
SLI、交火不算什么,Larrabee的多内核设计!
目前的GPU全是采用单核芯片设计,图形显示系统要想达到更高的性能只能采用双GPU设计或双卡、四卡并联运行方案。这在成本上往往是用户所不能接受的。而在Larrabee上,INTEL采用多核心设计,这也将是首款采用多核设计的GPU。根据INTEL初步的计算,最初Larrabee的核心数量将会是16个核心,今后按照翻倍的步进也许会升级到32个核心。这是因为要应付目前主流的3D图形的运算,起步至少要16个核心才可以从容应对,但是24个核心的产品也是有可能的,毕竟以目前的生产工艺来看做到这一点完全是没有问题的。

半导体芯片核心
目前我们的半导体芯片核心面积可以做到286平方毫米,NVIDIA的GT200和AMD的RV770就处在这个层次上。因此在Larrabee集成更多的处理核心应该并非难事。假设INTEL要想集成40个处理核心,那么至少需要572平方毫米的芯片。事实上NVIDIA的GT200使用的是65nm制造工艺技术,如果INTEL用最为先进的32nm制造工艺技术,那么芯片的尺寸还会大幅缩小。就目前的INTEL 45nm制造工艺来说,芯片的核心面积可以减小至少50%,但是根据INTEL的说法,只要转产到45nm,甚至可以减小到60~70%的样子。届时Larrabee将能集成更多的处理核心。INTEL推测,40个核心45nm版本的Larrabee其核心面积约为370平方毫米。像NVIDIA的产品线一样,INTEL也会将芯片根据核心数量分成不同的档次,面向不同人群推出。

游戏性能与核心数量的增长趋势
根据INTEL的说法,这种特性在《战争机器》、《F.E.A.R.》、《半条命2:第二章》等游戏中表现最明显,实际性能基本随着核心数量呈线性增长趋势。如果8核心的性能算作1,那么16核心就约等于2、24核心约等于3、32核心约等于4。如果一直这样增长下去,那Larrabee的实力将是恐怖的。不过INTEL也承认,随着核心数量的继续增多,这种线性关系会逐渐减弱,到了40核心只有3.8-3.9,48核心就仅仅4.4-4.6了,64核心甚至可能都不到7。因此如果解决多核心中复杂的数据共享问题及功耗问题,这都是INTEL需要面对的。
除此之外,Larrabee还同时能够支持4路硬件线程。而Larrabee也能够在CPU内核心进行4组套转换。INTEL CPU比如Nehalem都支持2-way多线程,Larrabee则为4-way multi-threadCPU。而GPU产品中支持多线程的则很少。GPU产品通常配备有数十以上的线程硬件转换功能。比如GeForce GTX 200(GT200)在32寄存器/线程时转换为16warp(NVIDIA用语)。根据Larrabee的资料,硬件多线程设计是为了在进行编译的时候减少二级缓存的等待时间为目的。这与GPU的硬件多threading不同。 另外 Larrabee的硬件多线程比GPU少的原因是架构上的不同。值得注意的是,INTEL指出Larrabee“全面支持IEEE标准单、双精度浮点运算”,但没有透露具体指标。AMD和NVIDIA显卡在单精度方面表现都很出色,RV770系列已经轻松超过1TFlops,不过双精度性能还相差甚远,比如Tesla的单精度性能可达900-1000GFlops,双精度就只有100GFlops左右。如果出Larrabee全双精度浮点运算的话,那么它的通用运算能力要远远强于当前的GPU。
尽管INTEL进军独立显卡市场的野心已然明确,但据消息来源表示,目前很多细节还处于混沌状态。INTEL将会在今年第四季度公开发布详细完整的独立显卡产品线roadmap。到那个时候,Larrabee显卡才会变得更加清晰。相较于GPGPU来说,它最大的优势就在于采用了大家熟悉的x86架构。目前多数的软件工程师仍不熟悉如何将GPU应用在多任务处理及平行运算上,这点就占了不少优势。如果顺利的话,INTEL将肯定在2008年展示Larrabee系列独立显卡。根据比较可靠的消息来看,Larrabee项目其实是隶属于Tera-Scale计划(“万亿级别计算研究项目”。这个计划的重要工作内容,就是分析未来10年内人们对电脑及服务器的应用需求。这一计划涉及的研究领域非常广泛,共有超过 400 间大学、美国国防部高等研究计划局 (DARPA) ,以及像是微软与惠普等相关公司,共同为 Larrabee 应用进行研究。
相关文章
新一代笔记本正在陆续到来,HotHardware抢先拿到了一台微星的泰坦18 Pro,简单测试了其首发配备的AMD锐龙9 9955HX3D,展现了新一代X3D旗舰的威力2025-03-28
游戏装机不花冤枉钱! 锐龙5 9600X性价比完胜酷睿Ultra 7 265K
花更多的钱,是不是真的能换来更好的游戏体验?咱今天就来唠唠这个事儿,看看这钱到底该不该花,接下来我们不妨拿竞品高端定位的酷睿Ultra 7 265K来和锐龙5 9600X进行一个对2025-03-25
AMD锐龙7 9700X板U套装推荐:轻松获得仅次于9800X3D的游戏性能
锐龙7 9700X的首发上市价格为2549元,现在该产品也大幅降价到1999元,性价比非常诱人,今天我们就来看看AMD锐龙7 9700X板U套装推荐2025-03-17
锐龙7 7800X3D实力完胜i9-14900K! 3000元内游戏CPU推荐
在当前3000元以内,最热门的游戏CPU莫过于锐龙7 7800X3D和酷睿i9-14900K,那么这两款产品究竟谁性价比更高呢?下面我们就来看看详细测评2025-03-12
游戏与生产力双高 综合实力最强! 锐龙9 9950X3D处理器首发评测
AMD终于将锐龙 9000系列的王牌产品——锐龙 9 9950X3D拿了出来,在搭载了超大容量的3D缓存之后,这颗处理器可以说是兼顾了游戏以及创作能力,同时也是消费级锐龙 9000处理2025-03-12
64位和32位CPU有什么区别? 电脑32位和62位系统区别介绍
在选购或使用电脑时,我们经常会听到“32位”和“64位”这样的术语,那么,这两个概念到底是什么意思?它们对计算机的性能和兼容性有什么影响?详细请看下文介绍2025-03-07
为什么主流装机玩家都选AMD 锐龙5 9600X? 五大理由告诉你
你可能会奇怪,为什么最近Zen5架构的锐龙9000系列桌面处理器在主流玩家群体中的口碑这么好;为什么在追求性价比搭配,期望用最少花费实现尽可能好游戏体验的玩家群体中,AM2025-02-28
有锐龙7 9700X还考虑什么酷睿i9/Ultra 9处理器? 性能级游戏装机推荐
别看锐龙7 9700X只是一款2000元价位的产品,但是具备了挑战竞品旗舰酷睿i9-14900K和酷睿Ultra 9 285K的强悍实力,具体差距如何?请看下文测评2025-02-27
CPU热节流是指当处理器在运行过程中产生过多的热量,达到一定的温度阈值时,为了防止过热和损坏,CPU会自动降低时钟速度和性能的技术,下面我们就来看看它的利弊2025-02-19
CPU 的 L1、L2 和 L3 Cache 在现代计算机架构中起着关键作用,它们的设计、大小、位置以及读写速度和延迟都有显著的差异,详细请看下文介绍2025-02-19












最新评论