英特尔公司副总裁、英特尔中国研究院院长宋继强:异构AI基础设施是未来发展趋势
【导语】11月23日,第二十二届中国国际半导体博览会开幕,英特尔中国研究院院长宋继强在同期大会上称,AI计算重心转向推理应用,未来80%的AI计算用于此,智能体AI算力需求将大增,异构AI基础设施是趋势,还介绍了英特尔在制程、封装技术等方面的实践创新及对未来定制芯片的设想。
11月23日,第二十二届中国国际半导体博览会(IC China 2025)在北京国家会议中心开幕。在同期举行的第七届全球IC企业家大会上,英特尔公司副总裁、英特尔中国研究院院长宋继强发表演讲。他表示,当前,AI计算的重心已从通用基座大模型扩展至推理应用。未来,80%的AI计算将用于推理领域。异构的AI基础设施是未来发展的趋势。
宋继强表示,智能体AI是推理领域真正产生客户价值的部分,其算力需求将从2025年起逐步上升,并超越用于训练基座大模型与微调大模型的规模,今年,其规模已有140倍的增长,达到每月1400万亿Token的使用量。为应对智能体AI的高速增长需求,算力支持是首要的,算力基础设施的带宽、存储等都要跟上。Token服务供应商(shāng),如(rú)云(yún)服(fú)务(wu)和(hé)数(shù)据(jù)中(zhōng)心(xīn)供应商也需对构造成本结构的方式进行系统级的优化。
宋继强指出,早期的智能体AI在中间层专门对应某一种语言模型,在底层则与具体的硬件和软件组合相对应,是在某种专门的应用架构上调优出来的,扩展比较受限。新出现的思维链技术得以支撑更广泛、更高级别的能力,但也需要更多的执行步骤、更多不同的模型,运用思维链方式完成一个问题使(shǐ)用(yòng)的(de)Token数比之前多10倍。而(ér)智(zhì)能(néng)体(tǐ)内(nèi)部(bù)不(bù)止(zhǐ)一(yī)个(gè)思(sī)维(wéi)链(liàn),对(duì)Token的(de)使(shǐ)用(yòng)量(liàng)与(yǔ)调(diào)用(yòng)复(fù)杂(zá)度(dù)将(jiāng)增(zēng)长(zhǎng)百(bǎi)倍(bèi)以(yǐ)上(shàng)。
因(yīn)此(cǐ),宋(sòng)继(jì)强(qiáng)强(qiáng)调(diào),异(yì)构(gòu)的(de)AI基(jī)础(chǔ)设(shè)施(shī)一(yī)定(dìng)是(shì)未(wèi)来(lái)发(fā)展(zhǎn)的(de)趋(qū)势(shì),既(jì)能(néng)提(tí)高(gāo)当(dāng)前(qián)应(yīng)用(yòng)的(de)性(xìng)能(néng)、效(xiào)率(lǜ)和成本效益,也能够保持对于未来智能体AI应用的长期有效性。
他表示,这样的计算架构需要至少三个维度的技术支撑。
第一,在硬件层,为避免受限于特定架构或供应商,必须构建异构的硬件架构基础。这也是目(mù)前(qián)算(suàn)力(lì)中心与公有云服务建设中常常讨论并采纳的方式。
第二,在中间的系统级,越来越多的推理应用存在于某一个企业的工作范围内,所(suǒ)以(yǐ)一(yī)定(dìng)要(yào)对(duì)企(qǐ)业应用开发、服务器部署友好。要针对企业所需要(yào)、所(suǒ)能(néng)够支持的尺寸交付算力,对于互联互通也需要采用开放的、基于以太网方式的能力规模扩展方案。
第三,是更开放的软件栈和软件框架,需(xū)要(yào)具(jù)备可编程性、可调配组合,能支持多种(zhǒng)AI框(kuāng)架(jià)。
宋继强进一步分享了英特尔的一系列实践与创新案例(lì)。例(lì)如(rú),制(zhì)程技术方面,要提供(gōng)更(gèng)高(gāo)能效比、更高性能、生产制造更灵活的方案。今年10月,英特尔公布了其最新的制程节点Intel 18A的技术细节,同时使用了RibbonFET全环绕栅极晶体管和背面供电技术PowerVia,可以提供更高晶体管密度、提升每瓦性能、降低功耗,为英特尔未来至少三代客户端与服务器产品提供支撑。
封装技术方面,宋继强表示,英特尔持续演进先进技术:从传统的二维封装到2.5D的EMIB嵌入式多芯片互联桥接方案、Foveros 2.5D和3D技术,再到Foveros Direct 3D,在先进封装技术的加持下,芯片Bump间距已经降到了10微米以下。
宋继强还分享了英特尔对未来定制芯片的设想,他指出,未来的定制芯片内部既可以有英特尔的主计算单元,也可以有客户的计算单元,并能够通过3D技术将两者封装在一起。在灵活构造的基础上,加上EMIB 2.5D、TSV等技术加持,将大大地提升芯片尺寸,目前最大能实现相当于十几个光罩尺寸大芯片规模,这将给可定制的未来处理器或AI加速器新的机会。他表示,针对未来多元的应用需求,希望有更多能效比优先,具备定制化特点的芯片方案。