DeepSeek利好英伟达?黄仁勋首次回应……
在英伟达股价因受DeepSeek影响而经历了一轮过山车般的起伏后,黄仁勋终于站了出来。
2月21日,一段黄仁勋的受访视频出现在其合作伙伴DataDirect Networksg公司举办的线上活动。在访谈中,他首次公开回应了DeepSeek是否利好英伟达(dá)的(de)相(xiāng)关话题。
图为英伟达CEO黄仁勋访谈画面
“R1让实际情况恰恰相反”
“DeepSeep-R1作为全球首个开源的推理模型,令人十分兴奋。R1模型的开源,让全球的热情也变得非常高涨。”黄仁勋表示。
他首先否定了一个既有认知:从投资者的角度来看,有这样一种思维定式:AI世界就是先做预训练,然后就是推理。而“推理”就是给AI提出一个问题,它立刻给出答案。
“虽然不知道这种思维源自哪里,但它显然是错误的。”黄仁勋强调。
为此,黄仁勋给出了详细的解释:正确的模式是先进行预训练,让模型对信息有一个基础的理解,预训练后要持续保持严谨。第二个阶段是最为重要的后训练(post training),也就是模型学会解决问题的过程。在这一阶段,模型已经有了基础的信息,而后运用这些基础知识去解决实际问题。后训练阶段与一系列不同的学习范式相关。在这些范式的推动下,AI技术在过去五年发展得非常迅猛,计算需求也因而变得极为密集。“大家会觉得预训练要少得多,但是他们忘记了预训练之后的第二部分——后训练其实(计算需求量)是相当大的。”他表示。
黄仁勋提到了第三条缩放定律(scaling law)。推理越多,回答问题前思考得就越多,推理效果就会越好,这是一个计算量相当大的过程。
“所以市场对DeepSeek R1问世的反应是‘天呐,AI到头了!’,就好像有了它,我们便不再需要进行任何计算了,但实际情况恰恰相反。”黄仁勋表示。
市(shì)场(chǎng)是(shì)否(fǒu)“买单”?
2025年1月,DeepSeek推出低算力成本的开源大语言模型R1,以仅560万美元的训练成本实现了与OpenAIo1等闭源模型相当的(de)性(xìng)能(néng)。这(zhè)一(yī)成(chéng)果(guǒ)挑(tiāo)战(zhàn)了(le)传(chuán)统(tǒng)AI训(xun)练(liàn)依(yī)赖(lài)高(gāo)算(suàn)力(lì)芯(xīn)片(piàn)堆(duī)料(liào)的(de)商(shāng)业(yè)模(mó)式(shì)。
受(shòu)此(cǐ)影(yǐng)响,英伟达市值曾一度下跌,尤其在1月27日跌去近17%,一夜蒸发近6000亿美元,创美股单日市值蒸发纪录。当时,投资者们担忧AI行业对英伟达芯片的需求可能大幅减少,导致市场对算力泡沫的恐慌。
事实上,英伟达官方在股价暴跌后迅速发声,指出DeepSeek的成功恰恰证明了其芯片的实用性,并强调“推理阶段需要大量英伟达GPU和高性能网络”,未来市场需求将随着AI应用扩展而增长。但当时的发声并未对其股价回升起到实际效果。
随后市场逐渐认识到,DeepSeek的创新可能推动更多中小型企业进入AI领域,反而刺激对GPU等算力芯片的增量需(xū)求(qiú)。英(yīng)伟(wěi)达(dá)股(gǔ)价(jià)在(zài)接(jiē)下(xià)来(lái)近(jìn)一(yī)个(gè)月(yuè)里(lǐ)震(zhèn)荡(dàng)回(huí)升(shēng),目(mù)前(qián)已(yǐ)逐(zhú)渐(jiàn)“收(shōu)复(fù)失(shī)地(de)”。
值(zhí)得(de)关注(zhù)的(de)是(shì),此(cǐ)次(cì)黄(huáng)仁(rén)勋(xūn)的(de)发(fā)声(shēng)在(zài)英(yīng)伟(wěi)达(dá)财(cái)报(bào)公(gōng)布(bù)之(zhī)前(qián),2月(yuè)26日(rì)美(měi)股(gǔ)盘(pán)后(hòu),英(yīng)伟(wěi)达(dá)将(jiāng)公(gōng)布(bù)四(sì)季(jì)度(dù)财(cái)报(bào)。虽(suī)然(rán)此(cǐ)次(cì)黄(huáng)仁(rén)勋(xūn)正(zhèng)面(miàn)表(biǎo)达(dá)了(le)对(duì)于DeepSeek问世将利好英伟达未来的信心,但市场的真正反映将有赖于其财报给出的关键数据。