约翰·卡西迪(John Cassidy)
《纽约客》 特约撰稿人
在农历新年到来前夕,中国科技初创公司深度求索(DeepSeek)发布了一款低成本又高性能的AI新模型DeepSeek-R1;蛇年的第一天,中国阿里巴巴又发布了自己的全新AI模型。在此背景下,“中国公司是如何取得突破的?美国在AI领域的领先地位能否维持?美国通过限制高科技出口来阻碍中国科技产业发展是否明智?”等议题被热议。
硅谷风险投资家马克 · 安德森 (Marc Andreessen)曾用“斯普特尼克时刻”形容DeepSeek面世。对中国颇有研究的路易-文森特 · 加夫(Louis-Vincent Gave)是研究机构Gavekal Research首席执行官,他再次使用了这样的评价,并强调“技术战似乎一直是种短视的策略”。
加夫提到的这场竞赛始于2018年。彼时特朗普政府以国家安全为由,禁止向中国主要通信企业出口一些关键的半导体部件。后来拜登政府又多次加强这方面限制。在特朗普第二次就职典礼的一周前,时任美国商务部部长的吉娜 · 雷蒙多(Gina Raimondo)在宣布新规时强调“目前美国是AI领域的全球领导者,保持领先至关重要”。这时,DeepSeek已发布其V3大语言模型(LLM),并即将发布其更专业的R1模型,而且他们使用了不受美国出口禁令限制的低端英伟达芯片。“美方的限制究竟是DeepSeek创新的障碍还是助力?”为了回答自己的问题,加夫翻找历史,列举了德国第二次世界大战期间部署的虎式坦克的例子:尽管其汽油发动机的功率和燃油效率不如英国和美国坦克的柴油发动机,但前者的性能表现优于后者。加夫表示:“你可以从历史中找到数不胜数的案例说明‘需求是发明之母’。中国做到了。”
美国科技行业的一些资深人士也发表了类似评论。前英特尔首席执行官帕特 · 基辛格(Pat Gelsinger)在社交媒体上发文指出:“中国工程师在资源受限时,必须找到创造性的解决方案。”这些解决方法似乎包括(相较同类模型而言)限制DeepSeek-R1执行计算的次数,以及以能最大程度发挥中国企业芯片能力的方式使用芯片。著名计算机科学家、OpenAI 联合创始人安德烈 · 卡帕西(Andrej Karpathy)则表示,DeepSeek“以玩笑般的预算”训练“最前沿的”大语言模型,结果“让事情变得看似很容易”。
尽管强加资源限制会激发创新的理论并未被普遍接受,但它确实得到了其他行业和学术研究的一些支持。例如,2014年一项针对瑞士制造商的研究结果就支持该理论;2024年发表的一项针对美国软件初创公司的研究表明,直到发展后期才获得外部资金的企业更倾向于“开展大量实验,也更有可能对其技术栈做出更重大的改变”。不过这方面证据远非决定性的,一种直觉性的反驳是,拥有充足技术和财务资源理所应当比捉襟见肘的境况更有利于进行更多的实验。但无论如何,加夫坚持认为,许多西方人过分低估了中国企业的创新能力。实际上,如今中国企业的创新能力在许多行业都很显著,包括核电、铁路、太阳能电池板和电动汽车等。
加夫认为,要承认现在中国在一个又一个领域超越西方的现实,要看到中国正围绕“打造工业超级大国”的战略推进,这一战略取得了成效,DeepSeek的出现就是最新最有力的证据。
——莫庄非编译自The New Yorker