事关DeepSeek,硅谷大佬“互掐”!OpenAI又爆巨额融资

DeepSeek在硅谷持续引发讨论。

中国大模型创业公司DeepSeek因此前发布的开源模型V3和R1,受到了全球的关注。由于成本低廉、性能良好、透明公开,DeepSeek让人们开始质疑AI投资可能存在的泡沫,也挑战了硅谷在人工智能领域的绝对领先地位。

对此,OpenAI最强劲的竞争对手、硅谷创业公司Anthropic的联合创始人、大语言模型的开创性研究者之一DarioAmodei昨日发表了一篇长文,系统阐述对于DeepSeek的看法。他表示,DeepSeek的训练成本远没有人们说的那么低,“600万美元模型”的说法忽略了许多关键背景。更准确的说法应该是,DeepSeek以更低的成本生成出一个接近7个—10个月前美国模型水平的产品。另外,他还强调,美国应加强芯片出口管制,确保自身走在人工智能发展的前沿。

针对DarioAmodei的观点,顶尖硅谷风险投资家、A16Z联合创始人MarcAndreessen今日发表评论称:“闭源、不透明、吹毛求疵、政治操纵与开源和免费相比,并不是美国所需要的胜利地位。”

            事关DeepSeek,硅谷大佬“互掐”!OpenAI又爆巨额融资                    事关DeepSeek,硅谷大佬“互掐”!OpenAI又爆巨额融资

虽未直接点名,但DeepSeek正是以开源及免费,在全球AI开源社区中受到普遍认可,而Anthropic开发的Claude模型与OpenAI的GPT模型一样,均属于闭源模型,训练过程及技术细节不对外公开。MarcAndreessen的评论也是在暗讽DarioAmodei,作为AI行业的领军人物,却企图利用地缘政治来遏制对手,否认开源工作,与实现通用人工智能目标的初衷已经背道而驰。

            事关DeepSeek,硅谷大佬“互掐”!OpenAI又爆巨额融资

DeepSeek让闭源社区“破防”

记者注意到,这并非MarcAndreessen首次针对DeepSeek发声。早在1月24日,Marc Andreessen在社交平台表示:“DeepSeekR1是我见过的最令人惊叹、最令人印象深刻的突破之一,并且是开源的,是给全世界的礼物。”

当天,英伟达股票下跌超3%,华尔街开始注意到DeepSeek这匹AI黑马,发现AI模型或许不需要依靠堆积算力就能取得卓越性能,从而打破了美股这两年来在AI浪潮中形成的“算力为王”的投资逻辑。有美股大V复盘并分析称,MarcAndreessen针对DeepSeek的推文,或许是DeepSeek爆火出圈的其中一个导火索。

不仅MarcAndreessen,AI领域的另外一个标志人物,斯坦福大学计算机科学系客座教授、谷歌大脑(GoogleBrain)创始人吴恩达(AndrewNg)也发文力挺DeepSeek。吴恩达认为,中国在生成式AI领域正快速缩小与美国的差距,或将重塑AI供应链格局。同时,开源权重模型推动基础模型层走向大众化,为应用开发开辟新机遇,单纯扩大模型规模并非AI发展的唯一出路,在算力军备竞赛的喧嚣中,算法革新正显著降低训练成本。

事实上,DarioAmodei、吴恩达与MarcAndreessen之间的争论,体现的正是闭源与开源两条路线的分歧。DeepSeek之所以在业界掀起轩然大波,除了在有限算力资源下实现的技术突破,让大模型不再是巨头堆算力的游戏,完全开源则是另外一个核心的原因。“开源+低成本”,让DeepSeek颠覆了行业的传统范式,Meta首席人工智能科学家杨立昆此前曾公开表示,DeepSeek的成功彰显了AI模型开源的重要性,“DeepSeek的胜利并非是中国AI的胜利,而是开源模型的胜利”。

有业内人士表示:“当OpenAI在2019年以安全为由转向闭源时,他们实际上是在建立垄断。而DeepSeek证明了开放可能是更好的战略,它能吸引最好的人才,建立生态系统,并通过降低成本而不是提高价格来获取优势。”英伟达高级研究科学家Jim Fan一周前在读完DeepSeek的技术报告后也表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”

DeepSeek创始人梁文锋在接受媒体采访时曾表示:“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。”同时,对于DeepSeek开源的做法,梁文锋表示,“开源更像一个文化行为,而非商业行为……我们不会闭源。我们认为先有一个强大的技术生态更重要。”

一般来说,在大模型领域有先发优势及处于技术领先地位的公司,如OpenAI和Anthropic往往倾向于选择闭源,保护自身的技术秘密。有国内大模型从业者告诉记者,DeepSeek作为纯技术驱动的公司,代码和训练方法完全开源,而互联网大厂往往出于商业化等方面的考量不会完全开源。当DeepSeek向市场推出了一款低成本、高性能的模型,并且开源时,无疑对选择闭源路线的公司构成了巨大的冲击。

            事关DeepSeek,硅谷大佬“互掐”!OpenAI又爆巨额融资

OpenAI被爆正洽谈新一轮融资

在DeepSeek引发大模型高额投入的效用质疑时,据华尔街日报报道,OpenAI正在洽谈新一轮融资,计划在一轮融资中筹集至多400亿美元,估值将达到3000亿美元,相较此前估值1570亿美元接近翻倍,将成为仅次于埃隆·马斯克旗下SpaceX的全球估值第二高的初创公司。

另外,PitchBook数据显示,这一轮融资将是硅谷历史上最大的一轮融资,并打破OpenAI在2023年创下的融资纪录,当时它从微软融资100亿美元。上述报道还称,在本轮融资中,软银集团将作为领投方投资150亿至250亿美元。若新一轮融资完成,孙正义将更进一步与OpenAI绑定。

值得注意的是,1月22日,美国总统特朗普宣布,OpenAI、软银集团和甲骨文将合资成立一家名为“星际之门”(Stargate)的新公司,计划未来4年在美国投资5000亿美元建设AI基础设施,其中1000亿美元将立即部署。

OpenAI首席执行官山姆·奥特曼此前透露,OpenAI、软银集团、甲骨文和MGX将为该项目总共投入450亿美元,OpenAI和软银集团将各向星际之门注资190亿美元,均持有合资企业40%的股权,而甲骨文和MGX将共同出资70亿美元。据华尔街日报报道,最新一笔融资的资金将部分用于帮助OpenAI履行其对“星际之门”的投资承诺。

DeepSeek发布的AI模型,凭借高性能、便宜、开源等优势,令许多投资者对OpenAI等美国AI开发商的高额AI资本开支策略产生了质疑。奥特曼此前评价DeepSeek时承认,DeepSeek R1让人印象深刻,尤其考虑到成本方面,“但我们无疑将带来更好的模型”。他还表示,“我们相信,要实现我们的使命,更多的计算能力比任何时候都更重要。”

另外,据彭博社报道,知情人士透露,近期OpenAI与微软展开了一项联合调查,针对DeepSeek去年使用OpenAIAPI接口的账户进行审查,并以涉嫌违反服务条款的模型蒸馏为由,取消了他们的访问权限。此前,OpenAI曾向媒体表示,它发现DeepSeek使用了OpenAI专有模型来训练自己的开源模型的证据,也即DeepSeek涉嫌“蒸馏”其模型,但拒绝进一步透露其证据的细节。

据记者了解,蒸馏是模型训练中常见的一种做法,简单理解就是用预先训练好的复杂模型作为“教师模型”,用其输出的结果作为监督信号,再去训练另外一个“学生模型”,使学生模型能够逐渐接近于教师模型的水平。由于“从零开始”训练一个模型,需要重复耗费大量计算资源,蒸馏也被视为AI普惠的一种途径,无论是在中国还是美国,初创公司和学术机构使用ChatGPT等领先模型输出数据来训练自己的模型,是业内普遍的现象。

值得注意的是,美东时间1月30日,在美国国家公共电台的节目中,OpenAI全球事务副总裁ChrisLeHane表示,“o3”将在周五发布。紧急上线新模型表明,DeepSeek的崛起已经让OpenAI感受到了威胁,也将让AI领域的竞争更加激烈。

责编:李丹

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。聚才发仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,请发送邮件至 tenspace2022@163.com 举报,一经查实,本站将立刻删除。 本文链接:https://www.jucaifa.com/en/post/1211710.html 商机洞察 金融谷 前沿技术

Previous 3 hours ago
Next 2 hours ago

相关推荐

Leave a Reply

Your email address will not be published. Required fields are marked *