当前位置:首页 > 文学 > 正文

DeepSeek引爆全球科技圈,AI应用层能否迎来新浪潮?

  • 文学
  • 2025-02-07 16:29:03
  • 2

  21世纪经济报道记者 赵娜 上海报道

  1月20日,中国人工智能公司深度求索(DeepSeek)发布开源模型DeepSeek-R1,一举成为全球科技行业的焦点。

  DeepSeek的这一突破引起了众多风险投资人和科技创业者的关注。硅谷创投大佬、提出“软件吞噬世界”的马克·安德森(Marc Andreessen)称这一发布为“AI领域的史普尼克时刻”。这一说法源自1957年苏联发射史普尼克一号卫星的标志性事件,彻底改变了全球太空竞赛的格局,震撼了美国及整个世界。

  引发热议的原因之一是,DeepSeek的R1模型不仅是技术创新的成果,还标志着中国在AGI(通用人工智能)领域的崛起,挑战了由硅谷科技巨头主导的全球AI格局。凭借其创新的架构设计、低成本高效能的技术路线,DeepSeek不仅在中国市场取得突破,更引起了硅谷的广泛关注。

  清源创投(Foothill Ventures)创始合伙人王金林的团队曾投出了文远知行WeRide、Otter.ai、OmniML等公司。他接受21世纪经济报道记者采访时表示,在ToC领域,大模型产品的竞争会呈现“赢家通吃”的格局,因为某个产品占领了消费者心智将难以被替代。但在ToB领域,由于应用的多样性和各行业不同的需求,市场格局将呈“百花齐放”的态势,创业公司可以基于不同的需求和场景创造出独特的应用解决方案。

  来自中国的颠覆者

  全球AI竞争日益激烈的背景下,DeepSeek通过突破性创新在全球科技圈脱颖而出。

  特别是在美国对中国科技公司实行出口管制的背景下,DeepSeek在传统的算力和数据需求上进行创新,通过减少对高算力硬件的依赖,降低成本并提升了模型的性能和应用效率。这一创新在全球科技圈引起广泛关注,并引发了对中国科技企业角色的重新评估。

  DeepSeek的创新首先体现在其独特的技术架构设计上。在人工智能领域,很多模型依赖海量数据(维权)和强大的算力进行训练,而DeepSeek提出了全新的MLA机制(多头潜在注意力),在低算力环境下实现了高效的训练和推理过程。这一突破使得DeepSeek的AI模型不仅在性能上接近OpenAI和Google等科技巨头的同类产品,且在成本上大幅降低,成为了全球AI产业中最具性价比的解决方案之一。

  在海外科技圈和投资人眼中,DeepSeek的技术路线令人眼前一亮。他们的热烈讨论在一定程度上也源于后者“来自中国”的身份。不同于很多中国公司在技术路线上的“追随者”地位,DeepSeek展现了中国科技公司在全球AI竞争中的独立研发能力与技术创新。

DeepSeek引爆全球科技圈,AI应用层能否迎来新浪潮?

  “我不会仅仅将DeepSeek作为中国公司看。”王金林并不将DeepSeek看作中国原始创新的特例。全球大模型企业处在你追我赶的进程中,新的技术方案层出不穷。DeepSeek通过极致的优化降低了单位计算成本和用户使用成本,“这样的团队可以在任何地方出现。这一次,它出现在了中国。”

  DeepSeek-R1的发布也引发了关于资本与创新关系的深刻思考。在硅谷,科技公司通常依赖于大量融资来推动技术创新,但DeepSeek证明了新的可能,即通过组织顶尖人才、优化工程设计来取得革命性的技术成果。

  基于有限资源创新旅程

  在全球AI竞争日益激烈的背景下,DeepSeek通过突破性创新在全球科技圈脱颖而出。

  特别是在美国出口管制措施的背景下,DeepSeek在传统的算力和数据需求上进行了前所未有的创新,通过减少对高算力硬件的依赖,降低成本并提升了模型的性能和应用效率。

  出口管制对中国科技企业的影响无疑巨大,但也成为初创企业创新的催化剂。比如,在DeepSeek的创新旅程中,资源的限制在一定程度上激发出更多的创新思维。

  正如英特尔前首席执行官帕特·基辛格 (Pat Gelsinger)所言:“工程就是关于限制的。中国工程师们的资源有限,他们不得不寻找创造性的解决方案。”这正是DeepSeek的做法。通过在计算流程和硬件需求上的优化,DeepSeek突破壁垒并推动着AI技术的进一步发展。

  具体来说,这家中国初创企业展示了如何利用不同的技术,基于符合美国出口管制法规的广泛可用模型和芯片来开发新的模型。这种创新性设计不仅解决了中国AI公司面临的资源问题,也为全球AI产业提供了新的发展思路。

  王金林认为,中国开发者和研究人员对大模型性能的极致追求,是DeepSeek团队打造出DeepSeek-R1卓越表现最重要的原因。换句话说,“推动全球AI发展的最主要力量,包括在大语言模型创新领域,是包括研究人员和开发者在内的人才。”

  AI应用层,下一波创业新浪潮?

  随着AGI技术的不断进步,应用层的创业机会有望持续增加。

  DeepSeek创始人梁文锋决心将重心放在研究和探索。他在接受36氪采访时也作出分析,“从长期看,大模型应用门槛会越来越低,初创公司在未来20年任何时候下场,也都有机会。”

  这一观点为AGI创业者们点燃了希望的火种,也预示着AGI技术将从理论层面走向实际应用,成为重塑全球产业格局的重要力量。

  来自微软的贾里德·斯帕塔罗(Jared Spataro)也表达了类似的观点。在他看来,AI的价值最终将迁移到应用层。随着AI技术的不断发展,企业将更加注重如何将技术应用到实际的商业场景中,人们会看到将一项伟大的技术应用于商业问题的价值。

  “大模型本身的最终价值将归为零,换句话说,大模型本身创造巨大的价值,但不能捕获价值。”王金林提出了这样的观点。他接受采访时对比了闭源模型和开源模型的价值捕获方式,认为前者的剩余价值(residual value)可能随着时间推移而减少,但后者通过开放和协作,能够在应用层面持续创造和捕获价值。

  他强调,AI的竞争不仅仅是模型本身的竞争,更是应用层(含工具类应用)的竞争。开发者和研究人员在应用层的创新和开发中,将可以有效地捕获价值,持续推动AI技术的发展和应用。

  中美科技博弈持续的背景下,DeepSeek通过创新推动了全球AI产业的边界扩展,这一现象也为更多初创企业提供了借鉴和启示。

  开源模型通过共享技术,鼓励全球开发者在其基础上进行二次开发和创新,从而形成一个活跃的生态系统。这种开放的策略使得DeepSeek能够在全球范围内吸引更多的开发者和研究人员,共同推动技术的进步和应用的多样化。

  随着AGI技术的不断演进,我们或许已站在新的科技革命前沿。DeepSeek这家来自中国的初创企业,正在为全球AI创业企业掀开新的技术范式,也重塑着未来人工智能竞争的版图。

有话要说...