Deepseek为什么会让世界震惊?

2025年1月27 日英伟达跌近17%,一夜市值蒸发近 5890 亿美元,约两个半茅台,创下了美股史上最大的单日市值损失记录,DeepSeek 直接带崩美股,凌晨几乎霸占了美国财经媒体的头条。

image-20250313195031118

DeepSeek 做了什么?

2024年12月26日DeepSeek V3的训练成本仅用557万美元,而GPT-4o的模型训练成本约为1亿美元。远低于行业平均水平,成为开源模型中的“性价比之王”!

2025年1月15日发布APP登顶各大应用市场;

2025年1月20日发布DeepSeek-R1,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。除模型支持深度思考外,并允许用户通过蒸馏技术借助 R1 训练其他模型。

2025年1月27日DeepSeek 甚至又送出了一份新春大礼,开源了多模态人模型 Janus-Pro 7B版本已经能领先 OpenAI的DALL-E 3和 Stable Diffusion。

我们先来看看创始人梁文锋。

1985年出生,广东人,浙江大学毕业,拥有信息与电子工程学系本科和硕士学位。杭州幻方科技有限公司、DeepSeek创始人。

2019年,其资金管理规模突破百亿元;

2023年7月,幻方量化宣布成立大模型公司深度求索DeepSeek,正式进军通用人工智能领域。DeepSeek本身拥有大量资本,并且在美国对中国芯片持续制裁的情况下,2023年幻方量化储备了万张 A100 芯片,是大厂外唯一一家储备万张芯片的公司,这也是引发中国大模型价格战的源头。梁文锋说过:所有的套路都是上一代的产物,未来不一定成立。我们目的地是AGI,这意味着我们需要研究新的模型结构,在有限资源下,实现更强的模型能力。

deepseek震惊世界

为什么会影响英伟达的市值?

现在的大模型都是基于英伟达显卡,如A100、H100、2025年2月最新发布的B200。如果训练依赖的显卡需求降低了,那么对英伟达的市值会大打折扣,但其实AI还处于起始阶段,对显卡的依赖还是存在的。

为什么国外都惧怕DeepSeek?

中国企业之前都是等国外开源,如meta的llama3,然后基于开源大模型再做加工和应用;中国公司习惯了别人做技术创新,我们拿过来做应用变现。美国擅长搞技术创新,中国更擅长做应用。因为Deepseek是一个中国公司,在以创新贡献者的身份,加入到他们游戏里去。

DeepSeek 的意义是什么?

1.AI 训练变得更便宜。

2.AI 使用成本大幅下降。

3.迈向 AGI 的关键一步。

最重要的是它给了中国信心和希望