Deepseek引领神秘技术潮流,全球算力股市受冲击

发布日期:2025-02-05 06:38    点击次数:147


国产AI大模型DeepSeek引发关注

近日,国产AI大模型DeepSeek R1在全球AI圈引起轰动,已成为世界最先进AI模型之一,可媲美OpenAI的o1和Meta的Llama AI模型。DeepSeek-V3发布后,美国热度持续上升。美国媒体警告,中国的新AI技术已威胁到美国的领先地位。

Scale AI CEO称DeepSeek R1超越顶尖AI模型

在CNBC的采访中,Scale AI创始人兼CEO Alexander Wang表示,DeepSeek R1在其公司最严苛的AI测试中超过了所有顶级AI模型,包括在多个第三方测试中超越了OpenAI的最新模型。

DeepSeek-V3性能超越

《自然》杂志指出,DeepSeek-V3在化学、数学和编程方面已赶上美国领先的人工智能公司OpenAI的o1模型。

DeepSeek登顶APP Store免费榜

昨天早上,DeepSeek还未进入前五,但截至今天,它已登顶美区苹果App Store免费榜,超越ChatGPT,位居第一,Threads位列第三。这表明其热度不亚于ChatGPT,显示AI大模型领域有新分支出现。DeepSeek的火爆也影响了全球算力股,英伟达股价在美股盘前大跌超7%,市值蒸发近两万亿人民币,纳指期货下跌2.3%。

日本半导体股普跌

上周,日本半导体股受特朗普“星际之门”项目影响表现强劲。但周末在DeepSeek冲击下,日本半导体股普遍下跌:软银集团股价一度跌5.4%,创11月1日以来最大跌幅;东京电子和Disco均跌超3%;爱德万测试(英伟达的测试设备供应商)跌8.2%。

DeepSeek挑战英伟达霸权

英伟达等算力股下跌的原因在于DeepSeek的出现,挑战了美国对算力为核心竞争力的认知。在美对华限制先进AI算力的背景下,DeepSeek仅用1024张英伟达H800显卡(560万美元)就完成了训练,而OpenAI的GPT-4使用了一万张H100显卡(约1亿美元)。DeepSeek的API定价为每百万tokens 1至16元人民币,仅为OpenAI成本的三十分之一。这使得外媒视DeepSeek为“神秘的东方魔法”,称AI霸权之争已结束,引发美国担忧。

AMD GPU或更具成本效益

DeepSeek证明,最先进芯片不再是训练大模型的必需。"DeepSeek-V3模型在英伟达为中国的H800 GPU上训练,但AMD的MI 300X在关键测试中超越了H100。这可能改变GPU市场格局,甚至威胁英伟达的主导地位。由于DeepSeek-V3的成本降低,AMD GPU可能比英伟达更具成本效益。

中国AI威胁与成本挑战

国外分析师Holger Zschaepitz认为,中国DeepSeek可能是对美国股市的最大威胁,因其低成本开发了先进的人工智能模型,不依赖顶级芯片,引发对数百亿美元资本支出有效性的质疑。

不仅英伟达感到不安,美国ChatGPT创始人山姆·奥特曼宣布将ChatGPT O3Mini版从每月200美元免费提供,显示出强烈的危机感和恐慌情绪。

美国用户担心禁用DeepSeek

如今,越来越多的美国用户担心美国会禁止使用DeepSeek,因为该公司的数据存储在中国。

中国AI公司面临芯片限制

这关乎OpenAI和Meta的Llama AI等大模型的未来。扎克伯格非常担忧。

尽管DeepSeek大幅降低了成本,但仍依赖英伟达的AI芯片。此前,旷视、依图、云从、摩尔线程等多家AI公司被列在美国“实体清单”上,影响其训练大规模模型。DeepSeek CEO称,该公司使用了数万个NVIDIA H100 AI GPU进行训练。

美国Scale AI的亚历山大·王估计,DeepSeek可能拥有超过5万块H100芯片,并认为未来中国AI行业将面临更多芯片和出口限制,难以获得更多芯片。

国产AI芯片性能接近美国顶尖芯片

美国限制芯片出口,但影响可能不大。有消息称,当其他大公司抢购H100芯片时,DeepSeek将自家模型移植到了昇腾910B芯片上运行,并通过“动态精度调节”技术,使性能仅下降5%,而成本降低了70%。使用中国AI芯片的大模型完全可与美国顶尖大模型媲美。

DeepSeek开创大模型新范式

DeepSeek选择了与国外大模型巨头不同的开源路径,公布了可复现的论文,这可能成为大语言模型的新范式。未来,AI的重点是在不依赖大量计算资源的情况下创造高质量产品。

国运级的科技突破和全球开源生态能否成功?DeepSeek创始人梁文锋认为,中国AI不能永远跟随,必须有人站在技术前沿。这是一场开放与封闭的较量,DeepSeek的模型开源,知识免费提供给全球,避免垄断。

美国公司如OpenAI、Anthropic和谷歌则保持封闭。DeepSeek需建立生态系统,依靠开源、共享、低价和颠覆性性能。通过开源方法,DeepSeek汇聚集体智慧,促进协作创新,缓解资源限制,加速尖端技术的发展,实现全球化大模型。

DeepSeek获海外认可与AMD合作

DeepSeek凭借低成本和高性能获得了国外研究人员和开发者的青睐。目前,已有包括加州大学伯克利分校、香港科技大学和HuggingFace在内的多家机构成功复现,成本低至几十美元。AMD也支持DeepSeek,宣布其新模型已集成到AMD Instinct GPU中。

未来,全球工程师可能从qwen和ds开始学习大模型。若此趋势继续,中国公司或首次主导互联网基础设施标准。美国要与其竞争,需迅速学习并采用开放、开源模式。由于算力和算法方面难以限制,封闭模式下的美国AI大模型可能面临崩溃。




Powered by pg电子爆大奖技巧 @2013-2022 RSS地图 HTML地图

Copyright Powered by365站群 © 2013-2024