×

国产大模型公司DeepSeek强势崛起,引发全球科技股巨震

区块链研究 区块链研究 发表于2025-02-04 17:09:51 浏览24 评论0

抢沙发发表评论

国产人工智能公司DeepSeek近期动作频频,其发布的多个模型引发市场强烈关注,甚至在短期内对美国科技股造成巨大冲击。

首先,DeepSeek于1月28日发布了开源多模态模型Janus-Pro,该模型在文本提示图像生成方面超越了OpenAI的DALL-E 3和Stability AI的Stable Diffusion,展现了其强大的技术实力。Janus-Pro是此前Janus模型的升级版,通过改进训练策略、扩大训练数据和提升模型尺寸,显著提高了多模态理解和视觉生成能力。

更早之前,DeepSeek于1月20日发布了推理大模型DeepSeek-R1,这款模型的开源性质、低廉的售价和训练成本迅速引发行业关注。R1在数学、代码、自然语言推理等任务上的性能与OpenAI的o1模型相当,并且采用MIT许可协议,支持免费商用、任意修改和衍生开发。据DeepSeek介绍,R1的预训练费用仅为557.6万美元,在2048块英伟达H800 GPU上运行55天完成,这与巨头动辄数千万美元的训练成本形成鲜明对比,或将引发行业对大模型成本的重新评估。

DeepSeek的强势表现直接冲击了美国科技股市场。1月27日,美股经历大幅下跌,英伟达暴跌16.97%,单日市值蒸发5890亿美元,创下历史纪录;其他科技巨头如甲骨文、超微电脑、博通和台积电也均出现大幅下跌,总市值蒸发约1万亿美元。市场人士认为,DeepSeek的R1模型,以及其低成本的训练方式,让华尔街开始质疑科技巨头在AI基础设施上的巨额投资以及对英伟达芯片的需求是否合理。

此外,DeepSeek应用在发布后迅速登顶苹果中国和美国地区应用商店免费APP下载排行榜,并在美区超越ChatGPT,进一步印证了其强大的市场竞争力。然而,DeepSeek也面临着巨大的挑战,其AI服务在24小时内多次宕机,并遭遇大规模恶意攻击,这反映了其在快速发展过程中面临的服务器压力和安全挑战。

DeepSeek的崛起无疑给全球人工智能领域带来新的变数,其开源、低成本的模型策略,不仅给中小企业提供了更多机会,也对现有的行业格局带来冲击。未来DeepSeek的发展值得持续关注,其技术创新和商业模式的成功与否,将深刻影响全球人工智能产业的未来发展方向。

去中心化以太坊实验室

访客