从去年游戏科学的“黑神话悟空”电脑游戏爆红与两款六代战机几乎同时试飞,到今年初DeepSeek的AI大地震、央视春晚宇树科技机器人跳秧歌的演出,都是以“横空出世”的姿态出现从而引起全球震撼。
AI 行业过去依赖扩大模型、增加数据和提升硬件效能来发展,但成本与效率成为挑战。DeepSeek 采用蒸馏模型(Model Distillation)技术,压缩大型模型以提升推理速度并降低硬件需求,同时充分发挥 NVIDIA Hopper 降规版芯片的效益,最大化运算资源利用。其成本优势来自高效能硬件选择、新型蒸馏技术及 API 开源策略,不仅优化技术与商业应用的平衡,也展现 AI ...
2024年,全球人工智能(AI)初创企业的融资额达到了惊人的1004亿美元,与上一年度相比激增79.61%,创下了自2020年以来的新高。回顾过去几年,这一领域的融资额分别为2020年的422亿美元、2021年的961亿美元、2022年的614亿美元 ...
近期,国产AI大模型DeepSeek横空出世,仅以几十分之一的成本,就达到与全球领先的ChatGPT最新o1版本推理模型相当的实力。目前,DeepSeek下载量持续攀升,据研究公司SimilarWeb估计,在短短一周内,DeepSeek网站的用户数量就超过了谷歌的Gemini聊天AI,而后者已经存在了近两年。一时间,各界众说纷纭:DeepSeek为什么这么牛?何以如此?是创新还是蒸馏?……诸如此类 ...
国内领先的AI企业深度求索所研发的大模型DeepSeek在全球范围内赢得了广泛赞誉,首批利用该技术实现盈利的用户也开始涌现。
创新是一种信念。硅谷之所以创新能力强大,是因为那里的人们敢于尝试。ChatGPT出现时,中国在前沿研究上显得信心不足,许多人认为差距太大,转而专注于应用层面。但创新需要信心,年轻人往往更具这种信心。
作为鹏华科技系列ETF的基金经理,基金经理罗英宇指出,DeepSeek技术创新与突破吸引了市场的广泛关注,对于A股市场走势也形成了结构性的影响。从云计算与大数据、传媒等角度来看,DeepSeek的AI模型对市场对AI基础设施的投资预期产生了显著影响,该模型崛起促使投资者重新审视AI硬件市场的投资逻辑。过去,AI产业的投资主要集中在高端算力和数据中心领域,AI性能的提升与算力投入呈线性关系。然而,D ...
据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
春节假期期间,DeepSeek的爆火如“平地一声雷”。这家于2023年成立的人工智能基础技术研究企业,在今年1月20日正式开源其R1推理模型,该模型在数学、代码、自然语言推理等任务上,性能比肩OpenAI-o1正式版,且开发成本仅为600万美元,仅相当于OpenAI-o1 模型开发成本的1.2% ...
Cathie Wood : 我认为这表明创新的成本正在急剧下降,而且这种趋势早已开始。例如,在DeepSeek之前,人工智能训练成本每年下降75%,推理成本甚至下降85%到90%。我认为这也意味着推理芯片(Inference ...
大约一周前,DeepSeek 发布了 DeepSeek-R1, 这是一款性能对标 OpenAI o1 的杰出模型,且以 MIT 许可协议开放权重。 通过 Qwen(我的团队已使用数月)、Kimi、InternVL 和 DeepSeek ...
2025年1月20日,当西方科技巨头齐聚特朗普的总统就职典礼时,一家名不见经传的中国人工智慧(AI)公司——DeepSeek(深度求索),悄然发布了其R1模型的人工智能开源版本,并附上技术报告及不受限制的商业使用许可证。这不仅仅是普通的AI应用程式。其在多项核心指标上可以OpenAI的Cha ...