摘要事件:ChatGPT服务器跳闸,微软数据中心电力故障。北京时间12月27日凌晨2点30分左右,Open   AI的AI服务器中断服务,影响 ChatGPT 聊天机器人、Sora 视频生成模型以及部分   API ...
陈聆听/文 2024 年 12 月 23 日,据美国白宫官网消息,美国现任总统拜登要求美国贸易代表办公室(USTR)依照《1974 年贸易法》第 301 条,宣布开启针对中国半导体行业行为、政策及做法的调查行动(即 “301 ...
DeepSeek v3因为是后发,完全可以避开前人走的坑,用更高效方式避坑,也就是“站在巨人的肩膀上”。真实逻辑应该是:榨干同等算力去攫取10倍收益。就比如o1的训练成本远超GPT-4,而o3的训练成本大概率远超o1。从前沿探索角度看,训练所需算力只会越来越多。应用生态越繁荣,只会让训练投入的支付能力更强;而算力通缩,只会让同等投入买到更多训练Flops。