近日,南京大学的研究团队与字节跳动、西南大学联合推出了一项创新技术 ——STAR(Spatial-Temporal Augmentation with Text-to-Video Models),旨在利用文本到视频模型,实现真实世界视频的超分辨率处理。该技术结合了时空增强方法,能够有效提高低分辨率视频的质量,尤其适用于在视频分享平台上下载的低清晰度视频。
来源 | 北大对齐小组投稿如何将全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。导读:在当前 AI 领域的快速发展中,“有效加速”和“超级对齐”已经成为两个主要的发展动向,它们深刻影响着研发方向和投资决策。前者以 OpenAI ...
AI一句话搞定CAD绘图,不仅可以文字修改细节,还能完美融入传统工作流,这个AI叫做“TEXT-TO-CAD”,吸引了近百万网友围观。
MiniMax有点“变味儿”了? 此前,凭借海螺AI等C端产品在海外爆火的大模型厂商MiniMax,近期打出了一张“技术牌”。 1月15日,他们发布并开源新一代01系列模型(基础语言大模型 MiniMax-Text-01 ...
图片和视频生成是近年来人工智能领域备受关注的研究热点。其中,基于用户文本提示词生成图片和视频的技术,有效构建了用户意图与视觉内容之间的桥梁。然而,此类生成技术的模型通常具备海量参数,其带来的高计算和存储成本远超单个用户设备的能力范围,因此依托移动通信 ...
Thousands of self-proclaimed “TikTok refugees” are flocking to Xiaohongshu, or RedNote by US users, which surged to the top ...
Modern life makes us tired, right? But research from societies in Africa and South America suggests people in the ancient ...
RedNote, known as Xiaohongshu in China, saw a sudden surge in popularity among American users as TikTok faced a possible ban on January 19, 2025. The app became a haven for content American creators ...
1月15日下午,银川市金凤区天朗气清。透过无人机镜头从空中俯瞰,冰封的典农河犹如一条灵动的玉带萦绕在城市楼宇间,向西眺望,蔚蓝的天空与白雪覆盖的贺兰山相映成景,隆冬的湖城银川宛若一幅色彩斑斓的油画,赏心悦目。
据介绍,这个模型的参数量高达 4560 亿,其中单次激活 459 亿,模型综合性能比肩海外顶尖模型,在大多数任务上追平了海外公认最先进的两个模型,GPT-4o-1120 以及 Claude-3.5-Sonnet-1022。 在长文任务上,随着输入长度变长,MiniMax-Text-01 性能衰减更少,显著优于谷歌 Gemini。因此,01 系列模型在处理长输入的时候有非常高的效率,接近线性复杂度。
近日,联发科与意腾科技宣布,将协同合作为车用、智慧家庭,以及智慧零售市场打造创新的AI语音解决方案,并于CES 2025展出。双方合作将致力于提升用户与汽车、智能设备的互动体验,为全球用户带来更智能、安全且直观的生活方式。