AI资讯

阿里最新开源的Vivid-VR模型通过概念蒸馏技术实现了文本到视频大模型(T2V)在视频修复任务中的突破性应用

阿里巴巴最新开源的Vivid-VR模型通过概念蒸馏技术实现了文本到视频大模型(T2V)在视频修复任务中的突破性应用,其核心创新在于解决了传统微调方法导致的分布漂移问题。该模型基于DiT架构,通过将预训练大模型对高质量视频的理解蒸馏到修复任务中,既提升了画质修复能力,又保留了生成高质量视频的核心能力。技术亮点‌概念蒸馏策略‌通过蒸馏T2V模型固有的高质量视频生成能力,避免微调过程中的性能衰减。这种策

腾讯开源的HunyuanWorld-Voyager模型,能够从单张图像生成3D世界的AI系统

是的,腾讯混元团队开源的HunyuanWorld-Voyager确实是一项令人兴奋的技术突破。它能够从单张图像生成高质量、一致性强的3D场景,并且在多项测试中表现卓越,甚至超过了Google的Gen-3等模型,登顶斯坦福WorldScore基准测试。下面我来为你详细解读这项技术。核心创新与优势HunyuanWorld-Voyager的核心价值在于其原生3D重建能力和超长程的

斑马智行元神AI大模型问鼎全球智能座舱迎来革命性升级

“大模型上车”正逐步从营销驱动迈向场景驱动,AI Agent开始量产上车并带来全新体验,智能座舱大模型成为体验跃迁的关键技术。近日,全球知名调研机构IDC发布《智能座舱大模型能力评估,2025》报告,针对车控、车书、娱乐、出行、商务、生活、社交等7大高频场景,对9家主流新势力车企及AI公司的智能座舱大模型进行评估,斑马智行元神AI大模型以6项第一(其中3项满分)全面领先

张宏江博士在2025年外滩大会上的分享,点出了AI发展的关键动向:“产业规模化”

张宏江博士在2025年外滩大会上的分享,点出了AI发展的关键动向:“产业规模化”。这意味着AI正从“技术探索”更多地向“大规模应用”和“与经济深度融合”转变。其核心观点,主要包括以下四个方面:维度核心观点关键证据/案例技术趋势大模型"规模定律(Scaling Law)"依然有效,但有了新发展提出"推理规模定律"(reasoning scaling),上下文、记忆等需求持续推升算力;大模型单位tok

宾州州立大学信息科学与技术学院(College of IST)推出的人工智能方法与应用学士学位

宾州州立大学信息科学与技术学院(College of IST)推出的人工智能方法与应用学士学位(Bachelor of Science in Artificial Intelligence Methods and Applications, 简称AIMA),确实旨在培养面向未来的AI人才。下面我将为你梳理这个项目的核心信息。为了让你快速了解这个项目与传统计算机科学(CS)项下AI方向的可能区别,我

微信AI播客双人对话播报新闻

微信AI播客(或类似功能,如腾讯混元AI播客)的推出,确实展现了AI在音频内容生成方面的强大能力,尤其是“双人对话式播报”让人耳目一新。但这是否意味着传统主播会失业,情况可能没那么简单。下面这个表格汇总了AI播客的主要能力和目前的一些局限,希望能帮你快速了解:特性维度AI播客的优势AI播客当前的局限播报效率与成本可24小时不间断工作,处理大量标准化内容;播报准确性基于既定文

夏威夷大学(UH)正在系统范围内积极推进人工智能的发展

夏威夷大学(UH)正在系统范围内积极推进人工智能的发展,旨在成为该领域的领导者。学校通过多项举措,将AI深度融入教学、科研、运营及社区服务中,以应对技术变革带来的机遇与挑战。下面表格汇总了其主要方向和举措:方面具体内容战略定位与愿景将AI视为如电力般的通用技术,预计其影响将超越工业革命,触及各行各业目标是引领夏威夷乃至更广泛地区应对AI带来的变革教育教学确保所有专业学生掌握AI技能,并将AI工具融

灵动岛式交互革新+旗舰芯片算力跃升+AI功能深度集成”的组合拳

一、“灵动岛”已成安卓标配,但本土化创新超越模仿安卓厂商对顶部交互区域的升级并非简单复制,而是结合系统特性进行了场景化创新:OPPO流体云通知(ColorOS 16):打通手表、手机、平板多端,在通知栏即时显示消息详情,支持跨设备任务流转。vivo原子岛(OriginOS 6):由原子通知升级而来,集成打车进度、外卖追踪等实时服务,长按可直呼功能菜单(如联系司机、延迟收货)。小米灵动岛