AI资讯

谷歌推出Stax的实验性评估工具,专门用于帮助开发者测试和分析大语言模型。

谷歌推出的 Stax 是一款专注于帮助开发者根据自定义标准评估大语言模型(LLM)的实验性工具。它旨在解决传统通用基准测试在反映模型领域特异性表现时的不足,让评估更贴合实际应用场景。下面是一个表格,帮你快速了解 Stax 的核心功能与价值:特性维度具体说明核心目标提供结构化、可重复的方法,根据自定义标准评估和比较不同的大语言模型 (LLM)。解决的核心痛点LLM 是概率性系统,相同提示

美团正式发布并开源了其首个大规模语言模型LongCat-Flash-Chat

美团于2025年9月1日正式发布并开源了其首个大规模语言模型LongCat-Flash-Chat。这款模型因其独特的架构和出色的效率表现,引起了业界广泛关注。以下是关于LongCat-Flash-Chat的主要信息梳理:特性维度具体信息模型名称LongCat-Flash-Chat发布/开源时间2025年9月1日模型架构混合专家模型(Mixture-of-Experts, MoE)总参数量5600亿

上海AI实验室推出的OpenDataArena,确实有望改变AI模型训练中数据评估的“玄学”现状

上海AI实验室推出的OpenDataArena,确实有望改变AI模型训练中数据评估的“玄学”现状,让数据价值的衡量变得更科学、更客观。下面这个表格汇总了它的核心功能和特点,方便你快速了解:特点维度具体说明解决的问题/带来的价值核心理念构建公平、公开、透明的数据评测平台,“训评一体化”将数据质量评估从“经验玄学”变为可量化、可复现的科学评估核心方法让不同数据集在同等条件下训练模型(采用主流模型和训练

苹果 FastVLM 上线:5分钟体验85倍速视觉 AI

苹果最新发布的 ‌FastVLM‌ 视觉 AI 框架再次展现了其在 ‌端侧 AI(On-Device AI)‌ 领域的领先优势。这款工具的核心亮点在于 ‌本地化极速处理 + 隐私绝对保护‌,与当前主流的云端 AI 形成鲜明对比。以下是深度解析:‌一、核心突破:为什么是「革命性」的?‌‌85 倍速视觉处理‌实测在 iPhone 15 Pro 上,5 分钟内完成传统云端 AI 需要 7 小时的任务(如

阿里最新开源的Vivid-VR模型通过概念蒸馏技术实现了文本到视频大模型(T2V)在视频修复任务中的突破性应用

阿里巴巴最新开源的Vivid-VR模型通过概念蒸馏技术实现了文本到视频大模型(T2V)在视频修复任务中的突破性应用,其核心创新在于解决了传统微调方法导致的分布漂移问题。该模型基于DiT架构,通过将预训练大模型对高质量视频的理解蒸馏到修复任务中,既提升了画质修复能力,又保留了生成高质量视频的核心能力。技术亮点‌概念蒸馏策略‌通过蒸馏T2V模型固有的高质量视频生成能力,避免微调过程中的性能衰减。这种策

阿里夸克启动“教育计划”面向全国近2000万教师和5000万高校学生推出AI教育普惠行动

阿里夸克启动了其迄今为止最大规模的“教育计划”,面向全国近2000万教师和5000万高校学生推出AI教育普惠行动,旨在降低AI工具的使用门槛,让师生能免费享受到实用的AI工具。为了帮你快速了解这项教育计划的核心内容,我准备了一个表格:方面内容面向人群全国近2000万教师和5000万高校学生核心福利免费领取夸克AI会员、夸克扫描王会员、夸克网盘会员福利时长教师:认证后可每年教师节期间获赠会员;大学生

阿里商旅发布的两大AI智能体(员工差旅智能体和企业管理智能体)

阿里商旅发布的两大AI智能体(员工差旅智能体和企业管理智能体)确实能让你的出差和报销变得更“聪明”和省心。它旨在用技术手段解决企业差旅中“成本、合规、体验”难以兼顾的“不可能三角”问题。下面这个表格汇总了它们的核心功能,帮你快速了解各自的主要本领和受益方:智能体名称核心功能简介关键亮点/如何变"聪明"员工差旅智能体智能差旅推荐、预订一句话生成行程与审批:只需提供事由、时间、地点,AI自动生成完整差

华盛昌宣布"DeepSense"深度感测大模型通过备案

华盛昌的“DeepSense深度感测大模型”已正式通过生成式人工智能服务备案。这标志着它在“AI+测量智能体”领域取得了阶段性成果,意味着其可以正式开展相关服务。以下是大模型的核心信息:特性维度具体说明模型名称DeepSense深度感测大模型备案通过时间近日主要应用领域仪器仪表、专业测量和检测等相关行业核心功能提供仪器仪表的操作、维护、校准等环节的实时技术支持;结合传感器数据与深度学习技术,优化测

中国企业级AI大模型市场确实正经历爆发式增长

中国企业级大模型市场确实正经历爆发式增长。国际权威机构沙利文(Frost & Sullivan)最新发布的《中国GenAI市场洞察:企业级大模型调用全景研究,2025》报告揭示了这一点。下面是一个简要的表格,帮你快速了解核心数据:关键指标具体数据说明日均Tokens消耗量10.2万亿Tokens中国企业级市场大模型的日均总消耗量日均调用量增长率较去年下半年暴增363%市场呈现爆发式增长市场

如何识别 AI 生成内容?

着大模型在学习、工作中的广泛应用,其伴生问题也日益凸显,如生成虚假信息、冲击学术诚信等,精准识别 AI 生成内容成为亟待解决的问题。南开大学计算机学院媒体计算实验室的研究成果为解决该难题提供了可行方案。现有检测方法的困境:目前 AI 生成内容检测主要有基于训练的检测方法和零样本检测方法两种路线。但多项研究表明,现有检测方法在应对复杂现实场景时面临困境,容易出现误判。例如,《荷塘月色》《流浪地球》等