AI资讯

百度正式发布全球首个全端通用智能体 GenFlow 2.0

百度于2025年8月18日正式发布全球首个全端通用智能体;GenFlow 2.0,由百度文库与百度网盘联合推出。该产品以超主流同类产品10倍的生成速度为核心突破,重构了AI任务处理效率与用户体验。以下是其核心亮点与技术创新的深度解析:一、速度革命:并行架构实现分钟级复杂任务交付百级智能体并行协作GenFlow 2.0 采用自研;Multi-Agent 并行架构,支持

腾讯AI Lab开源深度研究智能体,推动AI研究新变革

025年8月6日15时28分,腾讯AI Lab传来重大消息,其开源了可复现的深度研究智能体,最大限度降低了外部依赖,为人工智能领域的发展注入了新的活力。深度研究智能体(Deep Research Agents)依托大语言模型(LLM)和视觉 - 语言模型(VLM)的强大能力,正在革新知识发现与问题解决的模式。然而,当前现有的开源智能体框架大多依赖付费工具,这极大地限制了其可复现性和普适性。腾讯AI

华纳兄弟探索公司起诉Midjourney侵犯版权角色一案

华纳兄弟探索公司起诉Midjourney侵犯版权角色一案,是当前AI生成内容(AIGC)领域版权争议的典型案例。结合迪士尼、环球影业等同类诉讼的进展,可从以下角度分析:一、侵权行为的法律认定‌直接侵权‌Midjourney被指控未经授权使用华纳兄弟旗下角色(如《哈利·波特》《蝙蝠侠》等)训练AI模型,构成对《美国版权法》第106条复制权的侵犯‌。诉状中可能通过角色形象细节比对(如服装、标志性动作)

Google Docs 推出了一项全新的功能,用户现在可以通过 AI 生成语音来朗读他们的文档

谷歌为其在线文档处理工具 Google Docs 引入了一项实用的新功能——AI 语音朗读。该功能旨在通过清晰、自然的AI语音,将文档文本转换为语音朗读,为用户提供一种更轻松、多感官的文档消费方式,特别适合长时间面对屏幕或需要多任务处理的用户。核心功能与体验高质量AI语音:该功能采用先进的文本转语音(TTS)技术,能生成非常清晰、流畅且语调自然的朗读声音,极大提升了听觉体验,告别了机械式的机器人发

蚂蚁AI健康管家上线四大打假功能AQ拍图辨假药

蚂蚁集团于2025年8月18日正式宣布旗下AI健康管家AQ推出四大医疗打假功能,向虚假医疗广告宣战‌12。该行动包含以下核心措施:‌AI识别假广告‌用户输入"打假"指令即可激活:‌AI拍照打假‌:对医药保健品广告拍照即时鉴伪,准确率达98%‌‌AI电话验真‌:通过语音交互实时验证健康谣言真伪‌‌24小时滚动辟谣‌:动态更新最新医疗骗局预警‌‌专业医疗资源支持‌联合30万执业医师提供在线问诊,其中6

谷歌DeepMind团队开发的AI模型成功预测今年最强大西洋风暴的强度与路径

谷歌DeepMind团队开发的AI气象预测模型,在刚刚过去的飓风艾琳(Hurricane Irene)中,其预测表现超越了传统气象模型,这确实是AI应用于极端天气预报领域的一个值得关注的进展。下面是一个简要的对比表,帮你快速了解它的表现:特性维度谷歌 AI 模型预测内容同时预测路径和强度72小时路径预测显著优于美国国家飓风中心(NHC)官方预测和许多传统模型强度预测表现不俗,尤其两天内的预测准确性

微软在Azure AI Foundry上正式发布了 GPT-realtime 模型,更逼真的语音交互和多模态输入能力

微软确实在Azure AI Foundry上正式发布了GPT-realtime模型,这款模型由 OpenAI 开发,主打更逼真的语音交互和多模态输入能力,旨在提供更自然的人机对话体验。下面是一个核心信息表格,帮你快速了解 GPT-realtime:特性维度详细说明发布单位微软(基于 OpenAI 技术)发布平台Azure AI Foundry核心功能语音到语音(S2S)转换