📰 AI News
Stay updated with the latest AI industry news and trends
GitHub 热门:mvanhorn/last30days-skill
AI agent skill that researches any topic across Reddit, X, YouTube, HN, Polymarket, and the web - then synthesizes a grounded summary(主要语言:Python)
Read original高德推出首个3D原生城市世界模型ABot-Earth 0.5
高德地图推出 ABot-Earth 0.5 ,首个3D原生城市世界模型。模型支持图像、文本等多模态输入,可在消费级单卡GPU上10分钟内生成1平方公里高保真3D城市场景。模型基于3D Gaussian Splatting表示,采用原生LoD解码器和滑窗无缝推理策略,覆盖全球190余个国家和地区、300余城市。 来源:高德技术
Read originalGitHub 热门:RyanCodrai/turbovec
A vector index built on TurboQuant, written in Rust with Python bindings(主要语言:Python)
Read original小米推出 MiMo-V2.5-Pro UltraSpeed 模式
小米联合TileRT推出 MiMo-V2.5-Pro UltraSpeed模式,在通用GPU上实现万亿参数模型生成速度首次突破1000 tokens/s。该模式定价为普通版的3倍,输出速度提升约10倍,仅支持API体验。MiMo-V2.5-Pro UltraSpeed模式采用申请制限时开放,优先审核企业与专业开发者。 来源:IT之家
Read originalGitHub 热门:roboflow/supervision
We write your reusable computer vision tools. 💜(主要语言:Python)
Read originalAI 短剧创作「井英科技」宣布完成数千万美元 A 轮及 A+ 轮融资
井英科技(CreativeFitting)完成数千万美元A轮及A+轮融资,投资方包括王慧文家办、蚂蚁集团等,同时宣布原AWS首席应用科学家王敏捷加盟任首席科学家。公司定位为内容行业首家Agent原生公司,以AI短剧为首个场景,构建创作者Agent可接入、可自我进化的强化学习环境,通过真实消费反馈驱动迭代。 来源:机器之心
Read originalGitHub 热门:opencv/opencv
Open Source Computer Vision Library(主要语言:C++)
Read originalOpenAI为所有个人用户开放ChatGPT锁定模式
OpenAI宣布向所有ChatGPT个人用户(Free、Go、Plus、Pro)开放锁定模式。功能启动后能禁用实时网页浏览、深度研究、Agent模式、图片检索及文件下载等高风险联网功能,仅支持访问缓存内容,同时保留图片上传与生成功能。 来源:ChatGPT
Read originalGitHub 热门:refactoringhq/tolaria
Desktop app to manage markdown knowledge bases(主要语言:TypeScript)
Read original大晓机器人推出全屋三维可交互世界模型 Kairos-HomeWorld
大晓机器人联合香港中文大学、深圳河套学院推出全球首个全屋三维可交互世界模型 Kairos-HomeWorld 。模型采用四阶段分层生成架构,可从文本指令一键生成结构连贯、物理合理、功能完整的全屋三维场景,每个场景平均包含超15个可交互物体,支持机器人完成跨房间导航、物品整理等复杂家务仿真训练。 来源:商汤科技SenseTime
Read originalGitHub 热门:aaif-goose/goose
an open source, extensible AI agent that goes beyond code suggestions - install, execute, edit, and test with any LLM(主要语言:Rust)
Read original谷歌和 SpaceX 公司达成9.2亿美元云计算合作
谷歌与SpaceX达成云计算合作,自2026年10月至2029年6月,谷歌每月向SpaceX支付9.2亿美元(约62.46亿元人民币),租赁约11万张英伟达GPU、CPU等芯片算力,用于AI训练与推理。协议将缓解谷歌算力供应紧张,同时为SpaceX AI业务开辟重要收入来源,为其IPO增添新叙事筹码。 来源:IT之家
Read originalGitHub 热门:Andyyyy64/whichllm
Find the local LLM that actually runs and performs best on your hardware. Ranked by real, recency-aware benchmarks, not parameter count. One command, run it instantly.(主要语言:Python)
Read original「华超神控」获亿元天使系列融资
新一代AI超声脑机公司华超神控(BCI-Sonics)宣布完成亿元人民币级天使轮系列融资,天使轮由经纬创投领投,天使+轮由德联资本、道远资本联合领投。公司由中科院博士、前GE医疗中国区负责人李昕创立,专注低强度聚焦超声无创脑机接口技术。本轮资金将用于技术验证与产业化落地,推进疼痛、成瘾等适应症临床转化。 来源:36氪
Read originalGitHub 热门:TapXWorld/ChinaTextbook
所有小初高、大学PDF教材。(主要语言:Roff)
Read originalChatGPT 推出全新的 Dreaming 记忆系统
OpenAI推出基于Dreaming技术的新版ChatGPT记忆系统。系统能自动整理长期对话中的用户偏好、计划等背景信息,判断信息是否过时,实现记忆的自动更新与修正,使回答更个性化。同时新功能新增可查看、编辑的记忆摘要。本次更新率先面向美国Plus和Pro用户开放,未来将逐步扩展至更多地区及免费用户。 来源:APPSO
Read originalGitHub 热门:x1xhlol/system-prompts-and-models-of-ai-tools
FULL Augment Code, Claude Code, Cluely, CodeBuddy, Comet, Cursor, Devin AI, Junie, Kiro, Leap.new, Lovable, Manus, NotionAI, Orchids.app, Perplexity, Poke, Qoder, Replit, Same.dev, Trae, Traycer AI, VSCode Agent, Warp.dev, Windsurf, Xcode, Z.ai Code, Dia & v0. (And other Open Sourced) System Prompts, Internal Tools & AI Models
Read original腾讯推出企业级AI智能工作台WorkBuddy企业版
腾讯推出企业级AI智能工作台 WorkBuddy企业版 ,面向AI原生组织转型提供7×24小时数字员工、人机协同项目模式及企业管理后台,原生接入腾讯文档、网盘与乐享,支持公有云、VPC专享及私有化部署。通过沉淀团队记忆与AI资产,将个人提效升级为组织提效。 来源:腾讯WorkBuddy
Read originalGitHub 热门:yikart/AiToEarn
Let's use AI to Earn!(主要语言:TypeScript)
Read original阿里通义推出通用智能体评测基准 PawBench
通义实验室推出通用智能体评测基准 PawBench ,首次将底座模型与运行框架(Harness)纳入联合评测。PawBench v1.0 包含 150 道真实任务、4050 个测试单元,覆盖 9 个模型与 3 个 Harness 的交叉矩阵。评测发现 Harness 性能差距最高达 6.4 分,同一模型换 Harness 分差可达 11.5 分。 来源:通义实验室
Read originalGitHub 热门:phuryn/pm-skills
PM Skills Marketplace: 100+ agentic skills, commands, and plugins — from discovery to strategy, execution, launch, and growth.
Read original谷歌推出本地实时 AI 音乐模型 Magenta RealTime 2
谷歌Magenta团队推出 Magenta RealTime 2 (MRT2)本地实时音乐AI模型,包含2.4B高质量版与230M高速版,均针对Apple Silicon优化。模型采用逐帧生成架构,将延迟从3秒降至约200毫秒,支持文本、MIDI及音频风格控制。同步推出免费乐器应用Jam与DAW插件,可在Mac端实现低延迟即兴合奏。 来源:IT之家
Read originalGitHub 热门:santifer/career-ops
AI-powered job search system built on Claude Code. 14 skill modes, Go dashboard, PDF generation, batch processing.(主要语言:JavaScript)
Read originalAI音乐公司 Suno 获4亿美元融资
AI音乐独角兽 Suno 完成4亿美元融资,估值翻倍至54亿美元,由Bond Capital领投,IVP等跟投。公司订阅用户已突破200万,年销售额有望达3亿美元,计划年底扩招70%员工。Suno已与华纳音乐达成和解并签署授权协议,此前仍面临环球、索尼、华纳三大唱片公司的版权侵权诉讼。 来源:Z Potentials
Read originalGitHub 热门:openai/plugins
OpenAI Plugins(主要语言:JavaScript)
Read original月之暗面推出通用型本地 Agent「Kimi Work」Beta版
月之暗面推出面向知识工作者的通用型本地Agent 「 Kimi Work 」 Beta版,随Kimi最新测试版Mac和Windows客户端发布。其内核为 Kimi Code ,支持安装Skills、运行定时任务,内置Kimi WebBridge浏览器操作能力,可自主创建最多300个子Agent的集群协作。Beta版支持金融分析、科研数据清洗、办公报告生成等场景,目前开放内测。 来源:月之暗面Kimi
Read originalGitHub 热门:maziyarpanahi/openmed
open-source healthcare ai(主要语言:Python)
Read original京东开源长音视频生成框架 JoyAI-Echo
京东推出 JoyAI-Echo 长音视频生成框架,通过跨模态音视频记忆库、记忆驱动后训练推理速度提升7.5倍、Director Agent对话式编辑及轻量化实时超分四项技术创新,解决角色一致性、声音稳定性和生成速度三大行业难题。实测显示框架5分钟视频角色与音色高度一致,语音准确率达0.8646,各项指标全面领先。 来源:京东黑板报
Read originalGitHub 热门:francescopace/espectre
🛜 ESPectre 👻 - Motion detection system based on Wi-Fi spectre analysis (CSI), with Home Assistant integration.(主要语言:Python)
Read originalNous Research 推出 Hermes 官方桌面端 Hermes Desktop
Nous Research 推出 Hermes 官方桌面客户端(预览),支持 macOS、Windows 和 Linux 三端。工具具备持久记忆、任务调度、子代理委派、网页浏览、多模态推理及隔离沙箱等核心能力,可直接在本地桌面运行,彻底告别终端命令行。 Hermes Desktop 终结了用户长期依赖终端或第三方UI的历史,标志Hermes向更友好的桌面端AI Agent形态演进。 来源:AI工具集
Read originalOpenAI 发布 AI 编程智能体 Codex 三项更新
OpenAI宣布编程智能体 Codex 三项更新:智能体插件预置6个岗位技能包,企业无需编程可部署AI员工;注释功能支持对生成内容指哪改哪精准修改;站点功能可将文档一键转为交互式网站。Codex周活跃用户已达500万,较年初增长8倍。同时OpenAI计划将Codex引入ChatGPT,支持AWS平台一键部署。 来源:智东西
Read originalWindsurf 升级更名为 Devin Desktop
Cognition 宣布 Windsurf 正式升级为 Devin Desktop ,从 AI IDE 转型为 Agent 指挥中心。新版本引入 Kanban 统一管理本地与云端 Agent,新增 Spaces 实现跨 Agent 上下文共享,支持 ACP 开放协议接入 Codex、Claude Agent 等第三方 Agent。产品保留完整 IDE 能力,现有用户可通过 OTA 自动升级,实现零成本迁移。 来源:Devin
Read original微软推出七款全新 MAI 模型
微软推出全新自研 MAI 模型,包括 MAI-Thinking-1 推理模型、 MAI-Image-2.5图像模型 、MAI-Image-2.5-Flash高效版图像模型、 MAI-Voice-2 语音模型、MAI-Voice-2-Flash高效版语音模型、 MAI-Transcribe-1.5 语音转文本模型、及 MAI-Code-1-Flash 编码模型。所有模型均从零训练,无蒸馏,共享统一数据规范与评估框架。 来源:Microsoft.ai
Read original千问App向第三方Agent、Skill全面开放
千问App 宣布向第三方Agent和Skill全面开放,所有企业均可在千问运营品牌Agent。肯德基、瑞幸、蜜雪冰城、东方航空等首批企业正在测试,将陆续上线。Agent具备记忆与主动规划能力,可主动提供行程提醒、权益到期、复购推荐等服务。 来源:千问APP
Read original字节跳动开源统一视频生成与编辑框架 Bernini
字节跳动开源 Bernini 统一视频生成与编辑框架。框架创新性地引入多模态大模型作为规划师,模型能理解用户意图与语义目标,再交由扩散模型进行高质量视觉渲染,大幅提升AI视频编辑的可控性。 来源:量子位
Read original阿里通义推出多模态智能体基座模型 Qwen3.7-Plus
阿里推出 Qwen3.7-Plus 多模态模型。模型将视觉与语言统一为智能体基座,能感知场景、操作GUI、生成代码并执行任务。模型具备多模态推理、视觉编程和浏览器自动化等能力,可完成APP全链路开发等复杂工作流。在全球权威视觉榜单Vision Arena中,阿里凭借模型跻身全球前五、中国第一。 来源:千问大模型
Read original北大团队全新升级 ChatExcel Max 2.0
北大团队发布 ChatExcel Max 2.0 。新版本彻底解除文件大小、数量限制,100%保留原Excel公式与格式。通过对话即可完成复杂数据处理,一键生成Word、PPT、可视化看板等专业报告。应用于财务审计、物流、人力等场景,实现跨表核对、异常标记与全流程自动化分析,保障企业级数据安全。 来源:元空AI
Read original阿里达摩院推出 AI 原生开发平台「语构」
阿里达摩院推出AI原生开发平台 「语构」 ,以Vibe Coding为核心范式,用户通过自然语言描述可生成完整可用的数字产品。平台覆盖需求理解、智能追问、自动开发到预览发布的全链路,内置大模型对话、文生图、机器翻译、地图检索、实时汇率、股价查询、气象数据等标准化资源接口,支持零代码调用。 来源:AI工具集
Read original谷歌母公司 Alphabet 宣布 800 亿美元大额融资,用于 AI 支出
谷歌母公司Alphabet宣布总额800亿美元股权融资,用于AI基础设施与算力建设。其中300亿美元为公开发行,400亿美元按市值发行,伯克希尔·哈撒韦私募投资100亿美元。公司此前预计2026年资本支出达1800至1900亿美元,2027年将进一步提升;云业务2026年Q1营收同比增长63%,积压订单逾4600亿美元。 来源:IT之家
Read original词元无限完成数千万元融资
词元无限完成数千万元天使+轮融资,由华控基金、水木创投联合领投,厦金创新跟投。公司由字节跳动万人级研发体系AI化改造团队与清华姚班背景团队创立,定位为企业级Agent基础设施,核心产品InfCode与InfOne分别面向AI原生软件开发和组织级智能业务编排,已服务十余家头部金融与软件企业。 来源:Founder Park
Read original扣子 3.0 正式上线
扣子 3.0 正式上线,实现 iOS、Android、Mac、Windows 及网页端全量更新。新版本定位新一代 AI 团队,核心升级多 Agent 协作与项目空间管理,用户可创建项目召集不同职能 Agent 与团队推进任务。同时支持接入 Claude Code、Codex CLI 等本地 Agent,提供云端 Agent 长期运行能力,平台内置投资顾问、自媒体达人等职业模板。 来源:扣子Coze
Read originalMiniMax 开源新一代 AI 模型 MiniMax M3
MiniMax技推出 MiniMax M3 ,国内首个同时具备前沿编程能力、1M超长上下文和原生多模态能力的开源模型。在SWE-Bench Pro等国际权威评测中,M3多项指标超越 GPT-5.5 等海外模型,接近 Opus 4.7 领先水平。模型采用全新的MSA稀疏注意力架构,支持100万token上下文窗口,显著提升处理效率。 来源:MiniMax 稀宇科技
Read original响指HaiSnap APP正式上线
响指HaiSnap APP 正式上线,产品定位为移动端AI创作Agent平台。用户可通过语音、文本或上传文件发起任务,AI自动执行并生成网页应用、文档、PPT、图片等可发布成果。核心功能包括智能体工作区、我的成果库、任务回放及技能调用。 来源:响指HaiSnap
Read originalVAST 获近2亿美元 A 轮系列融资
通用人工智能公司VAST完成A+及A++两轮近2亿美元融资,由渶策资本、国寿长三角科创基金领投,荣耀等产业方及多家一线财务资本联合投资。同时,VAST推出全新世界模型项目Project Eden,创新性地将底层状态推演与视觉呈现解耦,解锁环境长程持久、场景自由复用、多人并发交互等颠覆性能力。 来源:VAST AI
Read original小米开源可控视频音效生成模型 ControlFoley
小米大模型应用团队开源可控视频音效生成模型 ControlFoley ,统一支持文本引导视频配音、文本控制视频配音及参考音频控制视频配音三类任务。模型通过联合视觉编码、时间-音色解耦与模态鲁棒训练,解决现有方案文本控制弱、参考音频难同步等问题,在 VGGSound-Test 等多个 benchmark 上达到开源 SOTA 表现。 来源:小米技术
Read originalCursor Evals 新增成本与输出 Token 图表
我们刚刚向 http://cursor.com/evals 推送了一些改进! 你现在可以看到每个模型的成本、输出 token 和步骤绘制在图表中
Read originalResponses API 网页搜索新增图片结果
你的应用现在可以搜索网页上的图片。 Responses API 中的网页搜索现在除了文本结果外,还支持图片结果,因此你可以构建能展示商品、地点、视觉参考和来源链接以激发灵感的应用。
Read originalClaude Fable 发布:Anthropic 带来的另一种推理体验
Anthropic 发布 Claude Fable,这是一款提供截然不同推理体验的 AI 模型。它擅长规划与生成复杂代码库,在需要精确构建代码结构或理解程序员深层需求的场景中,其表现相比 Claude Sonnet 有了大幅提升。用户描述与它协作更像与一位直觉敏锐的资深工程师合作,其对代码意图的捕捉和方案生成能力令人惊叹,但并非通用型 AI。
Read originalClaude Fable 5 和 Claude Mythos 5
Anthropic 今日推出 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有测试基准上达到 SOTA,Stripe 称其将数月工程压缩至数天,FrontierCode 评分居前沿模型之首,可仅凭截图重建网页应用源码。Mythos 5 在药物设计中实现约 10 倍加速,其分子生物学假说盲测获科学家偏好的概率约 80%。两模型售价均为 $10/百万输入 tokens、$50/百万输出 tokens,较 Claude Mythos Preview 降价过半。Fable 5 在部分敏感主题上回退至 Claude Opus 4.8,安全触发率低于 5% 的会话。Mythos 5 通过 Project Glasswing 向网络安全防御者开放。
Read originalCohere首个编程模型North Mini Code免费开源
North Mini Code 现已在 OpenCode 上免费提供 256K 上下文 · 完全开源 Cohere 的首个编程模型
Read originalApollo 与 Blackstone 联手 350 亿美元 AI 融资交易
Apollo 和 Blackstone 合作开展 350 亿美元 AI 融资交易,可能重塑人工智能基础设施的融资方式。华尔街正为昂贵的 AI 芯片创建新的融资模型,Anthropic 和 Broadcom 参与其中。这笔交易可能标志着一个全新 AI 投资类别的开端。
Read originalWorld Labs与Lore合作打造互动体验
创意和想象力无与伦比!非常感谢@theworldlabs能与@withloreco的优秀人才合作,将他们不可思议的想法转化为用户可以享受的互动体验!🤩
Read originalEx Vivo:多样细胞状态提升AI疗法匹配
在《Nature Methods》上发表的最新研究来自Project Ex Vivo,表明AI模型从多样化的细胞状态中学到的知识,比仅从规模化数据集中学到的更多,这一发现可能重塑疗法与患者的匹配方式。https://msft.it/6013vgE8l
Read originalOpenRouter与Cursor集成指南
想要在Cursor中使用OpenRouter吗? 这里有一份集成指南:https://openrouter.ai/docs/cookbook/coding-agents/cursor-integration
Read originalGitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流
GitHub Copilot CLI 新增自定义 AI 智能体功能,使 CLI 能够理解开发者的技术栈和团队工作流,将一次性终端提示转变为可重复、可审查的流程。
Read original里程碑式德国裁决:Google AI Overviews 被视为谷歌自身言论,需为错误回答承担责任
德国地方法院裁定,Google 对其 AI 概览生成的内容直接承担法律责任,不能援引搜索引擎运营商原有的有限责任保护。涉案 AI 概览错误地将两家出版商与欺诈行为关联,且相关声明未出现在任何链接来源中。该裁决可能为全球 AI 生成内容责任认定树立先例。
Read original塔塔咨询服务将因AI智能体应用放缓招聘,亚洲外包业迎来转折
亚洲最大外包商塔塔咨询服务(Tata Consultancy Services)将减少未来招聘规模,同时加大对AI智能体的使用。这一变化标志着印度劳动密集型外包产业正经历关键性转变。
Read originalGemini 3.5 Live Translate 发布
说 hello, hola, 你好--欢迎 Gemini 3.5 Live Translate:我们最新的音频模型,专为快速跨语言交流而构建。🌐
Read originalClaude Mythos 即将发布,Fable 精简版同日登场
确认,Claude Mythos 将在接下来几小时内揭晓。 【引用 @steph_palazzolo】: 独家:一个名为 Claude Fable 的精简版 Mythos 今天推出。它价格昂贵--是 Opus 的两倍--但或许不像人们从最初 Mythos 定价(Opus 的 5 倍)所想的那样昂贵。 更多内容及 Apple WWDC 见 AI Agenda: https://www.theinformation.com/newsletters/ai-agenda/anthropics-mythos-coming-today-apple-pursues-modest-goals-siri-revamp
Read originalLuma AI Ray3.2:方向进,电影出
方向进入,电影出来。 Ray3.2 来了 → http://lumalabs.ai/ray3-2
Read originalRunway视频轻松转宽高比
轻松将视频重新格式化为不同宽高比,让你在每一个重要平台都能展示。 点击下方链接开始。
Read originalGoogle DeepMind 发布 Gemma 4 12B:统一的无编码器多模态模型
Gemma 4 12B 是 Google DeepMind 最新推出的中等规模多模态模型,采用无编码器统一架构,原生支持音频输入。其基准测试性能接近 26B MoE 模型,但内存占用不到一半,仅需 16GB 显存或统一内存即可在消费级笔记本上本地运行。模型内置多 token 预测(MTP)drafter 以降低延迟,基于 Apache 2.0 开源许可发布,已累计超过 1.5 亿次下载。
Read originalGoogle DeepMind 欧洲机器人加速器启动,15家初创公司入选
Google DeepMind 加速器从欧洲选出15家机器人初创公司,提供为期3个月的密集指导和AI技术整合支持,帮助公司将AI融入核心产品。
Read originalGPT-5.5 替代 OCR,ChinaRxiv 论文免费开放
23,000+ 篇 ChinaRxiv 论文现已免费提供,并带有更完整的英文翻译,源于一位开发者用 GPT-5.5 替换了复杂的 OCR 管道。
Read original全新汽车品牌AIVA发布,火山引擎助力打造AI汽车新体验
由赛力斯、宁德时代等多方产业资本组建的AI出行品牌AIVA正式发布。火山引擎提供豆包大模型、智能座舱等技术服务。概念车AIVA Origin Concept亮相,首款量产车AIVA ME7将于2026年内亮相,全系覆盖20万元以上市场。AIVA提出"AI定义汽车"路径,让汽车成为具身AI生命体。火山引擎副总裁表示,人与汽车的关系将实现交互、智能、感受三方面根本转变。未来双方将围绕AI交互、智能体验、情感陪伴深度共创。
Read originalProduct Hunt:Fluido
Turn any Figma shape into liquid metal in one click
Read originalProduct Hunt:Kimi Work
The AI desktop for knowledge work
Read originalProduct Hunt:Uiverse Design
De-slop your AI generated websites
Read originalProduct Hunt:Cove for Mac
Like a save/load game for your work
Read originalProduct Hunt:Limelight
Make your screen recordings easy to follow
Read originalProduct Hunt:Solarch
Interactive diagrams with AI, and your code always in sync
Read originalProduct Hunt:agmsg
Stop copy-pasting between your AI coding agents
Read originalProduct Hunt:Reve 2.0
Generate and edit 4K images through layout-based control
Read originalProduct Hunt:Krisp Voice Translation API
Real-time speech-to-speech translation API
Read originalProduct Hunt:VC Boom
Score your deck, meet investors who fit, raise more. Boom!
Read originalProduct Hunt:ChocolateBar
Add a row under your menu bar for hidden icons
Read originalProduct Hunt:Whistle
A fitness coach with personalized plans
Read originalProduct Hunt:Nodrix
Your own IoT cloud, deployed to your Cloudflare account
Read originalProduct Hunt:prostir zvuku
A spatial nature sound mixer for Mac
Read originalProduct Hunt:Overly
Search and ask questions inside lecture videos
Read original