人工智能世界的亮点综述:OpenAI 改变了 Atlas 浏览器的工作方式,Reddit 起诉 Perplexity 数据搜刮,Anthropic 在浏览器中推出克劳德代码,Meta 推出人工智能代理安全中心。.
OpenAI 推出 ChatGPT Atlas 浏览器
引入 OpenAI 聊天 GPT 图集, 是一款直接集成了 ChatGPT 和代理模式的新型网络浏览器。人工智能可以理解页面内容,记忆跨会话的上下文,并在用户不离开当前页面的情况下执行任务。该浏览器包括一个可选的 „浏览器记忆 “功能,允许 ChatGPT 回顾以前访问过的页面的详细信息,以提供更个性化的帮助;不过,用户可以控制保存或删除哪些信息。Atlas 还为付费用户提供代理模式预览,允许 ChatGPT 直接在浏览器中自主进行网络研究、填写购物车或编译文档。Atlas 反映了 OpenAI 向能处理常规计算任务的基于代理的人工智能系统迈进的努力,不过该公司也承认存在风险,包括漏洞和恶意指令漏洞。ChatGPT Atlas 现在可在 macOS 上供免费、Plus、Pro 和 Go 用户使用;Windows、iOS 和 Android 版本即将推出。.
DeepSeek 试点文本压缩 OCR 模型
DeepSeek 发布了 DeepSeek-OCR, 这是一种可视化语言模型,能将文本文档转换为紧凑的可视化表述,所使用的标记比原始文本少得多。该模型实现了 97% 精确度 当以 10:1 的比例压缩文本时,并保持 60% 精确度 DeepSeek-OCR通过将文本渲染为图像并编码为可视化标记,然后语言模型再将其解码为文本,即使压缩率为20:1也不在话下。在 OmniDocBench 基准测试中,DeepSeek-OCR 的表现优于使用更少标记的同类模型,仅为 每页 100 个代币 相比,GOT-OCR2.0 压缩了 256 个词组,MinerU2.0 压缩了 6000 多个词组,而 GOT-OCR2.0 压缩了不到 800 个词组。这种压缩技术可以更高效地处理大型语言模型中的长语境。代码和模型权重可在 GitHub 上公开获取。.
克劳德代码》推出带有并行代理的网络版
Anthropic 发布了网络版 克劳德代码, 它允许开发人员直接通过浏览器在不同的 GitHub 仓库中同时运行多个编码作业。该服务在 Anthropic 管理的云基础设施上运行,每个作业都运行在 在隔离的沙盒环境中, 与命令行和集成开发环境版本一样,开发人员可以使用 Claude Code 网页界面进行错误修复、日常任务、测试、后台更改、拉取请求和文档编写。这种基于云的方法表明,人工智能代理正在向在托管环境中独立处理开发人员工作的方向转变。Claude Code for Web 现已向 Claude Pro 和 Max 用户提供预览版。.
Reddit 起诉 Perplexity AI 和其他公司窃取数据
Reddit 对以下公司提起诉讼 复杂性人工智能 和其他三家公司(Oxylabs、AWMProxy 和 SerpApi)提起诉讼,指控他们非法下载数百万条用户评论用于商业用途。这起向纽约联邦法院提起的诉讼指控这些公司规避了 Reddit 的反抓取措施,并在直接访问受阻的情况下从谷歌搜索结果中提取内容。Reddit使用了一种新颖的技术:它创建了一个只能被谷歌搜索引擎抓取的测试帖子,然后,当该帖子的数据在数小时内出现在Perplexity上后,将其作为证据。这起诉讼凸显了人工智能公司在如何获取训练数据方面日益紧张的关系。Perplexity 和其他被告公司否认了这些指控,并表示将在诉讼中为自己辩护。.
Meta 和 Hugging Face 推出人工智能代理环境中心
开放环境枢纽 是一个新的社区平台,开发人员可以在这里创建、共享和发现人工智能代理的标准化环境。人工智能代理环境定义了代理在安全的沙盒环境中执行特定任务所需的工具、应用程序接口、登录和执行上下文,适用于培训和部署。该中心即将推出可供开发人员测试的初始环境,OpenEnv 0.1 规范也已发布,供社区反馈。这一举措解决了人工智能代理开发中的一个关键难题:大型语言模型需要访问适当的工具,但直接公开数百万个工具既不安全也不实用。Meta 正在将 OpenEnv 与其 TorchForge RL 库集成,并致力于扩展与 verl、TRL 和 SkyRL 等开源项目的兼容性。.
GigaBrain-0 使用合成数据训练机器人
研究人员介绍了 千兆大脑-0, 是一个视觉语言行动模型,它使用由以下设备生成的合成数据来训练机器人 世界模型, 该系统通过改变物体的外观、位置、照明条件和摄像机角度来生成训练场景,从而获得比大多数机器人从现实世界观察中获得的更多样化的训练数据。„体现的思维链“监督将复杂任务划分为多个中间步骤。对操作、长任务和移动操作的测试表明,GigaBrain-0 的性能比基准模型 π0 高出 10%-30 . .团队还发布了 GigaBrain-0-Small, 的轻量级版本,该版本在边缘设备上的运行速度提高了 10 倍,同时保持了相当的性能。.
批次 - DeepLearning.AI 作者:Andrew Ng / gnews.cz - GH