# AI及信息技术应用2024年6月30日简报

## 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，通过机器学习和算法实现智能决策、问题解决和学习。

## 核心洞察（TL;DR）
- 钉钉AI搜索集成七大国产大模型，提升企业信息管理效率。
- 硅基智能开源DUIX数字人模型，支持多终端部署。
- OpenAI收购Rockset，增强AI数据处理能力。
- Google DeepMind发布Gemma 2模型，优化不同规模性能。
- OpenAI推出CriticGPT模型，辅助发现AI生成代码错误。
- Notion推出一键建站工具，简化网站创建和管理。
- ChatGPT for macOS上线，加入语音模式。
- 荣耀CEO强调数据隐私对AI的重要性。
- YouTube与唱片公司谈判AI音乐交易。
- 微软发现AI模型安全漏洞。
- 苹果暂停发布AI功能，应对欧盟监管问题。
- OpenAI和Anthropic被指控无视网络抓取规则。

## 关键事实与数据
- 关键事实1: 钉钉AI搜索整合了七大国产大模型，包括通义、MiniMax等。
- 关键事实2: 硅基智能的DUIX数字人模型支持Android和iOS多终端部署。
- 关键事实3: OpenAI收购Rockset，旨在提升数据处理能力。
- 关键事实4: Google DeepMind的Gemma 2模型通过局部-全局注意力机制优化性能。
- 关键事实5: OpenAI的CriticGPT模型帮助发现AI生成代码中的错误。
- 关键事实6: Notion Sites一键建站工具提供超过10,000个模板。
- 关键事实7: ChatGPT for macOS加入语音模式，提升交互体验。
- 关键事实8: 荣耀CEO强调AI操作限于设备内部，确保用户数据安全。
- 关键事实9: YouTube与主要唱片公司谈判AI音乐交易许可。
- 关键事实10: 微软发现AI模型存在安全漏洞，名为“Skeleton Key”。

## 正文
AI及信息技术应用2024年6月30日简报
=====================

在AI产业的最新动态中，钉钉发布的AI搜索功能集成了七大国产大模型，提供了个性化搜索和AI助理协同工作流，显著提升了企业信息管理和工作效率。硅基智能开源的DUIX数字人模型，实现了高实时性数字人交互，支持多终端部署。OpenAI通过收购Rockset强化了AI数据处理能力，推动其在AI领域的领先地位。Google DeepMind发布的Gemma 2模型，通过创新技术优化了不同规模下的性能。同时，OpenAI推出的CriticGPT模型，有效辅助发现AI生成代码中的错误，促进了AI模型的持续改进。

在产品市场创新方面，Notion推出的Notion Sites一键建站工具简化了网站创建和管理流程。而Genspark作为AI生成文章的搜索引擎，提高了搜索效率和内容的可用性。ChatGPT for macOS的上线，特别是语音模式功能的加入，为用户提供了更便捷的交互体验。

合规和监管方面，荣耀CEO强调了数据隐私对AI的重要性，而GenAI的道德问题，包括版权侵犯、劳工剥削和能源消耗，亟需解决。YouTube与唱片公司的AI音乐交易谈判，以及微软发现的AI模型安全漏洞，都突显了AI安全和合规使用的重要性。苹果因欧盟监管问题暂停发布AI功能，而OpenAI和Anthropic被指控无视网络抓取规则，这些事件都指向了AI技术在发展中需要面对的伦理和法律挑战。

**1，AI产业及应用研究**
===============

钉钉发布 AI 搜索，整合国产大模型「七龙珠」

\[摘要\]：在 OpenAI 宣布终止对中国提供 API 服务后，钉钉发布了 7.6 版本，集成了通义、MiniMax、月之暗面、智谱 AI、零一万物、百川智能、猎户星空七大国产大模型。用户可以根据需求切换模型。钉钉 AI 搜索专注解决信息分散问题，具备个性搜索、自然语言输入、内容追溯等功能，并支持 AI 助理多 Agent 协同工作流，提升企业信息管理和工作效率。

硅基智能开源 DUIX 数字人模型

\[摘要\]：硅基智能宣布其 2D 真人级 AIGC 实时渲染数字人模型 DUIX 开源。DUIX 可接入多方大模型、语音识别 (ASR) 和语音合成 (TTS) 功能，实现数字人实时交互。支持在 Android 和 iOS 多终端一键部署，并提供 14 个数字人模板。DUIX 能精准模拟动作、唇形和微表情，适用于 AI 伴侣、直播带货、短视频生成等场景，满足高实时性需求。

OpenAI 收购 Rockset 以增强 AI 数据能力

\[摘要\]：OpenAI 最近收购了 Rockset，以增强其在 AI 数据处理和分析方面的能力。Rockset 专注于实时分析和搜索数据平台，将为 OpenAI 提供更强大的数据处理能力。这一收购旨在提升 OpenAI 的大模型训练和生成能力，进一步推动其在人工智能领域的领先地位。

Notion发布Notion Sites 一键建站工具

\[摘要\]：Notion推出了一款便捷的一键建站工具，名为Notion Sites。用户只需从超过10,000个模板中选择一个，设置域名、主题和外观，点击“发布”即可上线。主要功能包括多种模板、无编码需求、内容管理和AI辅助。高级功能（需付费）包括自定义域名、导航栏、主题选择、自定义图标、个人品牌和Google Analytics集成。这款工具旨在简化网站创建和管理，提升用户体验。

Google DeepMind发布Gemma 2：新一代轻量级开放语言模型

\[摘要\]：Google DeepMind团队推出Gemma 2，该系列轻量级开放语言模型包含20亿至270亿参数规模的模型。通过引入局部-全局注意力机制、分组查询注意力（GQA）及知识蒸馏技术，Gemma 2实现了在不同规模下的性能最优化，展现出与规模更大的模型相媲美的竞争力。报告还强调了模型在安全性、责任性方面的考量，包括训练时的安全性缓解措施和透明评估。预训练使用了高达13万亿的英文数据，采用SentencePiece分词器，支持多语言处理，训练基础设施使用了TPUv4、TPUv5e和TPUv5p，展现了强大的并行计算能力。

OpenAI 推出 CriticGPT 来发现 AI 生成的代码中的错误和缺陷

\[摘要\]：OpenAI 开发了基于 GPT-4 的模型 CriticGPT，用于识别 ChatGPT 输出中的错误。该工具帮助人类训练师在 60% 的情况下更有效地发现代码错误，提供更全面的批评，从而促进强化学习过程。未来的工作将集中在将 CriticGPT 集成到 RLHF 标记管道中，以支持高级 AI 模型的持续改进和调整。

Hebbia 获得近 1 亿美元 B 轮融资，由 Andreessen Horowitz 领投

\[摘要\]：Hebbia，一家使用生成式 AI 搜索文档的初创公司，完成了由 Andreessen Horowitz 领投的近 1 亿美元 B 轮融资，使公司估值达到 7 至 8 亿美元。Hebbia 的 AI 能浏览数十亿份文件，为金融服务机构等提供特定答案。公司成立于 2020 年，由斯坦福大学博士乔治·西夫鲁卡创立，旨在减少金融行业长时间查找文档的信息工作。

Rask AI：一站式本地化工具，具备“文本转语音”和“语音克隆”功能

\[摘要\]：Rask AI 是一个为内容创作者和公司提供的一站式本地化工具。其主要功能包括“文本转语音”和“语音克隆”，可将视频快速高效地翻译成 130 多种语言。该工具旨在简化和加速多语言视频内容的制作过程，使用户能够更广泛地传播他们的内容。

Slack 的 AI 每周为用户节省 97 分钟，但 CEO 担心时间利用问题

\[摘要\]：Slack CEO Denise Dresser 表示，Slack 的 AI 功能每周为用户节省 97 分钟。然而，她担心用户不会有效利用这些时间。随着员工在公司工作时间的增加，他们会被越来越多的 Slack 频道所淹没，难以消除干扰。Denise Dresser 强调，即使是 Fortune 这样的公司也难以避免这种情况，员工们在不同的聊天中讨论各种话题。

百度推出升级版人工智能模型，用户群已达 3 亿

\[摘要\]：中国搜索引擎巨头百度发布了其人工智能模型的最新版本 Ernie 4.0 Turbo，以应对中国竞争激烈的人工智能市场。目前，百度的人工智能用户群已达 3 亿，显示出其强大的市场渗透力和用户接受度。升级后的模型旨在提供更高效和智能的服务，进一步巩固百度在人工智能领域的领先地位。

AI 芯片初创公司 Etched 大力押注 Transformer AI 模型

\[摘要\]：AI 芯片初创公司 Etched 推出了世界上第一款专为 transformer 模型设计的专用集成电路 (ASIC)，称为 Sohu。该芯片以其卓越的性能和效率超越了现有的 GPU，特别是在处理 AI 任务时表现出色。Sohu 的吞吐量和成本效益显著提高，使其能够取代大量传统 GPU，从而降低运行 AI 模型的成本。Etched 还致力于开源软件，提供开发人员定制和优化 transformer 模型的灵活性。

Captions 发布 AI 功能，自动为视频添加效果

\[摘要\]：视频编辑应用 Captions 推出了一项新的 AI 功能，能够自动为未编辑的视频添加图形、缩放、音乐、音效、过渡和动态背景等效果。该功能通过 AI 分析视频内容并添加适当的效果，使视频创作变得更轻松和高效。Captions 首席执行官 Gaurav Misra 表示，这项新功能旨在简化视频创作过程，提高工作效率。

EvalAlign 用于文本到图像的评估

\[摘要\]：EvalAlign 是一种新的评估指标，专为改进文本到图像生成模型的评估而设计。与现有指标相比，EvalAlign 提供更细粒度的准确性和稳定性，专注于图像忠实度和文本-图像对齐，确保生成的图像更符合文本描述，提高模型的评估质量和可靠性。

蚂蚁首个开源 Graph RAG 框架设计解读

\[摘要\]：文章介绍了 Graph RAG 框架，它通过结合信息检索和大模型生成来解决“幻觉”问题。与传统 RAG 依赖向量数据库不同，Graph RAG 使用知识图谱技术，通过图数据库存储知识，以提高上下文质量。文章详细比较了两者的差异，设计了兼容多种知识索引格式的通用 RAG 架构，介绍了相关开源技术，并探讨了未来优化方向。

DCLM-POOL下一代语言模型训练集

\[摘要\]：研究机构免费开放了 DCLM-POOL，一个包含 240 万亿个标记的大型数据集池。DCLM-POOL 由 Common Crawl 提取的语料库和开源软件组成，旨在测试和比较不同的数据管理技术。DCLM 提供标准化训练配方和评估套件，允许研究人员直接比较不同管理技术的有效性。DCLM-BASELINE 是一个全新的公共训练集，经过 2.6 万亿个标记的训练，性能超越了之前的开放数据模型。

Ozone：利用人工智能的视频编辑

\[摘要\]：Ozone 是一款创新的视频编辑工具，利用人工智能功能（如文本转图像和视频）、基于云的无缝编辑解决方案以及实时协作功能来创建和编辑视频。其特点包括自动字幕、自动动画、关键帧等工具，简化了编辑过程，提升了用户的效率和创造力。

Harvard辍学生挑战Nvidia

\[摘要\]：Etched，由哈佛大学辍学生创立，筹集了1.2亿美元开发专为变压器模型设计的AI芯片Sohu，可能挑战Nvidia在AI芯片市场的主导地位。Sohu是一种ASIC（应用专用集成电路），其运行速度和成本比Nvidia下一代Blackwell GB200 GPU快一个数量级。此轮A轮融资由Primary Venture Partners和Positive Sum Ventures领投，知名天使投资人包括Peter Thiel和Kyle Vogt。

Claude 获得新的“项目”升级

\[摘要\]：Anthropic 为 Claude AI 助手推出了“项目”功能，允许用户在单一位置组织文件、聊天和信息，实现个性化对话。用户可在共享的200K上下文窗口中管理文档和代码，并通过活动源与队友协作。每个项目支持自定义指令，快速定制AI响应。新功能增强了Claude的定制和协作能力，使其在企业AI工具领域更具竞争力。

Luna即时、准确、低成本的人工智能评估

\[摘要\]：Galileo 推出了 Luna，一个专为 GenAI 评估设计的基础模型系列。Luna 提供实时幻觉检测、数据隐私保护等功能，与 GPT-3.5 相比，Luna 的准确率提高 18%，速度提高 11 倍，成本降低 97%。Luna 无需地面实况数据，节省时间和资源，并允许轻松微调以满足特定需求，使其成为财富 500 强公司青睐的选择。

Florence-2: 微软新一代视觉基础模型

\[摘要\]：微软推出 Florence-2，这是一款适用于各种视觉和视觉语言任务的多功能基础模型。Florence-2 在字幕生成、对象检测、分割和 OCR 方面表现出色。其 FLD-5B 数据集包含 54 亿条注释，显著提升了模型在不同视觉任务中的泛化能力。采用基于提示的学习方法，使其在处理任务时更高效、更灵活。

Synthesia 2.0：革新企业视频制作的 AI 平台

\[摘要\]：Synthesia 2.0 是全球首个 AI 视频通信平台，旨在简化并提升企业视频制作和分发。其功能包括创建富有表现力和自定义的 AI 头像、品牌整合、批量视频创建、屏幕录像即时编辑和个性化视频播放器。平台还通过 ISO/IEC 42001 认证，确保道德和负责任的 AI 开发与使用。

OpenAI 与 Color Health 合作开发个性化癌症护理 AI 助手

\[摘要\]：OpenAI 与 Color Health 合作开发了一款基于 GPT-4o 模型的人工智能助手，用于个性化癌症护理。该助手通过分析患者数据制定定制的癌症筛查和预处理计划，帮助医生减少治疗延迟并简化初级保健医生获得专业癌症知识的过程。试验显示，这款助手显著加快了病人记录的分析速度，同时医生仍对最终治疗计划拥有完全控制权。

**2，产品市场创新**
============

Genspark：AI 生成文章的搜索引擎

\[摘要\]：Genspark 是一个 AI 智能体引擎，可以基于用户的查询实时生成自定义页面，称为 Sparkpages。这些页面动态生成，将网络知识精炼整合为一个完整的页面。此功能使用户能够快速获取所需信息，提高搜索效率和内容的可用性。

ChatGPT for macOS 正式上线，开放语音模式

\[摘要\]：OpenAI 推出了 ChatGPT for macOS，现已向所有用户开放。该应用程序包括语音模式功能，使用户能够在桌面上与 AI 助手进行类似人类的对话，提供更便捷的交互体验。

谷歌利用 AI 增加 110 种新语言

\[摘要\]：谷歌通过引入 AI 技术，向其 Google Translate 服务添加了 110 种新语言。这一扩展旨在改善全球沟通和可访问性，使用户能够更轻松地翻译各种语言内容。此更新凸显了谷歌利用 AI 实现实用、以用户为中心的应用的承诺。

Google 通过 Gemini AI 集成增强 Gmail 和 Workspace

\[摘要\]：谷歌推出了 Gemini AI 侧面板，以增强其 Workspace 套件中的电子邮件和文档功能。该集成旨在简化撰写和总结电子邮件以及在 Docs、Sheets、Slides 和 Drive 中创建和管理内容等任务，提升用户工作效率和生产力。拥有 Gemini 附加组件的 Google Workspace 客户或 Google One AI Premium 订阅者可以使用这些功能，通过 AI 驱动的工具优化工作流管理。

Shopify 为商家推出 AI“Sidekick”聊天机器人

\[摘要\]：Shopify 推出了 AI 聊天机器人 Sidekick，现已面向北美英语商家开放抢先体验。Sidekick 简化了创建折扣代码、生成报告和推荐博客文章等任务。此工具还提供 AI 生成的客户聊天回复和扩展的图像生成功能，以提升商家的运营效率。未来，Shopify 计划将 Sidekick 推广至其他语言和地区，进一步扩大其 AI 工具的可用性。

**3，合规和监管**
===========

荣耀 CEO 强调数据隐私对 AI 的重要性

\[摘要\]：荣耀手机公司 CEO 赵明在接受 CNBC 采访时表示，若没有数据隐私保护，人工智能的变革力量将毫无价值。他强调荣耀的 AI 操作限于设备内部，以确保用户数据安全。荣耀近期推出了防止视频深度伪造和减少长时间屏幕使用导致近视的 AI 工具。赵明认为，未来智能手机的发展应使个体更强大，并在能耗和数据隐私之间取得平衡。

GenAI 道德问题：亟需解决的三个关键点

\[摘要\]：生成式 AI 存在严重的道德问题，需要立即解决。首先，它依赖未经许可使用的版权数据进行训练，侵犯了创作者的权益。其次，AI 模型的开发和维护涉及剥削性劳工。第三，AI 训练和运行对能源需求。

YouTube 正在与唱片公司谈判 AI 音乐交易

\[摘要\]：YouTube 正在与环球音乐、索尼音乐娱乐和华纳唱片等主要唱片公司进行谈判，以获得歌曲许可用于其 AI 音乐工具的训练。计划在今年晚些时候推出这些 AI 功能，并通过一次性付款方式获取许可。这种策略旨在确保合法使用音乐，避免版权侵权诉讼问题。

微软发现主要 AI 模型的安全漏洞

\[摘要\]：微软发现了一种名为“Skeleton Key”的新越狱方法，可以绕过 ChatGPT、Google Gemini 等主要 AI 聊天机器人的安全限制，使其能够从事被禁止的活动。此方法通过诱使聊天机器人在回答违反安全措施的查询之前发出警告来实现。微软在 4 月和 5 月成功测试了 Skeleton Key，揭示了 AI 安全措施的重大弱点，凸显了对更强大安全措施的需求，以保护用户并维持 AI 工具的可信性。

苹果因欧盟监管问题暂停发布 AI 功能

\[摘要\]：苹果公司确认，由于欧盟《数字市场法案》的监管合规问题，其即将推出的 AI 智能功能不会在欧盟发布。欧盟监管机构将就与 App Store 相关的问题对苹果提出指控，可能处以最高10%全球收入的罚款。因此，苹果决定不在欧盟推出这些 AI 功能，以避免相关风险。'

出版商对 Perplexity Bots 绕过屏蔽的行为越来越不满

\[摘要\]：人工智能搜索初创公司 Perplexity 正面临出版商的强烈反对，如《纽约时报》和《卫报》。这些出版商指控 Perplexity 绕过其屏蔽访问和重新利用内容，可能导致数十亿美元的广告收入损失。Perplexity 计划今年推出广告和订阅服务，估值达 10 亿美元。出版商要求 Perplexity 获得使用其内容的商业许可并补偿广告收入损失。预计出版业因这种做法将损失超过 100 亿美元。

OpenAI 和 Anthropic 被指控无视网络抓取规则

\[摘要\]：据报道，OpenAI 和 Anthropic 无视媒体出版商要求，继续从其网络内容中获取免费的模型训练数据，绕过了 robots.txt 规则。初创公司 TollBit 发现了这些公司的违规行为，引发了人工智能和出版行业的争议。这一问题突显了使用受版权保护的网络内容进行人工智能训练的道德和法律挑战，美国版权局预计将在今年晚些时候更新有关人工智能和版权的指导，可能会解决这些问题。

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20240630-ai2024630](https://haxitag.com/brief/ai-brief-20240630-ai2024630)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
