AI及信息技术应用2024年6月2日简报

上周的一系列动态展现了该领域的迅速发展与广泛应用。OpenAI成立安全与安保委员会，以增强项目安全，体现了对AI伦理和安全的高度重视。腾讯推出的ReVideo项目，通过先进的运动轨迹和内容控制技术，提升了长视频编辑的创新能力。a16z的语音Agents报告揭示了B2B和B2C场景中的巨大潜力，强调了实时语音交互的独特价值。

普华永道与OpenAI的合作进一步推进了生成式AI在企业中的应用，体现了AI技术对商业运营的深远影响。腾讯的AI应用「元宝」展示了多功能集成的强大潜力，突显其在AI应用领域的领导地位。Jina AI推出的多模态嵌入模型JINA CLIP，表现出卓越的文本和图像检索能力，为多模态AI应用提供了新可能。

Google的Gemini 1.5版本和OpenAI的ChatGPT Edu版本，分别在开发工具和教育应用方面实现了显著突破，推动了AI技术的广泛应用。综上所述，这些创新与应用不仅展示了AI技术的巨大潜力，也预示了未来发展的广阔前景。

1，AI产业及应用研究

腾讯推出 ReVideo 项目，优化长视频编辑

[摘要]：腾讯推出 ReVideo 项目，通过运动轨迹和内容控制实现视频编辑。团队与 Open-Sora Plan 合作，使用 Sora 框架替代 SVD，提升长视频编辑适用性。ReVideo 可在保持运动不变的情况下局部改变视频内容，保持内容不变并定制新的运动轨迹，或同时修改内容和运动轨迹。代码预计于6月份发布。

a16z 发布语音 Agents 报告：B2B 和 B2C 领域的潜在机会

[摘要]：a16z 发布了关于语音 Agents 的报告，讨论了构建语音 Agents 的方式及其在 B2B 和 B2C 场景中的机会。在 B2C 领域，报告强调了产品应基于实时语音的独特价值，而不是单纯复刻人类对话。在 B2B 领域，报告指出语音 Agents 可基于 LLM，并容忍部分人工介入，适用于处理垂直特定的对话。企业可从大型公司开始，逐步扩展到中小企业。

普华永道成为 OpenAI 最大企业客户

[摘要]：普华永道（PwC）将成为 OpenAI 最大的企业客户和首个转售商，将 ChatGPT Enterprise 推广至其美国和英国员工。此次合作是普华永道投资 10 亿美元于生成式 AI 技术计划的一部分，旨在通过定制 GPT 帮助员工完成税务审查和报告生成等任务。OpenAI 正在拓展企业客户，提升其 AI 服务的市场应用。

腾讯发布 AI 应用「元宝」

[摘要]：腾讯发布了基于混元大模型的 AI 应用「元宝」，集成 AI 搜索、AI 总结、AI 写作等功能。元宝不仅提供 AI 助手的标准功能，还利用腾讯新闻和微信公众号平台的资源，增强了内容的及时性和丰富度。此外，元宝还具备生成内容、翻译、多模态生成等多种能力，显示出腾讯在 AI 应用领域的强大技术实力和生态优势。

JINA CLIP: 多模态嵌入模型的卓越表现

[摘要]：Jina AI 推出 jina-clip-v1 多模态嵌入模型，兼具传统文本嵌入模型与 CLIP 类模型的优点，在文本到文本和文本到图像检索上表现出色。模型通过三个阶段的训练策略提升性能：使用 LAION-400M 数据集进行图文对齐训练，采用 ShareGPT4V 数据集增强长文本处理能力，并引入硬负样本的三元组文本数据进行精细化训练。此创新训练流程有效提升了模型在长文本和多模态信息检索任务中的性能，展示了广泛的应用潜力。

Google 开发者的好消息：Gemini 1.5 版本发布

[摘要]：Google 宣布 Gemini 1.5 Flash 和 Gemini 1.5 Pro 现已全面推出。Gemini 1.5 Flash 现支持 1,000 RPM 限制，并引入了调优功能。此外，API 现已支持 JSON Schema 模式，AI Studio 移动版支持和浅色模式也已上线，为开发者提供更强大和便捷的开发工具。

OpenAI 推出 ChatGPT Edu 版本

[摘要]：OpenAI 推出专为大学校园设计的 ChatGPT Edu 版本，支持 GPT-4o、网络搜索、自定义 GPT、数据分析、代码生成等功能。牛津、剑桥、伯明翰等 24 所大学，以及沃顿商学院和亚利桑那州立大学已开始使用该生成式 AI 产品。ChatGPT Edu 提供多模态推理、增强的数据分析和搜索功能、自定义 GPT、提升的语音质量及多语言支持，还具备强大的安全机制，包括数据隐私、组权限和管理控制。

OpenAI 推出 ChatGPT Enterprise 版本

[摘要]：OpenAI 推出 ChatGPT Enterprise 版本，为企业提供增强的 AI 服务。该版本支持 GPT-4o 模型、网络搜索、自定义 GPT、数据分析和代码生成等功能，旨在提高企业工作效率。ChatGPT Enterprise 提供更高的消息限制和增强的语音功能，支持 50 多种语言，并具备数据隐私和管理控制等安全机制，包括组权限、SSO 和 SCIM。

Mistral AI 推出首个代码生成模型 Codestral

[摘要]：法国人工智能初创公司 Mistral AI 宣布了其首个代码生成模型 Codestral。该模型接受了 80 多种编程语言的训练，包括 Python、C、C++、JavaScript 和 Bash 等。Codestral 能自动完成代码函数、编写测试，并使用填补中间的机制完成部分代码，减少错误和漏洞。该模型拥有 32k 的上下文窗口，在 HumanEval、MBPP、CruxEval、RepoBench 和 Spider 等基准上表现出色，提供 API 端点、插件和开发环境集成。

Anthropic 发布“工具使用”功能，为其 AI 模型 Claude 带来实时性和准确度
[摘要]：Anthropic 宣布了其最新功能的正式推出，称为“工具使用”。这一更新赋予了其 AI 模型 Claude 与外部工具和 API 进行交互的能力，使它们能够执行任务、操作数据并提供更动态、更准确的响应。通过这种集成能力，Claude 可以实时获取最新信息，并根据需要做出相应调整，从而为用户带来更个性化和有效的体验。

MAP-Neo 开源双语 LLM 套件跻身领先水平，全面透明化弥补闭源模型缺陷
[摘要]：一组来自多个机构的研究人员发布了 MAP-Neo，这是一个功能强大且完全开源的双语语言模型套件。该模型拥有 70 亿个参数并经过高质量标记的庞大数据集（4.5 万亿个）训练，性能与领先的闭源 LLM 不相上下。MAP-Neo 在各项基准测试中表现出色，如中文和英文理解、数学能力和编码，并为开源模型的透明度和可重复性树立了新标准。这一突破性进展有助于推动 AI 研究和应用领域的进步，特别是在非英语地区的研究界。

Gamma 创始人 Grant Lee 谈如何轻松制作幻灯片

[摘要]：Gamma 创始人 Grant Lee 在接受《Fast Company》采访时，讨论了他们如何在后 PowerPoint 时代脱颖而出。Gamma 利用 AI 技术将文本或文档快速转化为幻灯片，吸引了 1700 万用户，并在 AI 应用中排名第 16 位。Gamma 刚刚完成由 Accel 领投的 1200 万美元融资，以推动进一步增长。Gamma 支持垂直和水平布局，并集成了互动元素，目标是改变传统的演示工具市场。

2，产品市场创新

OpenAI 推出 GPT-4o 和更多免费工具

[摘要]：OpenAI 发布了其最新旗舰模型 GPT-4o，并为 ChatGPT 免费用户提供更多功能。GPT-4o 提供类似 GPT-4 的智能，但速度更快，并改进了文本、语音和视觉功能。免费用户现在可以体验更智能的响应、分析数据、上传文件、处理照片等功能。OpenAI 还推出了新的 ChatGPT macOS 桌面应用，未来将支持实时语音和视频对话。

Perplexity AI 推出 Perplexity Pages 功能

[摘要]：Perplexity AI 推出 Perplexity Pages 功能，现已向专业版用户开放，很快将向所有用户提供。Perplexity Pages 可将搜索内容转化为视觉美观且全面的文章或报告，支持根据不同读者调整文章的措辞和结构，并能增加、删除或重新排列内容。此外，该功能还能自动生成配图，并生成可分享的链接，任何人都可以查看和互动。

微软推出 Copilot for Telegram 测试版

[摘要]：微软发布了 Copilot for Telegram 测试版，用户可以像在消息应用程序上进行常规对话一样与 Copilot for Telegram 聊天。这一功能将增强用户在 Telegram 上的互动体验，通过 AI 助手提供即时帮助和支持。

Canva 推出 Canva Enterprise，面向企业市场发起进攻

[摘要]：Canva 宣布了一系列新更新，包括推出全新产品 Canva Enterprise。该平台提供各种可视化和生产力工具，如文档、演示文稿和数据可视化等，以满足企业的需求。为了进入企业市场，Canva 将把重点放在 Google Workspace 和 Microsoft Office 上，这是它传统用户群体之外的一个新领域。此次更新旨在扩大 Canva 的影响力，并吸引更多企业客户加入其平台。

You.com 推出自定义助手，让用户使用高级语言模型创建个性化 AI 机器人
[摘要]：You.com 近期推出了一项新功能，允许用户通过自定义选择来构建他们自己的个性化 AI 助手。这个平台提供了多种高级语言模型（LLM），如 GPT-4o 和 Claude 3，用于创建更准确、相关且详细的回答。这项功能可以满足不同用户的偏好和需求，让他们根据自己的喜好定制 AI 助手。

3，合规和监管

TikTok 为美国用户开发独立推荐算法版本

[摘要]：TikTok 正在为美国用户开发一个独立的推荐算法版本，这一“克隆算法”可能为 TikTok 按照美国新出台的“剥离或禁令”法出售其美国资产铺平道路。这项举措旨在应对美国政府对 TikTok 数据隐私和国家安全的担忧，确保其在美业务的合规性。

社交媒体爆谷歌人工智能回答疑问引发争议，谷歌努力手动删除错误答案
[摘要]：社交媒体平台上充斥着关于谷歌新的 AI 概览产品提供奇怪回答的例子，包括建议用户在披萨上涂胶水和吃石头等不合理的建议。面对这些争议，谷歌正努力手动删除搜索中出现的错误或不当答案。该公司希望通过改进其 AI 系统来提供更准确、有用和安全的回答。

OpenAI 为非营利组织提供企业 ChatGPT 产品折扣

[摘要]：微软支持的 OpenAI 周四宣布，将为非营利组织提供企业 ChatGPT 订阅折扣。这一举措旨在扩大其人工智能产品在企业中的销售，帮助更多非营利组织利用先进的 AI 技术提升运营效率和服务能力。

Meta 揭露社交平台上的人工智能欺骗行为

[摘要]：Meta 近期揭露了一项秘密行动，发现假冒犹太学生和非裔美国人的虚假账户，这些账户在加沙冲突期间宣扬亲以色列情绪。生成式人工智能技术在传播欺骗性内容方面的应用引发担忧，可能影响公众舆论和选举。尽管这些虚假账户手段多样，Meta 的安全专家依然坚决阻止此类操纵计划。

OpenAI 组建安全委员会并开始训练新 AI 模型

[摘要]：OpenAI 成立了一个安全与安保委员会，负责监督项目的安全和安保决策。该委员会由Bret Taylor担任主席，成员包括Adam D’Angelo、Nicole Seligman和Sam Altman。委员会将在90天内提供建议，成员包括OpenAI的技术和政策专家，并将咨询外部专家以增强OpenAI的安全和安保协议。经董事会审核后，建议结果将公开分享。

谷歌研究人员：2023 年人工智能生成的虚假信息激增

[摘要]：谷歌研究人员发表的一项研究显示，2023 年，人工智能生成的基于图像的虚假信息显著增加。这项为期两年的研究分析了 Snopes 和 Politifact 等事实核查网站上的 135,838 份事实核查，发现人工智能系统的普及导致了虚假信息的激增。由于事实核查的限制，实际情况可能比研究发现的更为严重。

OpenAI ChatGPT 遭遇欧盟数据保护大戏

[摘要]：欧盟数据保护工作组对 OpenAI 的 ChatGPT 展开激烈竞争，强调其在 GDPR 法规下的法律问题和潜在风险。监管机构质疑 ChatGPT 对个人数据的收集和处理，导
致多个欧盟国家展开调查。报告指出人工智能数据处理需具备透明性、公平性和适当的保障，并提出了数字时代隐私权和合规性的重要问题。