# AI及信息技术应用2023年12月17日简报

## 核心定义
> 人工智能（AI）是一种模拟人类智能行为的计算机系统，能够执行学习、推理、感知、理解和解决问题等任务。

## 核心洞察（TL;DR）
- Mistral AI发布开源MoE模型，Deepgram推出实时语音AI代理，理想汽车发布多模态大模型Mind GPT。
- 苹果、Google、Meta等大企业积极整合AI技术，提升用户体验。
- Dropbox和OpenAI的隐私争议、OpenAI的AI安全研究，以及孟加拉国选举中AI干预引发监管关注。

## 关键事实与数据
- Mistral AI的MoE模型由8个7B参数的专家组成，规模较GPT-4小但保持相同上下文限制。
- Deepgram Aura的实时语音AI代理延迟不到200毫秒，适用于电话客服、智能家居等场景。
- 理想汽车Mind GPT荣获C-EVAL和CMMLU评测榜单双冠军，覆盖111个领域，拥有1000种以上专属能力。
- Glean计划筹集至少2亿美元资金，预计前期估值达到20亿美元。
- 微软利用AI优化核电审批流程，可能减少高达90%的审批工时。
- Google DeepMind使用大型语言模型解决纯数学领域未解决问题。
- 苹果iOS 17.2更新推出AI功能的新日记应用程序Journal。
- Google Workspace个人版订阅者可使用电子签名功能。
- Meta对Facebook、Instagram等应用进行AI升级，推出AI图像隐形水印等新功能。
- Dropbox和OpenAI的隐私争议引发信任危机，需提高数据使用透明度。
- OpenAI发布AI安全研究，提出7个关键实践。
- 孟加拉国选举中AI生成虚假信息问题引发关注。
- Microsoft和AFL-CIO合作促进员工过渡到AI增强的未来。
- LinkedIn发布报告阐述AI对未来工作的潜在影响。

## 正文
AI及信息技术应用2023年12月17日简报
======================

上周AI领域呈现显著发展，包括Mistral AI发布的开源MoE模型，Deepgram Aura推出的实时语音AI代理，以及理想汽车的多模态大模型Mind GPT。苹果公司、Google Workspace、Meta等大企业在产品应用上积极整合AI技术，提升用户体验。与此同时，Dropbox和OpenAI的隐私争议、OpenAI的AI安全研究，以及孟加拉国选举中AI干预的问题引发监管和合规方面的关注。这些发展不仅推动了技术进步，也对社会和经济产生深远影响。  

**1，AI产研应用**

Mistral AI推出首个开源MoE模型：GPT-4简化版

\[摘要\]Mistral AI近期发布了首个开源的MoE（专家混合体）模型，被视为GPT-4的简化版。这个模型由8个7B参数的专家组成，以87 GB的种子文件形式发布，但没有正式的新闻稿发布且对细节保持沉默。MoE技术通过将复杂任务分解为更小的子任务，每个子任务由专门的小型模型或“专家”处理，从而提高大型语言模型的效率和准确性。Mistral的MoE模型在每个标记的推断中只使用2个专家，总共拥有8个专家。与GPT-4相比，Mistral 8x7B模型在架构上非常相似，但规模更小：总共8个专家而不是16个，每个专家7B参数而不是166B，总共42B参数而GPT-4为1.8T。尽管规模减小，但Mistral的模型保持了与GPT-4相同的32K上下文限制。

Deepgram Aura：开创实时对话式语音 AI 代理的新时代

\[摘要\]Deepgram Aura是一款实时对话式语音 AI 代理，通过超快速文本转语音API，实现不到200毫秒的延迟。该代理不仅能模仿人类语音，还可以根据对话内容调整语调和情感，提供人类般的声音。适用于多种场景，包括电话客服系统、智能家居和语音驱动应用。Aura通过自然的方式进行对话，包括及时回应、自然语音填充词，并计划在TTS能力中加入笑声和其他语音细节。目前，Deepgram的Aura TTS API处于等待名单阶段，有兴趣的用户可注册以首次体验这一新技术，而正式发布则预计不久后即将实现。

理想汽车发布全自研多模态大模型Mind GPT，荣获双冠军

\[摘要\]理想汽车最新发布的全自研产品Mind GPT是一款多模态认知大模型，旨在与汽车完美融合，为家庭成员提供卓越的AI体验。Mind GPT采用独特的TaskFormer神经网络架构，专门针对用车、娱乐、出行等场景进行训练，拥有理解、生成、知识记忆及推理的能力。在国内权威的中文大语言模型评测榜单C-EVAL和CMMLU中，Mind GPT分别荣获第一名，展现了其在行业中的领先水平。该模型覆盖111个领域，具有1000种以上的专属能力，并持续进化与成长。

Mistral 8x7B 新的MOE开源模型

\[摘要\]与GPT-4相比，Mistral 8x7B具有类似的架构，但在规模上有所缩减：- 专家数量为8个，而不是16个- 每个专家拥有70亿参数，而不是1660亿- 总计420亿参数，而不是1.8万亿- 与原始GPT-4相同的32K上下文窗口此前曾曝出，GPT-4很可能是由8个或者是16个MoE构成目前，已经有不少开源模型平台上线了Mistral 8×7B，感兴趣的读者可以亲自试一试它的性能。开源奇迹再一次上演：Mistral AI发布了首个开源MoE大模型。Mistral AI背后开源理念的起源，离不开核心创始人，创办这家公司的初心

阿里DreaMoving：能够生成目标身份在任何地方跳舞的视频

\[摘要\]DreaMoving是一种创新的人类舞蹈视频生成技术，能够根据用户指定的任何人物和背景生成跳舞视频。用户可以通过文本提示、参考图像、姿势序列和衣物图像等多种方式来输入和控制视频内容。该技术基于Stable-Diffusion模型构建，包括去噪U-Net、视频控制网和内容引导器。通过集成运动块，DreaMoving提高了视频的时间一致性和运动保真度。内容引导器用于控制视频的人物外观和背景，模型训练包括内容引导器训练、长帧预训练、视频控制网训练和表情微调。

Glean靠近20亿美元估值：前谷歌搜索工程师创办的初创公司引投资者关注

\[摘要\]Glean, 由前谷歌搜索工程师创办，是一家利用OpenAI的大型语言模型帮助员工检索公司内部数据的初创公司。据了解，Glean正在与投资者谈判，计划筹集至少2亿美元资金，预计前期估值达到20亿美元。Kleiner Perkins，一家在Glean之前三轮融资中均有投资的公司，正在讨论共同领投这一最新一轮融资。这轮融资将使Glean的估值较2022年5月翻倍，这一交易反映了投资者对于产生收入的初创公司，尤其是面向企业客户的公司的持续兴趣。

马斯克为 xAI 筹集了 1.35 亿美元（尚待 8.65 亿美元）

\[摘要\]马斯克一直在为他的最新企业 xAI 筹集资金，该公司的目标是通过成为“一切应用程序”来与 OpenAI 的 ChatGPT 竞争，处理社交、购物、支付等，类似于中国的微信。根据美国 SEC 的文件，xAI 已正式从其 10 亿美元目标中筹集了 1.35 亿美元，这将使他们有强大的力量与 OpenAI、Anthropic 和 Google 等公司竞争。此外，GrokAI 现已在 X 到 Premium+ 订阅者上推出，让我们深入了解 xAI 全面推出后的预期。

OctoAI 宣布推出 Text Gen 解决方案，以行业领先的价格和性能提供超快的 Llama 2、Code Llama 和 Mistral 型号

\[摘要\]OctoAI发布了Text Gen解决方案，简化了从应用程序中访问开源LLM的过程。这个解决方案支持多种模型如Llama 2 Chat、Code Llama Instruct、Mistral Instruct，并提供不同的模型大小，包括7B、13B、34B和70B，全部由OctoAI的先进计算基础设施支持。Text Gen解决方案提供行业领先的令牌价格和速度，并在准确性方面与闭源LLM相竞争。用户可享受OSS LLM的最佳价格和最低延迟，并可靠地扩展应用程序。OctoAI还支持LangChain应用程序集成、参数量化选择、环境中的API端点使用。

微软采用生成式AI优化核电审批流程，瞄准小型模块化反应堆为AI和数据中心供电

\[摘要\]微软正利用基于OpenAI技术的生成式人工智能处理美国核监管和许可文件，以简化核电项目的审批流程，可能减少高达90%的审批工时。此举旨在满足其超级计算和AI日益增长的电力需求，同时应对核电在全球电力市场份额下降的挑战。微软正在探索小型模块化反应堆（SMR），并积极招聘核能专家以整合SMR到电力规划中，作为其为数据中心寻求新能源供电方法的一部分。

Google DeepMind 使用大型语言模型来解决一个无法解决的数学问题

\[摘要\]Google DeepMind 利用大型语言模型在纯数学领域解决了一个著名的未解决问题，这一成就在《自然》杂志上发表。这是首次使用大型语言模型解决长期存在的科学难题，创造了以前不存在的可验证且有价值的新信息。DeepMind 的新工具 FunSearch 能够产生解决方案，而结合了一个名为 Codey 的大型语言模型和其他系统，通过循环试验最终找到解决方案。它成功解决了涉及集合上限问题的数学难题，此问题涉及计算在三点不形成直线的条件下，能在方格纸上绘制的点的最大数量。

**2，产品应用创新**

苹果公司推出带有 AI 功能的新日记应用程序 Journal：iPhone 的最新更新

\[摘要\]Apple iOS 17.2 是 iPhone 的最新更新，推出了具有 AI 功能的 Apple 新日记应用程序。该日记/日记应用程序使用设备上的机器学习，根据用户的位置、播客、音乐、锻炼等向用户提供个性化的建议和提示。苹果公司表示，iPhone 核心应用程序Journal允许用户“通过写日记来反思和表达感激之情”。用户可以使用文本、语音笔记、照片或视频创建日记条目。Journal 应用程序利用 iPhone 的数据，包括位置、照片和锻炼情况，利用人工智能创建个性化的写作建议。

电子签名现已面向 Google Workspace 个人版订阅者正式推出

\[摘要\]Google Workspace 个人版订阅者\\符合测试条件的 Google Workspace 商务标准版、商务 Plus 版、企业入门版、企业标准版、企业 Plus 版、企业基本功能版、企业基本功能增强版、教育 Plus 版和公益版客户,可以使用适用于文档和云端硬盘的电子签名，所有已完成的合同将自动包含审计跟踪报告，能够向多个用户请求签名，能够向非 Gmail 用户请求电子签名，对存储在云端硬盘中的 PDF 文件启动电子签名的功能。

MakerSuite 现更名为 Google AI Studio

\[摘要\]Google AI Studio最近推出了Gemini API，这是一项新功能，允许用户创建同时包含文本和图像输入的提示。这一变化带来了几项重要更新：首先，用户需要接受Google AI Studio中的新服务条款。其次，系统中保存的提示将默认采用Gemini模型，虽然用户仍可选择启用旧版的PaLM模型。第三，Gemini模型的调校功能即将推出，用户可以在设置中调整PaLM模型。最后，为了帮助用户从PaLM API平滑过渡到Gemini API，Google AI Studio提供了一个新的文档网站上的迁移指南。

Meta 引领人工智能革新：全面升级 Facebook、Instagram、Messenger 和 WhatsApp 功能

\[摘要\]Meta正对旗下Facebook、Instagram、Messenger和WhatsApp进行人工智能升级。新特性包括：改进虚拟助手、AI集成增强社交互动、群聊中的共同创作功能、“重新想象”以及专为创作者设计的AI工具。此外，推出“想象”文本到图像功能，并增加新的安全措施，如AI图像隐形水印。这些创新旨在提升平台互动性和沉浸感。

Snapchat 用户现在可以创建并发送人工智能生成的图像

\[摘要\]Snapchat 为 Snapchat+ 订阅者推出了新的人工智能功能，提供增强的创意工具和协作可能性。订阅者现在可以根据文本提示生成人工智能图像，从预设选项中进行选择或输入自定义提示。AI图像生成器允许用户编辑、下载和共享生成的图像。此外，Snapchat+ 订阅者还可以与朋友协作使用“梦幻自拍”功能，共同创作富有想象力的图像。该应用程序还引入了人工智能驱动的扩展工具，可以自动缩小图像，使用人工智能填充背景。

CLAUDE AI 现已通过 Google 电子表格提供

\[摘要\]Google Sheets 用户现在可以通过新推出的 Claude for Sheets 扩展与 AI 模型 Claude 无缝集成。这种集成使用户能够直接在 Google 表格单元格中与 Claude 执行交互。要启用 Claude for Sheets，用户需要获取 Claude API 密钥并按照提供的安装步骤进行操作。该扩展允许自然语言提示来描述所需的声音或语音，提供了一种在 Sheets 环境中与 Claude 交互的多功能方式。

特斯拉升级其人形机器人Optimus Gen-2

\[摘要\]特斯拉展示了其人形机器人 Optimus Gen-2 的显着增强原型。最新版本优先提高速度、灵活性和平衡性，减轻了 20 磅以上的体重，提高了灵活性。值得注意的是，步行速度提高了 30%，采用了新的脚部和更顺畅的动作。该机器人现在配备了手指传感器，可以实现精细的物体操作，正如其精确处理鸡蛋的能力所证明的那样。

**3，监管合规**

人工智能信任危机：Dropbox和OpenAI的隐私争议

\[摘要\]Dropbox近期引入AI功能引发隐私争议，用户担心私人数据可能被用于训练OpenAI模型。虽然Dropbox声明绝不会用用户数据训练AI，但深埋于设置中的默认开启选项引发疑虑，导致信任危机。用户对OpenAI使用数据的透明度持怀疑态度，类似Facebook通过麦克风监控用户的阴谋论。大型AI实验室需公开训练数据来源，提高透明度。本地模型被视为更安全选择，但隐私和AI的交叉点仍需高质量、透明对话。

OpenAI 发布 2 项人工智能安全研究，确定 7 个关键实践

\[摘要\]人工智能安全性研究的新进展，OpenAI，ChatGPT和GPT-4的开发者，近期发布了两篇关于人工智能安全的论文，提出监督和治理策略。第一篇论文提出了一种新方法，旨在使人工智能系统的行为更符合人类利益，强调了人类在监督强大AI系统方面的挑战。论文指出，无经验且简单的人类监督不足以管理超人类模型，建议使用较弱的AI模型来控制更强大的系统。第二篇论文概述了治理AI系统的七大关键实践，包括评估AI系统对特定任务的适用性、限制AI自主性、设定默认行为、提高操作透明度、实施自动监控、建立明确归因机制和制定关闭AI系统的策略。

每月24美元的深度伪造：人工智能如何扰乱孟加拉国的选举

\[摘要\]在孟加拉国1月份举行大选之前，人工智能生成的虚假信息已成为一个日益严重的问题。全球范围内的政策制定者正日益关注人工智能生成的虚假信息对选民的潜在影响。随着明年几次重大选举的临近，存在担忧这些人工智能制造的信息可能被用于误导选民，从而加剧社会分歧。孟加拉国已经出现了这种情况，成为一个典型的例子，显示了人工智能生成虚假信息在政治过程中可能造成的实际后果。

AFL-CIO 和 Microsoft：为人工智能做好准备的劳动力的开创性合作

\[摘要\]Microsoft 和AFL-CIO 正在合作，促进员工过渡到人工智能增强的未来。这种伙伴关系的独特之处在于它关注劳动力而不是人工智能取代就业的潜力，包括有关人工智能的教育会议、工人反馈的劳工峰会，以及对为工人提供人工智能驱动型经济所需的技能和知识的政策支持。LinkedIn 上还将针对受人工智能影响最严重的行业提供专门的人工智能课程。该战略解决了与人工智能相关的问题，提供了一种将人工智能融入劳动力的独特方法。

GenAI 重塑网络安全格局及首席信息安全官角色

\[摘要\]每一项新技术的出现都带来了新的威胁和防御工具。生成性人工智能（GenAI）亦是如此。在 Fortune Brainstorm AI 论坛上，Wipro 的首席技术官 Subha Tatavarti（左）和 Check Point 的首席战略官 Itai Greenberg 探讨了 GenAI 对网络安全格局及首席信息安全官（CISO）角色的影响。GenAI 的发展不仅带来了新的网络威胁，也为应对这些威胁提供了先进的工具和方法，从而重塑了网络安全的整体格局。

LinkedIn发布了《工作的未来报告：工作中的人工智能》报告阐述人工智能对未来工作的潜在影响

\[摘要\]LinkedIn 的一项全球调查显示，52% 的千禧一代和 48% 的 Z 世代认为人工智能能够通过提供更快速的知识和见解来推动他们的职业发展，并增强工作中的自信。其中三分之二的专业人士认为人工智能将在明年改变他们的工作方式。在美国，52% 的男性和 31% 的女性已开始尝试使用人工智能工具。

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20231217-ai20231217](https://haxitag.com/brief/ai-brief-20231217-ai20231217)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
