# AI及信息技术应用2022年10月3日简报

## 核心定义
> 人工智能技术在信息技术领域的应用，包括代码生成、图像识别、自然语言处理等，旨在提高效率和智能化。

## 核心洞察（TL;DR）
- Hugging Face 和 ServiceNow 推出开源代码生成 AI 系统 BigCode。
- OpenAI 取消排队，DALL-E 绘画 AI 可供所有人立即使用。
- Cipia 获得超过 900 万美元资金，用于扩大全球市场业务。
- 特斯拉发布人形机器人原型 Optimus。
- 谷歌发布 Talk-to-Books，支持书籍段落和引用的语音查询。
- AssemblyAI 融资 3000 万美元，旨在改变语音市场。
- Google 发布 DreamFusion，实现文本到三维的合成。
- MetaAI 发布 Make-A-Video，实现文本到视频的生成。
- 欧盟制定人工智能产品责任法。
- 美国 FDA 发布指导意见，将 AI 败血症检测工具作为医疗设备进行监管。

## 关键事实与数据
- BigCode 模型参数为 150 亿，比 Codex 大，但比 AlphaCode 小。
- DALL-E 通过过滤训练数据集，减轻输出偏差。
- Cipia 在一轮融资中筹集了 900 万美元。
- Optimus 机器人使用了特斯拉的人工智能软件和传感器。
- Talk-to-Books 使用词向量技术。
- SetFit 在多种语言分类中显示出令人鼓舞的结果。
- 谷歌正在寻找更多方式来呈现信息，无需用户询问。
- AssemblyAI 的 API 可用于将语音转录成文字或创建语音接口。
- DreamFusion 使用 2D Diffusion 模型生成 3D 场景。
- Make-A-Video 使用无标签视频学习世界的运动方式。
- GV 废弃了用于确定投资的算法 'The Machine'。
- Stadia 用户体验比其他游戏机差，已被谷歌重新包装为 Google Stream。
- AWS 推出 Amazon EC2 P4de GPU 实例，支持万亿参数模型训练。
- Figma 并购案比较中美创业环境和未来方向。
- 欧盟新责任规则可能成为全球模式。
- FDA 将 AI 败血症检测工具作为医疗设备进行监管。

## 正文
AI及信息技术应用2022年10月3日简报
=====================

本周多在搜索搜索产品体验和搜索技术演进上，有两个很有意思的点，其一是多模态输入和交互的搜索体验 ，此前 都是散落的现在这种复杂交互在整合，Google lens、语音等，另外一点是用句向量编解码。开源这个太有 意思了，本周 开源的bigcode 代码生成器就是一个技术人员的人手一个的“宠物”。通过 AI 做汽车故障诊断、检修和保养维护，这是一个很好的应用场景，很多年前都在听说，至今没看到特别好的应用，以色列的Cipia是在这个领域增长很好的案例。

01＃AI应用

**Hugging Face 和 ServiceNow 推出 BigCode，这是一个开源代码生成 AI 系统的项目**

****************************\[摘要\]****************************代码生成系统，如 DeepMind 的 AlphaCode、亚马逊的 CodeWhisperer 和 OpenAI 的 Codex，为 GitHub 的 Copilot 服务提供支持，让人们对当今计算机编程领域的人工智能的可能性有了一个诱人的了解。但到目前为止，只有少数这样的人工智能系统向公众免费提供并开源——这反映了构建它们的公司的商业动机。为了改变这一点，人工智能初创公司 Hugging Face 和 ServiceNow 的研发部门 ServiceNow Research 今天推出了BigCode，这是一个新项目，旨在以“开放和负责任”的方式开发“最先进的”人工智能代码系统方法。目标是最终发布一个足够大的数据集来训练代码生成系统，然后将其用于创建原型——一个 150 亿参数的模型，大小比 Codex（120 亿参数）大，但比 AlphaCode 小（约 414 亿参数）——使用 ServiceNow 的内部显卡集群。在机器学习中，参数是 AI 系统从历史训练数据中学习的部分，本质上定义了系统在某个问题上的技能，例如生成代码。

OpenAI取消排队 DALL-E绘画AI可供所有人立即使用

****************************\[摘要\]****************************OpenAI 采取了许多应对措施，包括从其训练数据集中过滤掉色情暴力图像、并拒绝根据类似的明确提示来生成图像。自那时起，我们已经见到了许多其它种类的“文本到图像”AI 系统，速度和质量的竞争也变得愈加激烈。这确实减轻了 DALL-E 的输出偏差，但一些用户也留意到 AI 创建的内容与其预期指令并不匹配。

Cipia 宣布获得超过 900 万美元的资金

****************************\[摘要\]****************************Cipia是一家为汽车行业提供人工智能驱动的传感解决方案以帮助预防事故的供应商，在由 Alexandre Weinstein 领投的一轮融资中筹集了 900 万美元，Cartridge Holdings Ltd 和天使投资人也参与了该轮融资。Cipia 首席执行官Yehuda Holtzman表示：“这项投资是新投资者和现有投资者对 Cipia 业务战略的有力信任投票。我们将利用这笔新资金扩大我们在全球市场的业务活动，特别是美国、欧洲和中国，并加强我们在这些市场的影响力，成为不断增长的车内监控市场的主导者。”

特斯拉CEO马斯克发布人形机器人原型Optimus

****************************\[摘要\]****************************特斯拉CEO埃隆·马斯克透露了一个人形机器人的原型，他称这个机器人使用了公司的人工智能软件及为其先进驾驶辅助功能提供动力的传感器。而机器人原型的曝光肯定会支持马斯克关于特斯拉是“世界上最大的机器人公司”的说法。在人工智能日之前的几天里，机器人专家警告不要太相信马斯克的说法。

**谷歌 AI 发布了Talk-to-Books**

****************************\[摘要\]****************************基本上是对书籍段落和引用的语音查询。他们在这里开源了预训练的语言模型和通用编码器。这一项目目前包含交互式 AI 语言工具，它展示的主要人工智能技术是“词向量”。词向量是一种自然语言处理形式，向量的一些几何性质能够很好的反映词的句法或者句义。例如，两个词向量的差值对应词的关系，词向量的距离则对应词的相关或者相似性。对于选定的一组词，将其向量投影到空间中，词义相近的词向量在向量空间中表现出了有趣的聚类现象。例如国家名词聚成一类，大学名称则形成另一个聚类。

SetFit：无需提示的高效少量学习

****************************\[摘要\]****************************两阶段的训练过程SetFit利用了Sentence Transformers的能力，在成对的句子基础上生成密集的嵌入。在最初的微调阶段，它通过对比性训练来利用有限的标记输入数据，通过类内和类外选择来创建正负对。然后，句子转化器模型对这些配对进行训练，并为每个例子生成密集的向量。在第二步中，分类头在编码的嵌入上进行训练，并附上各自的类别标签。在推理的时候，未见过的例子通过微调的句子转化器，生成一个嵌入，当被送入分类头时，输出一个类别标签预测。在我们的实验中，SetFit在德语、日语、普通话、法语和西班牙语的分类中，在语言内和跨语言的设置中，都显示出令人鼓舞的结果。

谷歌正试图重塑搜索引擎——不仅仅是一个搜索引擎

****************************\[摘要\]****************************在今天的年度 Search On 活动中，谷歌展示了一系列供人们搜索互联网的新方式。他们中的大多数都延续了谷歌过去几年的趋势：试图找到更自然、更直观的方式让人们输入搜索并获得结果。您现在可以通过拍照或对着手机的麦克风漫无目的地向 Google 提问，而不是尝试在搜索栏中输入一组完美的关键字。Google 正在寻找更多方式来呈现您可能关心的信息，而您甚至无需询问。在活动前的采访中，谷歌高管反复表示，搜索正在经历一场彻底的改造。二十年来，“游戏规则大致是，‘亲爱的人类，如果您遵守规则并正确编写查询脚本，我们将为您的需求提供惊人的答案，’”谷歌负责高级副总裁 Prabhakar Raghavan 说的搜索。“但由于人工智能、机器学习和计算机视觉取得了令人难以置信的——坦率地说是前所未有的——进步，现在形势正在转变。”

AssemblyAI融资3000万美元！3人团队，想用AI改变语音市场

********************************************************\[摘要\]********************************************************AssemblyAI的创始人兼首席执行官Dylan Fox表示，我们正在构建用于定制化语音识别的API，开发人员可以用我们的API 将语音转录成文字或者创建自己的语音接口，而且他们不需要做任何数据上的挖掘和训练，我们会为他们完成海量自定义字词的识别。CallRail 是电话领域客户的一个很好的例子，它利用 AssemblyAI 的人工智能模型ーー核心转录、自动转录亮点和 PII 编辑ーー向客户提供强强大的对话智能解决方案。

DreamFusion：Google发布“文-3D”生成新成果（使用2D Diffusion）

******\[摘要\]******在这项名为DreamFusion的工作中，Google Research和UC Berkeley的研究员，通过使用预先训练好的二维文本到图像的扩散模型来执行文本到三维的合成，从而规避了这些限制。他们引入了一种基于概率密度蒸馏的损失，使二维扩散模型作为优化参数化图像生成器的先验。其主要工作原理是：给定一个标题，DreamFusion使用一个称为Imagen的文本到图像生成模型来优化一个三维场景。

Make-A-Video：MetaAI发布“文-视频”生成新研究

****\[摘要\]****它还使用无标签的视频来学习世界的运动方式。有了这些数据，Make-A-Video可以让你发挥想象力，只用几个字或几行文字就能生成异想天开、独一无二的视频。系统使用带有描述的图像来学习世界的模样以及通常的描述方式。

02 #产品市场创新

前身为 Google Ventures 的 GV 已经废弃了一种用于帮助确定其投资的算法

**********************************\[摘要\]**********************************自2009 年成立以来，Alphabet 的风险投资部门可能一直在使用名为“The Machine”的算法。Axios 将该算法描述为 GV 投资的看门人，为投资回合发出红灯、绿灯和黄灯。GV 向系统提供市场数据，例如当前估值和融资规模。然后机器根据颜色给出 1-10 分，绿色为 8 分或更高。Axios 2018 年的一份报告描述了 GV 最初如何将其用作决策者可以否决的“尽职调查助手”。该算法最终成为 GV 的“事实上的投资委员会”。

******谷歌怒砍 Stadia，为什么「云游戏」注定「没戏」******

****************************************\[摘要\]****************************************Stadia 死了，因为客观上它的用户体验比其他所有游戏机都差（更慢、更少游戏等）。游戏玩家并不关心谷歌期望人们关心的好处（流媒体）。它在谷歌专注于技术而不是用户之前就死了，很简单。据报道，谷歌正在将 Stadia 重新包装成一个名为 Google Stream 的产品，面向商业市场，为企业提供底层的技术方案，帮助它们打造类似云游戏的交互内容。

******在 AWS 上扩展至万亿参数模型训练******

****************************************\[摘要\]****************************************AWS 最近宣布推出由 400 Gbps 网络和 80GB GPU 内存提供支持的 Amazon EC2 P4de GPU 实例的预览版。P4de 提供两倍于 P4d 的 GPU 内存，使更少的节点能够在 GPU 内存中保存大型模型，从而降低通信开销。新硬件使我们能够使用 MiCS 更有效地扩展到更大的模型。Amazon Science 引入了一种新方法来训练和微调具有 1 万亿个参数的大型 AI 模型。

从两百亿美元 Figma 并购案，比较中美创业环境和未来方向

**********************************************\[摘要\]**********************************************如果对比中美的 SaaS 公司，会发现美国很多公司的产品口碑非常好，为什么硅谷的创意团队能做出像 Figma 这样较好的 SaaS 产品。

**03 #监管与合规**

欧盟正在为造成伤害的人工智能产品制定责任法——这就是为什么全世界都应该关注的原因

****************************\[摘要\]****************************新的责任规则可能很快就会成为一种全球模式，让受人工智能软件伤害的人更容易获得补救——但一些消费者权益倡导者认为，新法律可能会产生相反的效果。

美国 FDA 已发布指导意见，称旨在发现早期败血症的人工智能工具应作为医疗设备进行监管

****************************\[摘要\]****************************该指南是在STAT 调查发现 Epic Systems 开发的败血症警报系统存在问题之后发布的。该系统通常无法及时识别脓毒症，并且会发出错误警报。FDA 认为，目前不需要批准的 AI 败血症检测工具应该属于其自己的监管审查范围。例如，约翰霍普金斯大学开发的人工智能系统可以发现住院患者败血症的早期迹象，从而将死亡率降低18.2% 。有针对性的实时早期预警系统将患者的病史与实验室结果和他们当前的症状相结合，当一个人有败血症风险时会提醒临床医生，败血症的死亡率为 30% 。FDA 的最终指南不具有约束力。该机构还列出了它认为应该受到监管的其他 34 种产品，包括那些旨在识别阿片类药物成瘾患者和预测心力衰竭住院的产品。

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20221003-ai2022103](https://haxitag.com/brief/ai-brief-20221003-ai2022103)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
