# AI及信息技术应用2022年9月26日简报

## 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，包括学习、推理、解决问题和感知等能力。

## 核心洞察（TL;DR）
- OpenAI开源了Whisper ASR和翻译系统，DeepMind推出新的chatbot使用谷歌搜索提供答案，亚马逊提供可视化对话生成工具。
- Nvidia发布GET3D模型，用于从2D图像生成3D对象，并推出NeMo和BioNeMo云服务。
- 特斯拉研究人形机器人Optimus，Bulwark使用AI生成文章插图，D-ID推出从文本和图像创建视频的平台。
- CheXzero AI诊断工具可识别胸部X光片上的疾病，普朗克筹集资金扩展认知业务分析平台。
- Slack推出Canvas功能，Google应用推出删除个人信息工具，TikTok禁止政治筹款活动，Getty Images禁止AI生成内容，印度尼西亚通过数据保护法案。

## 关键事实与数据
- OpenAI的Whisper ASR和翻译系统接受了68万小时多语言数据的训练。
- DeepMind的chatbot Sparrow基于Chinchilla语言模型，使用谷歌搜索支持其主张。
- Nvidia的GET3D模型使用A100 Tensor Core GPU，每秒生成约20个对象。
- 特斯拉的Optimus人形机器人预计2023年开始生产。
- CheXzero AI诊断工具在测试中优于其他自我监督的AI模型，与人类放射科医生一样准确。

## 正文
AI及信息技术应用2022年9月26日简报
=====================

本周DeepMind新chatbot使用谷歌搜索为人类来提供更好的答案,亚马逊开始给对话机器人提供可视化对话生成干预工具，OpenAI 开源的Whisper ASR 和翻译，英伟大则一方面开放新应用2D图片 3D 生成 的模型，另一方面开放语言模型AI 算力云，AI 的天花板们，依然高歌猛进。

01＃AI应用

OpenAI 开源了一个自动语音识别系统

********************************************\[摘要\]********************************************OpenAI 将 Whisper 描述为通用的端到端弱监督transformer ASR 系列模型。该系统声称可以在多种语言中实现“稳健”转录，并将这些语言翻译成英语；这个名为 Whisper 的系统接受了来自网络的 68 万小时多语言和“多任务”数据的训练。Whisper 有五个版本。参数从小到大依次为：Tiny (39M)、base (74B)、small (244B)、medium (769M)、large (1.55B)。

DeepMind's 新的chatbot使用谷歌搜索为人类来提供更好的答案

******************************************\[摘要\]******************************************Alphabet旗下AI实验室DeepMind的一篇新论文称，制作一个好的人工智能聊天机器人的诀窍可能是让人类告诉它如何行为，并迫使模型使用互联网来支持其主张。在今天发布的一篇新的非同行评议论文中，该团队发布了Sparrow，一个AI聊天机器人，它是以DeepMind的大型语言模型Chinchilla为基础进行训练的。Sparrow旨在与人类对话并回答问题，使用实时谷歌搜索或信息来告知这些答案。该bot 在互联网上搜索以回答问题，并经过部分人工培训，以确保答案正确且无害。

亚马逊正在为 Amazon Lex 添加可视化对话生成器

****************************************\[摘要\]****************************************Amazon Lex 是一项完全托管的人工智能服务，具有高级自然语言模型，用于在应用程序中设计、构建、测试和部署对话界面。Amazon Lex 提供高质量的语音识别和语言理解功能。可视化构建器允许通过将条件直接添加到 Lex 机器人并根据用户输入和业务知识动态管理对话路径来构建和管理具有动态路径的复杂对话，所有这些都在无代码环境中进行。根据 Amazon的说法，使用 Amazon Lex 不需要机器学习专业知识。开发人员可以以声明方式指定对话流，Amazon Lex 将负责语音识别和自然语言理解功能。开发人员以简单的英语提供一些示例话语以及他们希望从用户那里收集的不同参数以及相应的提示。语言模型是自动构建的。

**Nvidia 宣布了一种新的 AI 模型，该模型使用 2D 图像生成详细的 3D 对象，用于填充游戏和虚拟世界**

**************************************\[摘要\]**************************************Nvidia 使用 A100 Tensor Core GPU，在至少一百万张来自不同角度的不同 3D 形状的合成 2D 图像上训练模型。模型称为 GET3D，使用一个 GPU 每秒生成大约 20 个对象。根据Nvidia 的一篇博客文章，它的创作具有“高保真纹理和复杂的几何细节”。该模型生成形状、角色、动物、建筑物、车辆等，以便在 3D 建模器、游戏引擎和电影渲染器中导入和编辑。它创建的形状是“三角形网格”，类似于纸模型，并覆盖有纹理材料。根据 Nvidia 的说法，未来的 GET3D 版本可以在真实物体的图像而不是合成图像上进行训练。

Nvidia 宣布了一对新的云服务，供开发人员使用大型语言模型来适应自定义应用程序

************************************\[摘要\]************************************NeMo 大语言模型 (LLM) 服务和 NVIDIA BioNeMo LLM 服务可以帮助公司更轻松地开发自然语言处理模型并将其部署到代码开发、内容生成、文本摘要等应用程序中。NeMo LLM 服务通过基于云的 API 提供对 30 亿到 5300 亿个参数的预训练语言模型的访问。开发人员可以使用一种称为快速学习的技术来定制模型。BioNeMo 框架具有额外的 BioNeMo 语言模型。它旨在为生物和化学研究和应用培训 LLM，例如加速新药发现。NeMo LLM 和 BioNeMo 服务和云 API 将于下个月提前推出。

**据埃隆马斯克称，特斯拉的自动驾驶仪和人工智能团队也在研究公司的 Optimus 人形机器人**

**********************************\[摘要\]**********************************据路透社报道，特斯拉现在有大约 20 个用于 Optimus 开发的职位。一篇文章称，员工开发的代码将“在全球数百万人形机器人中长期运行”。此前马斯克曾表示，该机器人的生产可能在 2023 年开始。通用机器人最初将部署在特斯拉工厂，然后进入人们的家中，执行诸如“做饭、修剪草坪和照顾老人”等任务。马斯克说过。特斯拉人工智能日将在加利福尼亚州帕洛阿尔托举行。预计该公司还将宣布有关其 Dojo 定制超级计算机和其他全自动驾驶更新的消息。

美国政治新闻和分析网站Bulwark已经悄悄开始使用人工智能来帮助说明其文章

********************************\[摘要\]********************************美国新闻网 The Bulwark 已经开始使用 Midjourney AI 系统和库存照片来为文章生成原始插图。这不是我们第一次看到一个出版物以这种方式使用机器学习艺术生成器，但据记者所知，这是第一次说该出版物没有把这事说得天花乱坠——这是一个重大新闻。

人工智能初创公司 D-ID 推出了Creative Reality Studio，这是一个从文本和单个人的图像创建视频的平台

**********************************\[摘要\]**********************************用户只需上传照片并输入文本或音频剪辑。然后，他们会选择一种声音、语言和风格，例如欢快或兴奋。基于这些参数，D-ID 的 AI 算法生成可用于商业通信、营销、企业培训和教育等任务的视频。TechCrunch 试用了该平台，发现制作一分钟长的视频需要几分钟。虽然 Creative Reality Studio 可用于制造深度伪造，但 D-ID 表示其过滤器会清除亵渎和种族主义言论，并使用图像识别来防止人们使用名人的图像。它还禁止政治内容，并将删除和暂停被发现违反这些条款的帐户。

**一种新的人工智能诊断工具可以使用临床报告中的自然语言描述识别胸部 X 光片上的疾病**

********************************\[摘要\]********************************CheXzero 接受了胸部 X 光检查及其相应放射学报告的培训。然后它“学习”将图像与文本描述相匹配，本质上是了解非结构化文本如何与图像的视觉模式相关联。该模型 CheXzero 是自我监督的，不需要人类放射科医生注释的 X 射线图像——这个过程可能需要数百小时。在测试中，它优于其他自我监督的 AI 模型，并且与人类放射科医生一样准确。哈佛医学院和斯坦福大学的研究人员开发，他们在最近发表在《自然生物医学工程》上的一份报告中对其进行了描述。在医学图像上训练的其他 AI 模型通常需要由人类临床医生明确注释疾病的数千张图像的数据集。

普朗克筹集了 7100 万美元以扩展其首个上市的认知业务分析平台 

******************************\[摘要\]******************************领先的人工智能数据和分析平台普朗克最近完成了 2300 万美元的融资，以继续其为商业保险公司提供实时和准确见解的使命. 此次融资使公司的总融资额达到 7100 万美元，由Vintage Investment Partners和所有现有的金融投资者牵头，包括Team8、Greenfield、Arbor Ventures、Viola、3L Capital、HDI和Nationwide，以及私人天使投资者。通过与普朗克合作，商业保险公司及其代理人可以通过清晰、实时地了解标准行业数据流和典型提供商无法提供的承保和业务风险，在流程和盈利能力方面实现突破性的改进。保险公司正在从普朗克的洞察力中获益，从而极大地改善他们的客户体验、运营和底线。

**像毛毛虫一样的微型软机器人可以折叠、滚动、抓取和降解**

****************************\[摘要\]****************************“微型机器人”可能会大约有一根手指那么宽，有朝一日可以运送药物或进行微创手术。一些软毫机器人已经被开发用于各种生物医学应用，这要归功于它们的小尺寸和通常由磁场从外部供电的能力。例如，它们独特的结构使它们能够在我们胃肠道的凹凸不平的组织中移动或滚动。有朝一日，它们甚至可以涂上药物溶液，并将药物准确地输送到身体需要的地方。然而，大多数毫机器人是由不可降解的材料制成的，例如硅胶，这意味着如果在临床应用中使用它们必须通过手术切除。此外，这些材料不是那么灵活，并且不允许对机器人的特性进行太多微调，从而限制了它们的适应性。

******02 #产品市场创新******

**Slack 的新 Canvas 功能在您的聊天窗口中放置了一个文档编辑器**

********************************\[摘要\]********************************Slack 正在成为文档编辑器。这家 Salesforce 旗下的公司今天在其开发者大会上宣布，它正在构建一个名为 Canvas 的新功能，让用户可以在 Slack 界面中创建和编辑完整的文档。这是 Slack 一段时间以来最大的公告之一，也许是它与电子邮件杀手根源的最大背离。将文档引入 Slack 背后的想法似乎是匹配 Slack 的所有高效和有用的东西，但将其从快速移动的聊天窗口中拉出，进入更永久和更容易找到的空间。画布文档（Slack 称之为画布）显然可以包含文本和图像，但它们的一大优势是 Slack 能够从粘贴到应用程序的任何链接中抓取重要内容。放置一个 YouTube 链接、一条推文或现在的一个文档，它会自动嵌入内容。通过 Slack 与其他应用程序的许多集成，您还可以直接在画布内与第三方工具进行交互。每个画布都是部分文档，部分低代码网站，具有 Slack 中的所有功能

从两百亿美元 Figma 并购案，比较中美创业环境和未来方向

**************************\[摘要\]**************************如果对比中美的 SaaS 公司，会发现美国很多公司的产品口碑非常好，为什么硅谷的创意团队能做出像 Figma 这样较好的 SaaS 产品。

第四范式冲刺IPO，难逃AI玩家通病？

********************************\[摘要\]********************************第四范式目前重点押注能源电力、医疗、运输等产业对决策AI产品和服务的需求，一方面是部分产业因疫情等因素处于需求疲软状态。甩不掉通病虽以决策AI突围，占据赛道的一方天地，但第四范式终究还是人工智能玩家，无论看变现模式，还是商业进度，都和商汤、云从们大同小异。商汤们走的多为产品AI路线，第四范式的决策AI与之区别主要集中于两点。

**03 #监管与合规**  

Google 应用开始推出“关于您的搜索结果”以帮助删除个人信息  

****************************************\[摘要\]****************************************Google 宣布了一种新工具，以简化删除包含您的联系方式和其他个人身份信息 (PII) 的搜索结果的过程，现在它开始上线。对于今天的一些人来说，在 Android 上打开 Google 应用并点击右上角的个人资料头像会显示一个新的“关于你的结果”菜单项。这会将用户带到一个页面，该页面解释了他们如何请求 Google 删除包含电话号码、家庭住址、电子邮件或其他 PII的搜索结果。循该过程后，您可以监控从结果中删除您的进度。除了“所有请求”提要之外，您还有“进行中”和“已批准”等过滤器。此页面还允许您通过演练提出新请求，其中涉及“您为什么要删除此结果？” 步。选项包括：它显示了我的个人联系信息、它表明我的接触意图伤害我、它显示其他个人信息、它包含非法信息、它已经过时了

TikTok计划禁止其平台上的所有政治筹款活动

************************************\[摘要\]************************************TikTok 的全球商业解决方案总裁布莱克·钱德利 (Blake Chandlee) 表示，该公司将立即关闭平台上针对政客和政党的所有广告和货币化功能，例如送礼和小费。此外，属于政府、政治家和政党的账户必须申请验证。TikTok预计将全面禁止竞选筹款“通过禁止竞选筹款并限制访问我们的货币化功能和验证帐户，我们的目标是在让人们讨论与他们的生活相关的问题与保护我们社区想要的创意、娱乐平台之间取得平衡， ” TikTok 全球业务解决方案总裁 Blake Chandlee 在周三的博客文章中说。在接下来的几周内，TikTok 预计将全面禁止竞选筹款。该禁令将禁止政客和政党使用该平台将观众引导到他们的竞选网站进行捐款。

**Getty图片社因担心法律挑战而禁止人工智能生成的内容**

****************************************\[摘要\]****************************************Getty Images 禁止上传和销售使用 DALL-E、Midjourney 和 Stable Diffusion 等 AI 艺术工具生成的插图。在Newgrounds、PurplePort和FurAffinity等网站做出类似决定之后，这是引入此类禁令的最新和最大的用户生成内容平台。Getty Images 首席执行官 Craig Peters 告诉The Verge，该禁令是出于对 AI 生成内容合法性的担忧以及保护网站客户的愿望。

印度尼西亚议会通过期待已久的数据保护法案

********************************\[摘要\]********************************印度尼西亚议会周二通过了一项个人数据保护法案，其中包括对在这个世界第四人口大国发现数据处理不当的人处以公司罚款和最高 6 年的监禁。该法案的通过是在一系列数据泄露和调查涉嫌违反印度尼西亚政府公司和机构的事件之后，从一家国有保险公司、电信公司和公用事业公司到一个接触者追踪 COVID-19 应用程序，该应用程序揭示了总统 Joko Widodo 的疫苗记录。立法者以压倒性多数通过了该法案，该法案授权总统组建一个监督机构，对违反有关分发或收集个人数据的规则的数据处理人员进行罚款。最大的罚款是公司年收入的 2%，并且可能会被没收或拍卖其资产。该法律包括两年的“调整”期，但没有具体说明在该阶段如何处理违规行为。

**Twitch 表示将在 10 月 18 日生效的政策更新中禁止“包括老虎机、轮盘赌或骰子游戏在内的赌博网站流媒体”**

************************************\[摘要\]************************************Twitch 并没有禁止所有赌博，甚至也没有禁止所有上述赌博形式的流媒体。将有一个例外，允许体育博彩、梦幻体育和扑克，而老虎机、轮盘赌和骰子的流媒体只有在流媒体网站没有“在美国或其他提供充分消费者保护的司法管辖区获得许可”的情况下才被禁止。将在禁令中扫荡的赌博网站包括Stake.com，这是 Twitch 上最受欢迎的老虎机赌博网站之一。像 xQc 和 Trainwreckstv 这样的大流媒体经常在他们的流媒体中展示它。

TikTok 如何为其顶级创作者改变规则

******************************************\[摘要\]******************************************根据 2021 年秋季 TikTok 内部会议泄露的录音，TikTok 采用了两级审核系统，对有影响力的人、名人和其他 VIP 给予优惠待遇。这种更宽松的政策执行系统使用专用队列来优先处理和保护帖子超过 500 万粉丝的人违反 TikTok 的内容规则。在 TikTok 的内部系统中，这些备受瞩目的帐户被贴上了所谓的“创作者标签”。录音显示，在 2021 年 9 月下旬的一次会议上，TikTok 信任与安全团队的一名成员解释说，这些标签是为“特殊用户”保留的，他们的内容将与来自二等用户的内容分开进行审核的会议。“我们不想像对待任何其他帐户一样对待这些用户。我想说，还有一点宽大处理，”信任与安全团队的一名员工说。

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20220926-ai2022926](https://haxitag.com/brief/ai-brief-20220926-ai2022926)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
