# AI及信息技术应用2022年月3日简报

## 核心定义
> 人工智能（AI）是一种模拟人类智能行为的计算机技术，包括学习、推理、感知、理解和解决问题等能力。

## 核心洞察（TL;DR）
- 54% 的 AI 项目正在从试点过渡到生产，但进展缓慢。
- 微软推出 BEiT-3 预训练模型，实现多模态预训练的 SOTA 迁移性能。
- Capitol Records 与 AI 驱动的虚拟说唱歌手 FN Meka 签约，开启新合作模式。

## 关键事实与数据
- 关键事实1: Gartner 调查显示，54% 的 AI 项目正在从试点过渡到生产。
- 关键事实2: BEiT-3 预训练模型在多个视觉及视觉-语言任务上实现 SOTA 迁移性能。
- 关键事实3: Capitol Records 与 FN Meka 签约，标志着 AI 在音乐领域的应用突破。

## 正文
AI及信息技术应用2022年月3日简报
===================

> 本周[Gartner](https://haxitag.com/search?q=Gartner)的调查数据显示，人工智能应用方面平均 54% 的 AI 项目正在从试点过渡到生产，虽然有进步，依然是很慢的。在互联网产品上，reddit、LinkedIn都有一些新的AI算法应用场景。模型的算法研究上，依然是产出最多。本周，唱片公司**Capitol Records 与 AI 驱动的虚拟说唱歌手 FN Meka 签约，是个新的有趣的故事。**
> 
>   

**01＃AI应用**

**通用多模态基础模型BEiT-3：引领文本、图像、多模态预训练迈向“大一统”**

****\[摘要\]:****近日，微软亚洲研究院联合微软图灵团队推出了最新升级的 BEiT-3 预训练模型，在广泛的视觉及视觉-语言任务上，包括目标检测（COCO）、实例分割（COCO）、语义分割（ADE20K）、图像分类（ImageNet）、视觉推理（NLVR2）、视觉问答（VQAv2）、图片描述生成（COCO）和跨模态检索（Flickr30K，COCO）等，实现了 SOTA 的迁移性能。BEiT-3 创新的设计和出色的表现为多模态研究打开了新思路，也预示着 AI 大一统渐露曙光。

**Headroom 是一家旨在改善虚拟会议的人工智能工具提供商，该公司宣布获得由 Equal Opportunity Ventures 牵头的900 万美元投资**

******\[摘要\]************:******该公司的软件还跟踪身体姿势和动作，并分析会议中的视频、音频和文本，以实时衡量“会议能量”。它提供支持 AI 的升级和会议中手势，例如竖起大拇指和挥手。该公司表示，其工具旨在解决“虚拟会议疲劳”，显示亮点，并减少浪费的时间。Julian Green 和 Andrew Rabinovich 于 2020 年创立了 Headroom。Rabinovich 是 AR 公司 Magic Leap 的前 AI 负责人和前深度学习总监。格林是使用计算机视觉分析旅行照片的 Jetpac 的创始人和前首席执行官，也是谷歌实验 X 月球计划部门的前任主管。其视频会议平台提供自动会议摘要，包括自动生成的精彩片段、实时交互式脚本、回放和实时参与分析。

**Headroom 是一家旨在改善虚拟会议的人工智能工具提供商，该公司宣布获得由 Equal Opportunity Ventures 牵头的900 万美元投资**

********\[摘要\]:********该公司的软件还跟踪身体姿势和动作，并分析会议中的视频、音频和文本，以实时衡量“会议能量”。它提供支持 AI 的升级和会议中手势，例如竖起大拇指和挥手。该公司表示，其工具旨在解决“虚拟会议疲劳”，显示亮点，并减少浪费的时间。Julian Green 和 Andrew Rabinovich 于 2020 年创立了 Headroom。Rabinovich 是 AR 公司 Magic Leap 的前 AI 负责人和前深度学习总监。格林是使用计算机视觉分析旅行照片的 Jetpac 的创始人和前首席执行官，也是谷歌实验 X 月球计划部门的前任主管。其视频会议平台提供自动会议摘要，包括自动生成的精彩片段、实时交互式脚本、回放和实时参与分析。

 Zilliz 在 B 系列扩展资金中筹集了 6000 万美元

**\[摘要\]:**Zilliz 由 CEO Charles Xie 领导，是一家面向生产就绪型 AI 的矢量数据库公司。Zilliz 由创建流行的开源矢量数据库 Milvus 的工程师构建，构建了下一代数据库技术，以帮助组织快速创建 AI/ML 应用程序并释放非结构化数据的潜力。此完全托管的产品目前处于私人预览版中，可在 Zilliz Cloud 上进行早期访问，可通过邀请客户进行测试和反馈，然后才能更广泛地使用。Zilliz Cloud 的长期愿景是成为一个完全托管的数据库即服务 (DBaaS)，为矢量数据处理、非结构化数据分析和企业 AI 应用程序开发提供集成平台。

一家LinkedIn营销机构收购了一个可以写超级LinkedIn帖子的人工智能

**\[摘要\]:**营销人员汤姆·奥尔巴赫（ Tom Orbach）推出了他的LinkedIn Viral Post Generator，这是一个使用人工智能模仿病毒式LinkedIn帖子的网站，让Twitter非常高兴。互联网绝对吞噬了它，以至于一家公司决定支付真金白银来拥有它。根据 Orbach 的说法，他使用人工智能创建了病毒式帖子生成器，其任务是分析超过 100,000 条在 LinkedIn 上病毒式传播的帖子。8 月 15 日，他在 Twitter 上首次推出了该工具，并表示人工智能现在可以自己编写令人讨厌的帖子，并为任何人个性化它们。所有用户所要做的就是告诉人工智能他们今天做了什么，包括一条鼓舞人心的建议，并选择畏缩水平（从低到高按滑动比例）。

Microsoft 的参数高效 Z-Code++ 语言模型在抽象文本摘要方面击败了 200 倍大的 GPT3-175B

**\[摘要\]:**在新论文 Z-Code++: A Pre-trained Language Model Optimized for Abstractive Summarization 中，来自 Microsoft Azure AI 和 Microsoft Research 的研究团队介绍了 Z-Code++，这是一种针对抽象摘要优化的新型编码器-解码器预训练语言模型，可显著提高性能关于低资源摘要任务。抽象文本摘要是一项自然语言处理 (NLP) 任务，旨在生成简洁流畅的文档摘要。大规模预训练语言模型的最新发展极大地提高了抽象文本摘要性能，但此类模型可能会遭受“幻觉问题”，即生成的摘要可能变得无意义或对输入文档不忠实。

Midjourney 和 OpenAI 的 DALL-E 等程序制作的艺术作品令人惊讶地引人注目

**\[摘要\]:**一个新的在线市场允许创作者销售 AI 生成系统的预先设计的提示，包括 DALL·E、GPT-3、Midjourney 和 Stable Diffusion。PromptBase利用不断增长的 AI 生成图像和文本市场。例如，该平台的用户可以买卖旨在为其品牌生成最佳形象的字串。即时购买的价格从 1.99 美元到 5 美元不等，PromptBase 减价 20%。据创始人 Ben Stokes 称，PromptBase 仍处于早期阶段，正在努力寻找“提示工程师”在市场上列出他们的短语。他说，从长远来看，它的目标是开发支持这些创作者的工具。它似乎支持上述四种 AI 模型的提示，但未来可能会添加更多。目前，没有任何人工智能技术禁止销售此类提示或它们生成的图像。人工智能创造的艺术引发了围绕版权和合理使用的问题，这些问题可能会在法院系统中发挥作用。

**Reddit 收购了Spiketrap，后者使用 AI 将受众理解情境化**

**\[摘要\]:**Spiketrap 试图提供对话的上下文分析，使其能够提供对平台受众指标的洞察。Reddit 表示，该技术将帮助其更好地定位广告并改进其自动竞价的预测模型。7 月，Reddit 表示已收购了一家自然语言处理公司 MeaningCloud，该公司专注于从网络对话和其他非结构化内容中提取意义。该社交平台最近还购买了Spell ，这是一个无需硬件即可运行资源密集型 ML 实验的平台。这笔交易还有望帮助 Reddit 为用户展示更多相关帖子，并改进其垃圾邮件检测和算法匹配。

Meta AI 研究人员表示，他们开发了一种 AI 模型，无需手术即可帮助从人的大脑活动中解码语音

**\[摘要\]:**该方法依赖于无创脑部扫描，例如脑电图、EEG 和脑磁图、MEG。这些从外部扫描大脑，这意味着无需手术，并提供其活动的快照。EEG 和 MEG 的问题在于它们非常“嘈杂”，因此很难确定一个人在想什么。为了解决这个问题，Facebook AI 研究实验室 (FAIR) 的科学家们使用了机器学习算法。他们使用 FAIR 自己的开源 AI 模型 wave2vec 2.0“清理”了噪音，用于自动语音识别。Meta 表示，其工作旨在帮助科学家加速使用人工智能来更好地了解大脑。这是朝着可以从非侵入性脑记录中以高精度解码语言的技术迈出的一步，从而改善了患有创伤性脑损伤且无法有效沟通的人们的生活。

**Capitol Records 与 AI 驱动的虚拟说唱歌手 FN Meka 签约**

****\[摘要\]:****由人工智能驱动的“机器人说唱歌手”FN Meka 在TikTok上拥有超过 1000 万粉丝和超过 10 亿次浏览量，已与 Capitol Records 签署了一项协议。FN Meka 由 Factory New 创建，这是一家“虚拟”唱片公司，是第一个“签署”FN 的公司。该公司的联合创始人 Anthony Martini去年向MBW解释了公司的流程，称他们已经创建了人工智能技术，可以分析特定流派的流行歌曲。他说，基于此，该技术会为新歌曲的构建模块生成建议，例如“歌词内容、和弦、旋律 \[和\] 节奏”。

Writer 的 GPT 驱动的 CoWrite 处理内容“苦差事”，并将创造力留给人类

**\[摘要\]:**Writer 是一种人工智能驱动的工具，用于检查和指导组织中的内容创建者，其中语音和品牌是必不可少的。它的新功能 CoWrite 可以自己编写——但不要不用担心，这并不是我们一直担心的内容末日。

**特斯拉希望将机器学习芯片带到 Dojo**

**\[摘要\]:**如果你看过特斯拉的 AI Day，你就会知道这家电动汽车公司已经加入了无数的 AI 芯片公司。最近，特斯拉在 Hot Chips 34 上透露了有关其超级计算架构的许多细节。该系统与许多其他系统不同，“由一个完全定制的架构构建而成，涵盖了计算、网络和输入/输出 (I/O) 芯片到指令集架构 (ISA)、供电、封装和冷却。”为了大规模运行专门的 ML 算法，特斯拉从头开始，以避免传统方法在扩展分布式工作负载方面的局限性。Dojo 训练块可以在 15kW 液冷封装中每秒运行 556 万亿次浮点运算（以 FP32 分辨率）。特斯拉已经提到它计划将其芯片提供给研究人员，但目前还没有时间表。

**全球首创！网易伏羲提出 135 种人脸表情划分标准，荣登 IEEE 官网**

****\[摘要\]:****近日，网易伏羲提出135种人脸表情划分标准，获电气和电子工程师协会旗下情感计算领域顶级期刊《IEEE Transactions on Affective Computing》收录，并受主编邀请将于近期在IEEE官网正式公布该标准。

**斯坦福李飞飞团队新研究登 Nature 子刊：实现可信 AI，数据的设计、完善、评估是关键**

******\[摘要\]:******最近，斯坦福大学计算机科学系的Weixin Liang、李飞飞等人在《自然-机器智能》上共同发表了一篇题为“Advances, challenges and opportunities in creating data for trustworthy AI”的文章，在 AI 数据全流程的各个环节上讨论了保证数据质量的关键因素和方法。在以往的 AI 开发流程中，数据集通常是固定的，开发工作的重点是迭代代模型架构或训练过程来提高基准性能。

字节AI Lab提出的新多语言多模态预训练方法刷榜！已开源

**\[摘要\]:**字节跳动 AI Lab Research 团队发现多语言预训练和多模态预训练都是在拉近同一对象的不同表示形式，因此提出 Cross-View Language Modeling，通过最大化同一对象的不同表示形式之间的互信息，以统一的方法拉近图像-文本对与平行文本对做多语言多模态预训练。

一半的 AI 模型从未投入生产：[Gartner](https://haxitag.com/search?q=Gartner)

**\[摘要\]:**调查发现，平均 54% 的 AI 项目正在从试点过渡到生产，高于 [Gartner](https://haxitag.com/search?q=Gartner) 2019 AI in Organizations 调查报告的 53%。

埃森哲完成对 Eclipse Automation 的收购

**\[摘要\]:**埃森哲已完成对 Eclipse Automation 的收购，Eclipse Automation 是一家定制制造自动化和机器人解决方案提供商，总部位于加拿大安大略省剑桥市。Eclipse Automation 创建自动化制造系统，为生命科学、工业设备、汽车、能源和消费品公司生产产品。该公司的大约 800 名专业人员加入了埃森哲的数字工程和制造服务行业 X。此次收购旨在帮助客户建立未来的工厂，使埃森哲能够提供利用云、数据和人工智能 (AI) 的自动化生产线，使工厂和工厂更智能，从而提高生产力、可持续性和安全性。

AI绘画工具生成画作在比赛中获奖，人类艺术家慌了？

**\[摘要\]:**获奖作品为截图第一张画作Jason Allen表示，他已经使用Midjourney创建了100张画作，在几个星期的微调和挑选后，选出了自己最喜欢的三幅画，并用Gigapixel AI放大后打印在了画布上，而他最喜欢的那一幅获得了大奖。

**微软和字节跳动正在合作一个大型人工智能项目，即使中美竞争升温**

********\[摘要\]:********微软TikTok 的母公司中国字节跳动通过一个名为 KubeRay 的项目，他们正在合作开发旨在帮助公司更有效地运行 AI 应用程序的软件。随着近年来TikTok的使用量呈爆炸式增长，字节跳动一直在潜入各种人工智能开源项目。例如，字节跳动在 2020 年推出了用于人工智能语音翻译的 NeurST 软件工具包。去年，该公司推出了 CloudWeGo 开源企业软件。

**02＃产品市场创新**

文心一格——百度的AI生成内容平台

******\[摘要\]:******在成都召开的 2022 年中国图像图形学大会（CCIG）上，百度发布了文心一格——一个支持生成不同风格图像的 AI 艺术平台。与其他Dall-E类车型的最大区别是什么？它适合中国观众。提示以中文输入。要申请访问一哥，你必须有一个百度帐号，需要一个中国电话号码。

应用程序开发商 Lightricks 在其 Photoleap 和 Motionleap 应用程序中引入了免费的AI 图像创建器

******\[摘要\]:******Photoleap 支持照片编辑和 Motionleap 动画静止图像。要使用该工具，应用程序用户可以单击“生成 AI 图像”，然后会出现一个文本框供他们输入所需图像的提示。它还提供预先编写的提示。总部位于以色列的 Lightricks 表示，其文本到图像生成器基于Stable Diffusion 的开源代码。另一个 AI 图像生成器 Stable Diffusion 现在可用于公共演示和新的Web 应用程序。Lightricks 以其旗舰 Facetune 应用程序而闻名，Instagram 模特和其他人使用它来修饰照片。尚未指定是否会将 AI 图像创建者带到该应用程序。

**Facebook 将于 10 月关闭其独立游戏应用程序**

******\[摘要\]:******仅在推出两年多后，Facebook 将于 2022 年 10 月 28 日关闭 Facebook Gaming 应用程序。该应用程序也不会在 Google Play Store 或 Apple App Store 上可用。该应用程序于 2020 年 4 月在 COVID-19 大流行开始时推出，作为用户观看他们最喜欢的流媒体、玩即时游戏和参加游戏组的一种方式。Facebook 在推出该应用程序时遇到了一些障碍，因为苹果公司多次拒绝该应用程序，理由是其规则禁止以分发休闲游戏为主要目的的应用程序。苹果的规则迫使 Facebook 从应用程序中删除实际的游戏功能。该公告发布之际，Meta 一直在测试新服务并淘汰旧服务。最近，Facebook 宣布将于 10 月 1 日关闭其实时购物功能，将重点转移到 Reels。另一方面，Meta 正在为有影响力的人测试一个名为“Super”的新直播平台。新平台允许有影响力的人主持直播、赚取收入并与观众互动。该平台看起来具有与 Twitch 类似的功能，目前正在与不到 100 名创作者进行测试。

TikTok所有者字节跳动在中国悄悄推出搜索应用悟空，谷歌在中国被禁止

******\[摘要\]:******字节跳动子公司北京无限维科技本月推出了悟空搜索应用程序，悟空目前可在苹果在中国的 App Store 和各种中国 Android 应用商店上使用，它使字节跳动与中国领先的搜索引擎百度展开了更密切的竞争。在腾讯控股于 8 月 8 日关闭其搜狗搜索应用程序的几天内。腾讯去年收购的搜狗仍保留其基于网络的搜索引擎。新应用程序将自己宣传为提供“无广告的优质信息和搜索”。这条线可以被解释为对百度的间接抨击，百度长期以来因其在搜索结果中的付费列表而受到批评。

**03＃监管与合规**

**美官方要求英伟达、AMD禁止向中国出售高性能AI芯片**

****\[摘要\]:****美国芯片设计巨头英伟达被美国政府要求限制向中国出口两款被用于加速人工智能任务的最新两代旗舰GPU计算芯片A100和H100。9月1日，英伟达在SEC文件上官方确认此事，称是8月26日收到美国政府的通知，并在声明中警告此事的影响：由于受影响芯片涉及在中国约4亿美元的潜在销售额，如果客户不愿购买英伟达的替代产品，或者美国政府不肯授予许可，使英伟达收入盈利大幅下滑。AMD同样被要求限制向中国出口其MI250人工智能芯片，但它相信其MI100芯片不会受到影响。

**人工智能驱动的智能访问治理解决方案开发商 BalkanID 宣布了 236 万美元的延期，使其种子轮融资总额达到 810 万美元**

******\[摘要\]:******人工智能驱动的智能访问治理解决方案开发商 BalkanID 宣布了 236 万美元的延期，使其种子轮融资总额达到 810 万美元。BalkanID 开发了一个为云原生环境构建的人工智能驱动的智能访问治理平台，该平台使公司能够识别和补救与权限在其 SaaS 和云环境中蔓延相关的潜在风险，之前成为企业的威胁。其基于订阅的平台利用数据科学提供对风险权利的可见性，并结合使用人工智能、决策支持和工作流程自动化来简化访问审查和认证过程。

人工智能语音初创公司 Sanas 因其过滤或改变呼叫中心员工口音的算法而面临批评

******\[摘要\]******:Sanas 认为，它的技术可以通过消除偏见和限制电话交谈中的误解来增强呼叫中心员工的能力。批评者说这是擦除，它的人工智能软件修改了发声中的语音，将一个人的声音翻译成没有明显的口音或不同的口音。

英国政府发布新的人工智能安全指南

******\[摘要\]******:英国领先的安全机构发布了新指南，旨在帮助开发人员和其他人根除和修复机器学习 (ML) 系统中的漏洞。GCHQ 的国家网络安全中心 ( NCSC )为任何希望减轻可能的对抗性机器学习 (AML) 的组织汇总了机器学习安全原则。AML 攻击利用 ML 或 AI 系统的独特特性来实现各种目标。随着该技术进入越来越重要的系统范围，支持医疗保健、金融、国家安全等，反洗钱已成为一个更加紧迫的问题。“从根本上说，软件安全依赖于对组件或系统如何工作的理解。这允许系统所有者测试和评估漏洞，然后可以缓解或接受漏洞，” NCSC 数据科学研究负责人 Kate S.“不幸的是，使用 ML 很难做到这一点。使用 ML 正是因为它使系统能够自行学习如何从数据中获取信息，而无需人类开发人员的监督。由于模型的内部逻辑依赖于数据，因此它的行为可能难以解释，而且通常很难（甚至不可能）完全理解它为什么会这样做。”

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20220103000000000-ai20223](https://haxitag.com/brief/ai-brief-20220103000000000-ai20223)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
