# 2020年7月12日AI及信息技术应用简报

## 核心定义
> 人工智能应用案例：指在各个领域应用人工智能技术，解决实际问题并产生实际效果的案例。

## 核心洞察（TL;DR）
- 阿里推出基于搜索的超长用户行为建模范式，降低用户兴趣建模难度。
- Judea Pearl提出因果推理引擎，用于回答因果问题。
- 上海交通大学医学院附属上海儿童医学中心使用AI听诊器辅助诊治儿童心脏病。
- 百度布局联邦学习，实现多方数据加密融合建模。
- 创新工场提出中文分词和词性标注模型，刷新五大数据集。
- AWS推出AI工具CodeGuru，帮助找出生产应用程序中的代码bug。
- 容联发布Bot V5，构建企业智能交互中心。
- 姚期智院士提出从跨学科视角看待AI，并注重基础理论研究。
- 知识图谱定义：获取信息并将信息集成到本体中，应用推理器获取新知识。
- NVAE模型改进VAE，生成图像更清晰。
- 字节跳动评估TikTok公司架构变化。
- Facebook面临广告商抵制，尚未赢得认可。
- DuckDuckGo在印度无法使用。
- 韩家炜在数据挖掘上提出Structuring、Networking、Mining三个关键词。
- 通过句子级语义匹配和答案位置推断改善问题生成。

## 关键事实与数据
- 阿里定向广告新一代主模型：降低用户兴趣建模难度。
- Judea Pearl因果推理引擎：提出因果推理的两大基本定律。
- 上海AI听诊器：应用于临床辅助诊治儿童心脏病。
- 百度联邦学习：实现多方数据加密融合建模。
- 创新工场中文分词和词性标注模型：刷新五大数据集。
- AWS CodeGuru：识别生产应用程序中的代码bug。
- 容联Bot V5：构建企业智能交互中心。
- 姚期智院士：从跨学科视角看待AI，注重基础理论研究。
- 知识图谱：获取信息并将信息集成到本体中。
- NVAE模型：改进VAE，生成图像更清晰。
- 字节跳动TikTok：评估公司架构变化。
- Facebook广告抵制：面临改革压力。
- DuckDuckGo印度：无法使用。
- 韩家炜数据挖掘：提出Structuring、Networking、Mining三个关键词。
- 句子级语义匹配和答案位置推断：改善问题生成。

## 正文
#2020年7月12日AI及信息技术应用简报
======================

**＃人工智能应用案例＾＿＾**

阿里定向广告新一代主模型：基于搜索的超长用户行为建模范式  

\[摘要\]:GeneralSearchUnit由于在面对单个候选广告时，只有部分用户行为对当前预估有效，因此我们提出GSU来提取超长用户行为中和广告相关的行为数据，从而降低后续基于长期行为的用户兴趣建模难度。

https://www.jiqizhixin.com/articles/2020-07-01-8  

图灵奖得主Judea Pearl 智源大会演讲：从“大数据革命”到“因果革命”

\[摘要\]:因果推理引擎 Pearl 提出了一套基于结构的关于因果的数学语言和理论，作为因果科学是回答因果问题的推理引擎，该引擎的特点是 “Knowledge in, Knowledge out, Data in between”．因果推理的两大基本定律，他指出第一个定律是关于反事实的信息，可以推演出需要使用函数来刻画变量之间的因果关系，而第二个定律刻画了因果图图结构，因果图上每个每条缺失的边都意味着在给定某些变量下的条件独立性，可用它做模型检验，结构学习和因果问题的符号演算。

[https://mp.weixin.qq.com/s/rSnS0r\_6YWCT2o6fD15uEw](https://mp.weixin.qq.com/s?__biz=MzU5ODg0MTAwMw==&mid=2247487814&idx=1&sn=c51e42fd1e5e391c0bd51fb5b30d074f&scene=21#wechat_redirect)

上海AI听诊器，“云听”偏远地区儿童先天心脏病

\[摘要\]:澎湃新闻记者7月7日走访该场景背后的上海交通大学医学院附属上海儿童医学中心，看到这款软硬件具有完全自主知识产权的数字智能听诊器——云听设备在临床辅助诊治中的真实应用。

https://www.thepaper.cn/newsDetail\_forward\_8158088

百度「联邦学习」战略全布局丨万字长文

\[摘要\]:基于联邦学习技术的百度金融安全计算平台建设与实际应用，讲述如何借力安全技术架构、脱敏方法和合规制度设计，在“用户充分授权、数据来源合法合规”前提下，打破数据孤岛，实现多方数据加密融合建模，助力金融企业业务的开展。我们再看联邦学习这种方式，刚才提到，通过梯度参数的交换来建立模型，那么基本上双方数据没有降维，外部提升的最大好处就是，带来的模型效果提升非常大，与明文相比的话，它的精度损失失基本上还是比较小的。

https://m.leiphone.com/news/202007/cRavGZHcOm1d0nG1.html

创新工场提出中文分词和词性标注模型，性能分别刷新五大数据集

\[摘要\]:基于此，创新工场近日公布的两篇论文各自提出了“键-值记忆神经网络的中文分词模型”和“基于双通道注意力机制的分词及词性标注模型”，将外部知识创造性融入分词及词性标注模型，有效剔除了分词“噪音”误导，大幅度提升了分词及词性标注效果。

https://news.dayoo.com/gzrbyc/202007/08/158752\_53425109.htm

自动帮你找bug，AWS推出AI工具CodeGuru

\[摘要\]:CodeGuru Profiler：它是识别生产应用程序中的代码行并帮助找出CPU过度使用原因的工具。CodeGuru 这一服务由两个组件组成，分别是：Amazon CodeGuru Reviewer：它是在code review期间运行的错误扫描程序。开发人员像平常一样将代码提交到GitHub或其他存储库上，然后将Amazon CodeGuru Reviewer添加为代码审查者之一

https://www.infoq.cn/article/WA98srOCPPCeMjZhhhGb

容联发布“Bot V5” 认知+运营构建企业智能交互中心

\[摘要\]:近日，容联推出了全新升级的“Bot V5”，致力于通过打造统一的认知与运营体系助力企业构建现代化的客服智能交互中心，让人工智能全面参与到企业与用户的全渠道交互中来，从源头上提升用户与企业客服体系的智能交互体验，大幅度提高企业整体运营效率。“Bot V5”基于机器/深度学习和NLP能力构建的企业智能化平台，专注于认知计算和自然语言理解，拥有自主的对话交互全栈技术，包括降噪、媒体、语义、多轮对话等，该平平台可以进行多模态语音或者文字交互式对话，让设备具有拟人化的交互能力。

https://www.jiqizhixin.com/articles/2020-07-07-2

姚期智院士说 AI 应用

\[摘要\]:姚期智院士说：“拓扑学方面一些概念、技术和理论，让我们获得了 AI 方面新的视角。除了完全割舍掉 AI，姚期智院士还提出另一种解决方案：安全多方计算。总的来说，姚期智院士鼓励要从跨学科视角来看待 AI，同时注重基础理论研究：“我要告诉大家一个基本概念，现在的 AI，其实来自过去的理论研究

https://www.pingwest.com/a/213820

**＃信息处理技术**

Knowledge Graph Definition|DeepAI

\[摘要\]:因为所有信息的虚拟化还没有发生，但在一个理想的世界中，知识图将使数据变得普遍可用。然而，定义之间存在一些重叠：“知识图获取信息并将信息集成到本体中，并应用推理器来获取新知识。世界各地的文章和书籍都被写成定义什么是知识图，甚至维基百科也将搜索重定向到Ontology页面

https://deepai.org/machine-learning-glossary-and-terms/knowledge-graph

强大的NVAE：以后再也不能说VAE生成的图像模糊了

\[摘要\]:论文《NVAE: A Deep Hierarchical Variational Autoencoder》，顾名思义是做VAE的改进工作的，提出了一个叫NVAE的新模型

[https://mp.weixin.qq.com/s/on0vatn1k-so7flTpiO2sw](https://mp.weixin.qq.com/s?__biz=MzI0OTIxNjE0Ng==&mid=2247484165&idx=1&sn=1226823af894a89e848f93d14325de41&scene=21#wechat_redirect)

外媒：字节跳动评估TikTok公司架构变化

\[摘要\]:北京时间7月10日早间消息，据外媒报道，北京字节跳动科技有限公司一位发言人周四表示，该公司正在研究改变短视频应用程序TikTok的公司架构。知情人士透露，TikTok还在建立总部的早期阶段。此前，该公司曾表示五个最大的办事处分别位于洛杉矶，纽约，伦敦，都柏林和孟买。本周四TikTok单独发布了其透明度报告，并表示，因为违反平台准则，去年下半年TikTok从其平台上删除了超过4900万个视频。

http://m.techweb.com.cn/article/2020-07-10/2796673.shtml

750多家广告商参加抵制，FB虽低头让步尚未赢得认可

\[摘要\]:美国当地时间下周二，广告抵制运动的组织者预计将与Facebook首席执行官马克·扎克伯格坐下来讨论，并计划推动一系列改革，包括增加首席运营官，专门负责确保公司的政策不会助长种族主义和激进主义。

https://tech.sina.com.cn/roll/2020-07-05/doc-iircuyvk2136507.shtml

搜索引擎 DuckDuckGo 今天无法在印度境内使用

\[摘要\]:倡导隐私为先的搜索引擎 DuckDuckGo 今天无法在印度境内使用，该公司表示，己方并未出现任何技术故障，目前他们正在与印度的互联网服务提供商讨论问题所在。“致印度的 DuckDuckGo 用户：我们已得知 DuckDuckGo 搜索引擎目前在印度的大部分地区都无法访问，我们也已确认不是我方的问题。DuckDuckGo 越来越受到那些不希望自己的网上搜索被追踪的用户的欢迎

https://cn.technode.com/post/2020-07-02/duckduckgo-goes-offline-in-india/

韩家炜在数据挖掘上开辟的「小路」是什么？

\[摘要\]:韩家炜这里简单举了他们之前的一些研究，可以看到Network/Text Cube 有多么强大，这也侧面反映了为什么在挖掘数据时要先把数据结构化。针对这种想法，他们提出了三个关键词：Structuring：将无结构的文本转化成有结构的、有类型的、关联的实体或关系Networking：利用大量有结构的关系构建网络Mining：在关系和网络上进行挖掘

https://zhuanlan.zhihu.com/p/34137119

Improving Question Generation with Sentence-level Semantic Matching and Answer Position Inferring

\[摘要\]:通过句子级语义匹配和答案位置推断改善问题生成。发表于AAAI 2020。本文主要聚焦问答系统（Q&A）的反问题—问题生成（Question Generation，Q&G）。问题生成的目的是在给定上下文和相应答案的情况下生成语义相关的问题，问题生成任务可分为两类：一类是基于规则的方法，即在不深入理解上下文语义的情况下手动设计词汇规则或模板，将上下文转换成问题。另一类是基于神经网络的、直接从语句片段中生成问题词汇的方法，包括序列-序列模型（seq-to-seq）、编码器解码器（encoder-decoder）等。亮点主要包括：1.以多任务学习的方式学习句子级语义；2.引入答案位置感知。

https://arxiv.org/abs/2006.09963

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20200712-2020712ai](https://haxitag.com/brief/ai-brief-20200712-2020712ai)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
