# AI及信息技术应用2023年11月05日简报

## 核心定义
> 人工智能技术在产品创新、大模型和嵌入模型发展、AI开发者和企业合作以及监管合规方面的应用和进展。

## 核心洞察（TL;DR）
- 产品创新方面，xAI发布Grok，Hugging Face发布transformers 4.35.0，OpenAI发布ChatGPT重大更新，Flatfile收购Chatcsv Inc.，Jina AI推出8K文本嵌入，百川智能推出Baichuan2-192K模型，Perplexity发布新模型，DeepMind更新AlphaFold，Microsoft投资AI稳定云业务，Quora推出POE BOT收入分成计划，Cohere推出Embed v3，百川智能推出Baichuan2-192K，智谱AI开源ChatGLM3，Induced AI推出AI原生浏览器RPA平台，谷歌推出Duet AI，知乎推出知海图AI大模型，文因互联发布大模型一体机，亚马逊测试人形机器人Digit，Voyage项目优化嵌入模型。
- 监管与合规方面，联合国设立高级别咨询机构，中美欧签署安全发展协议，谷歌提供图像事实核查工具，Meta引入不可见水印系统。
- AI产品广告投入增长550%，Brave浏览器推出AI助手Leo，Canva新增文本生成视频功能，文心一言推出付费计划。

## 关键事实与数据
- xAI发布Grok，拥有25000 Tokens的上下文窗口，基于886.03GB的The Pile数据库和Exabytes数据库微调。
- Hugging Face的transformers 4.35.0版本新增支持NEFTune，提升微调后模型能力。
- 微软论文显示GPT-3.5-turbo是20B参数模型。
- OpenAI开发者大会发布ChatGPT重大更新，包括自定义聊天机器人、企业订阅服务。
- OpenAI的生成式AI可将SDLC开发团队生产力提高45%，集成将完成任务的时间缩短31%。
- Flatfile收购Chatcsv Inc.，实现突破性增长，拥有数千名用户。
- Jina AI推出8K文本嵌入，支持8192个代币上下文长度。
- 百川智能推出Baichuan2-192K模型，上下文长度达到192k，约35万字。
- Perplexity发布pplx-7b-chat和pplx-70b-chat模型，获得5000万美元融资。
- DeepMind的AlphaFold更新，可预测多种分子的结构。
- Microsoft的Copilot用户超过100万，扭转云计算产品增长放缓局面。
- Quora推出POE BOT收入分成计划，每月订阅最多可赚取20美元。
- Cohere推出Embed v3，支持100多种语言跨方言搜索。
- 百川智能Baichuan2-192K上下文窗口长度为192K，是目前全球最长的。
- 智谱AI开源ChatGLM3，成为国内首个对标OpenAI全模型产品线的公司。
- Induced AI获得OpenAI CEO Sam Altman等知名投资者支持。
- 谷歌推出Duet AI，提供多项智能功能。
- 知乎推出知海图AI大模型，具备多模态处理能力。
- 文因互联发布大模型一体机，支持40+开箱即用应用。
- 亚马逊测试人形机器人Digit，用于仓库搬运手提箱。
- Voyage项目优化嵌入模型，在MTEB测试数据集上实现SOTA成绩。
- AI产品广告投入第三季度增长550%，广告商数量激增。
- Brave浏览器推出AI助手Leo，提供交互式文章摘要。
- Canva新增文本生成视频功能，用户每月获得50个生成积分。
- 文心一言推出付费计划，单月购买价格为59.9元/月。

## 正文
AI及信息技术应用2023年11月05日简报
======================

 本周人工智能技术应用和产业创新方面的主要内容涵盖了产品创新、大模型和嵌入模型的发展、AI开发者和企业的合作，以及尤其是相关产品广告支出的快速增长，也意味着应用的范围、产品创新的规模有相当的发展。

人工智能监管和合规方面的主要内容涵盖联合国设立高级别咨询机构，全球专家合作，中美欧签署安全发展协议，谷歌提供图像事实核查工具，Meta引入不可见水印系统。这反映了国际社会对AI技术的关切，强调确保安全、可信赖和合规的AI应用，以抵制虚假信息传播、保护用户权益，这些方面共同推动了人工智能领域的进步和多领域的应用。

**1，产品创新**

马斯克xAI的首个产品Grok发布

\[摘要\]x.AI发布了首个产品Grok，这是一个大型语言模型，拥有25000 Tokens的上下文窗口，极快的响应速度，基于886.03GB的The Pile数据库和Exabytes数据库微调，将提供API、图像识别和音频识别，以及将在Tesla中运行的本地版本。此举让x.AI整合数字和物理世界的数据，帮助改善自动驾驶技术。x.AI强调安全和透明度，提倡开放合作和公众参与，力求减少不平等和确保AI的广泛可靠性。这一产品将成为ChatGPT的竞争对手，标志着AI取得了重要进展，实现了通用智能。

huggingface发布 transformers 4.35.0

\[摘要\]在这个版本的 transformers' Trainer API 中，新增支持 NEFTune 。NEFTune是一个微调扩展，在指令微调期间，向词嵌入（word embeddings）添加均匀的随机噪声，可以明显提升微调后模型的能力。

微软论文一张截图暴露GPT-3.5-turbo是20B参数

\[摘要\]研究人员在微软一个研究代码扩散模型的研究小组的论文中写道，gpt-3.5-turbo（ChatGPT 背后的模型）是一个 20B 参数的模型。据说最初的模型有 175B 个参数，因此可能进行了再训练或提炼。

OpenAI 将于 11 月 6 日举行的开发者大会上发布 ChatGPT 的重大更新

\[摘要\]OpenAI的开发者大会宣布了ChatGPT的重大更新，包括自定义聊天机器人、企业订阅服务，以及与Google和Microsoft的连接功能。这次首次举办的开发者大会还展示了ChatGPT的新界面和功能，引入了Gizmo工具，允许用户创建、管理和选择自定义机器人。Gizmo还提供了各种功能，包括沙盒测试、自定义操作、知识文件添加、基本工具、数据分析、草稿保存、发布和共享聊天机器人。通过“魔术创造者”用户可以定义聊天机器人的行为，实时测试并迭代修改。此外，OpenAI推出了企业订阅和工作空间管理功能，团队计划提供了高级访问、更长上下文和高级数据分析等额外好处。工作空间功能提供了分隔，允许定义角色和元数据，并整合外部ERP和CRM系统。ChatGPT的“上下文连接器”还能够链接Google Drive和Microsoft 365，允许文件和数据用于聊天上下文。这些更新将丰富ChatGPT的功能和应用。

生成式人工智能：重新定义软件开发的经济学

\[摘要\]一项新研究显示Open AI 的生成式 AI 可以将整个 SDLC（软件开发生命周期）开发团队的生产力提高多达 45%。集成将完成任务的时间缩短了 31%。

Flatfile 收购 AI 初创公司 Chatcsv Inc.，进一步扩大在 AI 辅助数据交换领域的领导地位

\[摘要\]工智能辅助数据交换的先驱 Flatfile 宣布收购人工智能初创公司 Chatcsv Inc.。自发布以来，ChatCSV 在短短几个月内就实现了突破性增长，已经拥有数千名用户。从宝洁（Procter & Gamble）和[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)（McKinsey）等全球企业到Zapier、Quora和Vimeo等科技公司，公司都依靠ChatCSV来快速、了解CSV文件和电子表格的上下文。

Jina AI 推出全球首款开源 8K 文本嵌入，可与 OpenAI 相媲美

\[摘要\]位于柏林的公司 Jina AI 推出了其第二代文本嵌入模型 jina-embeddings-v2，成为第一个支持 8K（8192 个代币）上下文长度的完全开源产品。这很重要，因为 Jina V2 在大规模文本嵌入基准 （MTEB） 排行榜上与 OpenAI 专有模型 text-embedding-ada-002 的功能和性能相匹配。值得注意的是，在数据集中，Jina 的模型在分类平均值、重新排名平均值、检索平均值和摘要平均值方面优于 OpenAI 模型。扩展的 8K 上下文长度可以提高在各个领域的利用率，包括法律、医学研究、财务预测和对话式 AI。这些模型可在 Huggingface 上免费下载，Jina AI 提供两种尺寸选项，一种用于重型任务的基本模型，另一种用于轻量级应用的较小模型。

百川智能推出 Baichuan2-192K 模型，上下文长度达到了 192k，大约 35 万汉字的长度

\[摘要\]动态采样的位置编码优化4D并行的分布式方案同步提升窗口长度和模型性能超长上下文窗口意味着更高的算力需求和更大的显存压力。Baichuan2-192K正式开启内测已落地法律、媒体等诸多真实场景Baichuan2-192K现已正式开启内测，以API调用的方式开放给百川智能的核心合作伙伴，已经与财经类媒体及律师事务所等机构达成了合作，将Baichuan2-192K全球领先的长上下文能力应用到了传媒、金融、、法律等具体场景当中，不久后将全面开放。

Perplexity发布自己训练的模型

\[摘要\]Perplexity还是开始自己训练模型了，公布了自己训练的两个pplx-7b-chat 和 pplx-70b-chat模型。主要的特点是优先保证一系列任务的智力、有用性和多功能性，而不强加道德判断或限制。与llama-2-70b-chat相比较完全拒绝”的情况减少了22.7%，而“没有拒绝”的情况增加了31.9%。估计是被 Open AI 和 Claude 2的各种拒绝回答搞麻了，他们做搜索和一些 Agents 功能确实比较烦这种。同时上周Perplexity 新获得 5000 万美元融资，目前估值为 5 亿美元。风险投资公司IVP领投。

DeepMind 的 AlphaFold 更新推进药物发现

\[摘要\]DeepMind 刚刚发布了AlphaFold 2 的更新，它现在可以预测蛋白质以外的多种分子的结构，从而解锁新的药物发现能力。AlphaFold 现在可以预测生物学中几乎所有编目分子的 3D 结构，包括 DNA、RNA 和小分子。该更新解锁了对蛋白质相互作用、细胞信号通路和基因组编辑工具等复杂系统的新理解。研究人员预计 AlphaFold 的升级有潜力快速推进疾病研究、药物开发、合成生物学和其他科学领域。

Microsoft的人工智能投资如何稳定其云业务

\[摘要\]ZDNet报道了Microsoft首席执行官萨蒂亚·纳德拉（Satya Nadella）的有趣静态。“我们在 37,000 多个组织中拥有超过 100 万付费 Copilot 用户，这些组织订阅了 Copilot for Business，在美国以外的地区具有很大的吸引力。”《纽约时报》报道，Microsoft的季度业绩也“显示出早期迹象，表明该公司在生成式人工智能方面的投资开始提振销售，最明显的是扭转了该公司重要的云计算产品增长放缓的局面。在截至 9 月的三个月中，该公司的销售额为 565 亿美元，同比增长 13%。利润达到 223 亿美元，增长 27%。这一结果超出了分析师的预期，也超出了Microsoft自己的估计。

QUORA 提供收入分成以扩展 POE BOT 生态系统

\[摘要\]Quora 的对话式人工智能平台 Poe 推出了一项新的收入分享计划，当机器人开发者的创作带来新的 Quora 应用订阅时，他们将向他们提供补偿。机器人创建者现在每月订阅最多可赚取 20 美元，每年订阅可赚取 10 美元，这些收入是通过用户与机器人互动而产生的。Quora 还计划很快让创作者能够设置每条消息的费用，为每次用户互动提供定期支付。

Cohere 首次推出用于搜索的 Embed v3  

\[摘要\]人工智能初创公司 Cohere 发布了一个名为 Embed v3 的新模型，这是查询嘈杂的现实世界数据的重大行业升级。该版本还显着提高了 AI 写作工具的检索能力，同时该模型的多语言版本支持 100 多种语言进行跨方言搜索。

百川智能推出全球最长上下文窗口大模型Baichuan2-192K，一次可输入35万字超越Claude2

\[摘要\]10月30日，百川智能发布Baichuan2-192K大模型，上下文窗口长度高达192K，是目前全球最长的上下文窗口。Baichuan2-192K能够一次处理约35万个汉字，是目前支持长上下文窗口最优秀大模型Claude2（支持100K上下文窗口，实测约8万字）的4.4倍，更是GPT-4（支持32K上下文窗口，实测约 2.5万字）的14倍。

智谱AI开源第三代ChatGLM3！作为国内首个全线对标OpenAI产品线的公司

\[摘要\]在10月27日的2023中国计算机大会（CNCC）上，智谱AI还开源了ChatGLM3-6B（32k）、多模态CogVLM-17B、以及智能体AgentLM。 ChatGLM3系列模型发布后，智谱成为国内唯一一个有对标OpenAI全模型产品线的公司， 生成式AI助手智谱清言，也成为国内首个具备代码交互能力的大模型产品。

Induced AI：一个专门为自动化任务而设计的AI原生浏览器RPA平台

\[摘要\]最近获得了OpenAI CEO Sam Altman等知名投资者的支持。该平台模拟人类浏览网页的行为，自动化网页浏览、信息搜集、处理和分析，支持多种任务，包括数据抓取、自然语言理解、多任务处理、交互式任务执行和定制化服务。其主要功能包括自动化网络浏览、数据抓取和处理、自然语言理解、集成学习等。Induced AI的工作流程包括自动化和委托任务描述、认证和访问授权、激活工作流程、接收通知和数据输出、以及启动虚拟代理军团。

谷歌最近推出了Duet AI

\[摘要\]Duet AI是一款强大的工具，与谷歌产品集成，提供多项智能功能。它能在几秒内为幻灯片创建自定义图片，改进谷歌Meet，包括智能笔记和总结功能。此外，它在谷歌Chat中充当智能助手，能整理文件、回答问题，提供聊天更新。Duet AI还支持生成谷歌表格计划，协助组织和管理数据。工作空间提示功能简化文件交流，合成报告，加速任务完成。它还提供简化的代码助手，优化编码工作，同时深度整合谷歌工作空间，提供丰富的AI驱动应用。

知乎“知海图AI”大模型宣布开放服务，将赋能多个业务场景

\[摘要\]11月4日，知乎宣布旗下的“知海图AI”大模型即将面向社会公众开放服务，知乎将择机上线相关产品，持续赋能创作者、讨论场、信息获取、内容运营等各项业务场景。此外，除了优秀的大语言模型能力，“知海图AI”还具备强大的多模态处理能力，助力知乎实现会员故事智能配图，赋能会员业务发展。

携手中科可控，文因互联发布大模型一体机

\[摘要\]文因互联是一家AI知识管理解决方案服务商，以大模型技术为基座，结合 NLP、提示学习、知识图谱等技术，通过多年行业实践积累，实现对业务文本进行文档解析、智能信息提取、智能内容生成、深度语义理解与关联分析，致力于企业知识的深度挖掘与有序传承，进而助力企业实现提高工作效率，沉淀知识工程。文因大模型：各类场景+开箱即用文因互联立足金融，辐射航空医疗、媒体、建筑、房产等行业，40+开箱即用应用，高效支撑客户户业务场景。

亚马逊正在其美国仓库测试人形机器人

\[摘要\]亚马逊正在试验名为Digit的人形伙伴，用于在仓库中搬运手提箱。这是亚马逊将机器人技术整合到其广泛业务中的一部分。尽管有担忧称其150万劳动力可能会失业，但亚马逊机器人公司首席技术专家泰伊·布雷迪否认了这种说法，强调新的角色将出现以取代过时的工作。这代表了亚马逊在机器人领域的发展和创新，而不仅仅是抢夺工作的故事。

Voyage项目：领先OpenAI的优化嵌入模型

\[摘要\]马腾宇领导的项目被命名为Voyage，专门为RAG（检索增强生成）优化嵌入模型。Voyage在常用的MTEB测试数据集上表现出色，实现了SOTA（State of the Art）成绩，比OpenAI高出0.5个百分点。这个项目的成立受到了对嵌入模型的重视，团队包括斯坦福人工智能实验室主任Christopher Manning、著名AI学者李飞飞等三名教授担任学术顾问。马腾宇表示，他们已经创建了目前最出色的嵌入模型，甚至超越了OpenAI，同时还提供了为特定领域或企业定制的模型。

DeepMind 的 AlphaFold 更新推进药物发现

\[摘要\]DeepMind 刚刚发布了AlphaFold 2 的更新，它现在可以预测蛋白质以外的多种分子的结构，从而解锁新的药物发现能力。AlphaFold 现在可以预测生物学中几乎所有编目分子的 3D 结构，包括 DNA、RNA 和小分子。该更新解锁了对蛋白质相互作用、细胞信号通路和基因组编辑工具等复杂系统的新理解。研究人员预计 AlphaFold 的升级有潜力快速推进疾病研究、药物开发、合成生物学和其他科学领域。

仅属于 AI 的盛宴：三季度 AI 产品广告投入增长550%

\[摘要\]科技公司和初创公司今年在人工智能产品广告上投入了至少 4000 万美元，仅第三季度就投入了超过 3500 万美元，同比增长 550%。这些产品的广告商数量激增，从 2022 年的 80 个增加到 2023 年的 180 多个，增长了 135%。但值得注意的是，迄今为止，今年总支出中约 3600 万美元的支出仅占 6% 的广告商，其余 94% 的人仅花费 400 万美元。

**2，产品创新**

Brave 的浏览器原生 AI 助手 Leo 现在提供 Nightly 版本进行测试

\[摘要\]在 Brave Search AI Summarizer 成功的基础上，我们在浏览器侧边栏中提供了 Leo 作为配套工具。Leo允许用户在不离开页面本身的情况下与他们正在访问的网页进行交互，例如，通过要求提供视频记录或交互式文章摘要。狮子座还可以提出后续问题，增加原创内容，甚至帮助阅读理解。Leo可以像其他人工智能聊天机器人一样回答问题，但直接在网页的体验中。

Canva 现在可以从文本生成视频

\[摘要\]Canva新增了文本转视频功能，用户只需在Canva中执行两个简单步骤即可生成视频。这一功能是Magic Studio的一部分，由Runway提供支持，Runway是RunwayML Gen-2的公司。用户只需在Canva网站上创建新设计，然后进入应用程序，搜索Magic Media。接下来，在视频选项卡中输入文本提示，等待生成完成。生成一个4秒的视频大约需要1-2分钟。用户每月将获得50个生成积分，这些积分每月重置一次，而生成一个视频将相当于一个学分。这一功能为用户提供了更多视频制作的自由度。

马斯克的 xAI 的第一款AI模型曝光，名为：Grōk

\[摘要\]Grok通过 X 平台实时访问信息！具有互联网浏览能力，能够搜索特定主题的最新信息。Grōk AI是一个多模态AI平台，具有多项卓越功能。它支持超长提示，响应速度极快，允许个性化设置语气，拥有广泛的知识库，实时搜索和API接口。该AI还具备语音、图像和音频处理能力，计划支持图像生成和识别。最引人注目的是它将在特斯拉汽车中本地运行。Grōk AI预计将成为备受欢迎的多模态AI平台，但初始访问权限将优先授予x Premium+会员。

文心一言推出付费计划

\[摘要\]在推出文心一言4.0后，百度正式开启了文心一言的收费计划，用户需要开通会员模式，开通后可解锁文心大模型4.0。文心一言会员单月购买价格为59.9元/月，连续包月价格为49.9元/月，文心一言+文心一格联合会员价格为99元/月。文心一言会员可享受文心大模型4.0、文生图能力全面升级、网页端高阶插件、App端单月赠送600灵感值等权益，文心一格会员可享受极速生成多尺寸高清图像、创作海报和艺术字、AI编辑改图修图等权益。

**3，监管与合规**

联合国秘书长组建高级别人工智能安全咨询机构，全球39名专家共商人工智能治理

\[摘要\]提出建议该机构当前的任务包括就风险和挑战建立全球科学共识，为利用人工智能实现可持续发展目标提供助力，以及加强人工智能治理方面的国际合作。

中美欧签署《布莱切利宣言》许诺安全发展人工智能

\[摘要\]《布莱切利宣言》是一项旨在安全发展人工智能的国际协议，由中国、美国、欧盟等20多个国家签署。宣言强调确保AI的安全，以建立公众信任。此外，美国宣布成立人工智能安全研究所，旨在减轻AI的潜在风险。尽管AI在医学和教育领域带来希望，但也可能对社会稳定构成威胁。一些AI领域的创始人呼吁制定国际条约，以减少潜在的灾难性后果。然而，制定保障措施需要在不限制创新的前提下进行，这是一个挑战。部分人对峰会的闭门会议和科技巨头主导表示遗憾。

谷歌宣布推出工具，帮助用户对图片进行事实核查

\[摘要\]在社交媒体上使用背景图像和视频导致了危险的错误信息传播。谷歌宣布将提供有关图像的更多上下文信息，以防止虚假信息传播。这套新工具包括查看图像的历史记录、元数据以及用户在不同站点上使用它的上下文。谷歌今年早些时候宣布了这些“关于这张图片”的功能，现在它正在向全球所有讲英语的人提供它。用户可以了解 Google 搜索首次“看到”图片的时间，从而了解上下文的新近度。该工具还可以让用户了解人们如何在其他网站上描述图像，以帮助揭穿任何虚假声明。

Meta 开发隐形水印以跟踪 AI 图像来源

\[摘要\]Meta发布了Stable Signature，这是一个为AI生成的图像添加不可见水印的系统，以便更容易进行识别。即使经过人工编辑，这种水印也可以被算法检测到。Meta计划将其整合到其开源AI模型中，并将其扩展到视频。潜在的业务影响包括Adobe、Shutterstock和Getty Images等公司可以使用Stable Signature来跟踪其模型在传播后的使用情况，以便追溯到特定用户，从而应对可疑的深度伪造或侵权行为。

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20231105-ai20231105](https://haxitag.com/brief/ai-brief-20231105-ai20231105)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
