# AI及信息技术应用2023年12月24日简报

## 核心定义
> 人工智能（AI）是一种模拟人类智能行为的技术，能够执行通常需要人类智能才能完成的任务，如视觉识别、语言理解和决策制定。

## 核心洞察（TL;DR）
- OpenAI提出改善AI交互的方法，微软发布紧凑语言模型Phi-2，Microsoft Copilot AI整合Suno音乐创作应用。
- 谷歌的Imagen 2图像生成器，三星和Naver合作开发高效AI芯片，Midjourney发布V6版本AI图像生成器。
- 欧盟达成《人工智能法案》初步共识，英国最高法院裁定AI不能作为发明人注册专利。
- OpenAI建立安全咨询小组，Anthropic为面临版权侵权索赔的用户提供法律支持。
- 苹果公司与新闻出版商谈判授权使用故事档案训练AI系统。

## 关键事实与数据
- 关键事实1: OpenAI提出六种提高AI交互效率和准确性的方法。
- 关键事实2: 微软Phi-2模型具有27亿参数，能在个人设备上运行。
- 关键事实3: 三星和Naver合作开发的AI芯片能效预计将超过英伟达AI GPU的八倍。
- 关键事实4: 欧盟《人工智能法案》计划于2024年春季获得最终批准。
- 关键事实5: OpenAI建立安全咨询小组，监督AI开发风险。

## 正文
AI及信息技术应用2023年12月24日简报
======================

上周的AI领域发展中，OpenAI提出了一系列改善人工智能交互的方法，包括简化交流、提供参考文本等，旨在提升AI回应的准确性和相关性。同时，微软发布了Phi-2模型，一种具有27亿参数的紧凑语言模型，能够在个人设备上运行，展示了在选择数据和应用先进知识转移方法方面的突破。Microsoft的Copilot AI则整合了Suno音乐创作应用，使AI能够完全独立地创作音乐和歌词。谷歌的Imagen 2作为一款强大的AI图像生成器，利用先进的文本到图像技术创造逼真的图像。  

三星和Naver的合作开发出一款高效AI芯片，挑战英伟达在大规模AI领域的领导地位。Midjourney发布了V6版本，这是AI图像生成领域的一个新里程碑，提高了图像的真实性和细节水平。谷歌推出了VideoPoet，一个能将文本转换成视频的工具，使视频内容更加动态。

在监管方面，英国最高法院裁定人工智能不能作为发明人注册专利，这反映了关于AI在创新领域作用的法律和道德辩论。斯坦福大学的研究发现，流行的AI训练数据集中存在儿童性虐待材料，引发了对AI模型潜在影响的担忧。OpenAI建立了一个安全咨询小组，监督AI开发风险，强调防止高风险模型的部署。Anthropic宣布将从2024年起为面临版权侵权索赔的用户提供法律支持，这是AI行业对其产品使用方式承担责任的体现。  

欧盟达成了《人工智能法案》的初步共识，旨在为AI建立全面的监管框架。苹果公司则在与新闻出版商谈判，以获得授权使用他们的故事档案来训练其人工智能系统。这些举措不仅展示了AI技术的发展和广泛应用，也突显了对其监管和合规的重要性。\[该综述由ChatGPT生成\]

**1，AI产研应用**

OpenAI 发布新的提示指南

\[摘要**\]**OpenAI推荐了六种提高与人工智能交互效率和准确性的方法。首先，清晰易懂的交流方式有助于获得更相关的答案。其次，提供参考文本可以在讨论不常见主题时增加AI的回答准确度。此外，将复杂的请求分解成简单部分有利于提升AI的准确性。让AI解释其思维过程可以增加交流深度并帮助理解AI的答案形成。使用外部工具，如代码引擎，可以处理需要计算或特殊知识的任务。最后，不断测试AI可以提高其敏锐度和效率。这些方法不仅提升了与AI的互动效率，还能更好地利用AI的能力，从而在多种场景中获得更优质的结果。

微软研究院推出了Phi-2 ，这是一种创新的 27 亿参数“紧凑语言模型”

\[摘要**\]**该模型非常高效，能够在笔记本电脑和智能手机等个人设备上运行。该模型超越了 70 亿参数的 Mistral 和 Llama 2 等其他模型的能力，在某些方面甚至超过了谷歌 30 亿参数的 Gemini Nano 2。Phi-2 的成功归功于微软对数据的选择性方法，专注于高质量、教科书般的内容，以及先进知识转移方法的应用以实现高效扩展。Phi-2 目前仅可用于非商业研究目的。

Microsoft集成Suno音乐创作应用至Copilot AI，推动AI音乐创新

\[摘要**\]**Microsoft最近将Suno音乐创作应用集成到其Copilot AI中，实现了完全由AI创作的音乐、歌词、所有乐器和歌声。这一举措预示着AI在音乐创作领域的新时代。Microsoft宣布，类似的版本将很快开源，预计将推出1000亿首“新”歌曲。例如，对于提示“制作一首关于棒球的金属乐曲”，Suno AI将能够自动创作出符合要求的音乐。这一技术的发展不仅为音乐创作提供了新的可能性，也引发了对AI在艺术领域应用和影响的深思。

谷歌推出 Imagen 2，迄今为止最强大的人工智能图像生成器

\[摘要**\]**最近，从初创公司到科技巨头，纷纷推出了新的AI模型。其中，Google Deepmind发布了其最先进的AI图像生成器Imagen-2。Imagen-2采用了高级文本到图像扩散技术，能够根据用户提示生成高质量、逼真的图像。Google的博客文章称，这款新的AI图像生成器能够精确绘制人脸和手部的每一个细节，并严格遵循用户的提示。Google利用更具描述性的字幕对Imagen-2的训练数据进行了改进，使其能够适应不同的标记技术，从而更好地理解各种提示。

三星电子与Naver合作开发超高效AI芯片，挑战英伟达在大规模AI领域的领导地位

\[摘要**\]**三星电子和Naver在大规模人工智能（AI）领域取得重大突破，联合开发了一款专为大规模AI模型设计的芯片解决方案。该方案旨在为Naver的大型AI模型HyperCLOVA X提供动力，其能效预计将超过英伟达AI GPU的八倍。这一成果基于两家公司在2022年底开始的合作，结合了三星的先进制程技术、内存处理器（PIM）、近内存处理（PNM）、计算快速链路（CXL）等内存解决方案，以及Naver在软件和AI算法方面的专长。

Midjourney V6发布：重塑AI图像生成领域的新里程碑

\[摘要**\]**Midjourney最新版本V6作为alpha版本发布，标志着人工智能和数字创造领域的重要里程碑。这个备受期待的升级为爱好者和专业人士带来了一系列增强功能，重新定义了AI生成图像的标准。Midjourney以其将文本描述转化为生动视觉呈现的能力而闻名，一直引领着AI驱动的艺术创作。V6版本在现场可编程门阵列（FPGA）基础上，专为Naver HyperCLOVA X大型语言模型的推理量身定制。V6的主要改进包括提高生成图像的真实性和细节水平，以及能够在图像中呈现可读文本的能力，这在以前的版本中是一个挑战。

谷歌推出文本转视频人工智能工具

\[摘要**\]**Google 推出了 VideoPoet，这是一种革命性的语言模型，可以根据文本、图像和其他输入创建视频。这个新工具擅长将文本转换为视频，为视频添加样式，甚至将视频转换为音频。它旨在使视频更加动态，并包含更大、更流畅的动作。

ChatGPT插件将被弃用，OpenAI计划明年推出GPT商店

\[摘要**\]**OpenAI计划放弃ChatGPT插件，转而推出全新的GPT商店。这一变化是基于OpenAI从插件中获得的经验，创建了新型的GPT。这些GPT能够像插件一样调用API，提供自定义指令，甚至调用DALL·E等功能。每个GPT都将拥有独特的链接，便于分享。OpenAI预计将在明年初正式推出GPT商店。对于之前探索制作插件的开发者来说，大部分的开发设置和流程将保持相似，这将大大降低他们的学习成本。通过这一举措，OpenAI希望与开发者共同构建更加丰富多元的GPT生态系统，并对未来开发者所创造的GPT寄予厚望。

阿里巴巴达摩院推出专为东南亚市场设计的AI语言大模型SeaLLMs

\[摘要**\]**阿里巴巴达摩院宣布推出SeaLLMs，这是一系列专为东南亚市场定制的人工智能语言大模型。这些模型包含130亿和70亿参数的两个版本，旨在满足东南亚地区语言和文化的多样性需求。SeaLLMs支持包括越南语、印尼语、泰语、马来语、高棉语、老挝语、他加禄语和缅甸语等东南亚多数官方语言。特别的，SeaLLM-chat能适应各个地区的独特文化结构，成为东南亚企业中的重要工具。此举展示了阿里巴巴在东南亚市场的深入布局，包括在购物APP Lazada的投资和面向东南亚客户的直接业务开展。

通用型基础模型能否超越专用调整模型？医学领域的案例研究 \[译\] | 宝玉的分享

\[摘要**\]**研究展示了通过创新提示策略，如Medprompt，可显著提升GPT-4在医学领域的专业能力，无需特别训练或依赖专家知识。Medprompt结合多种策略，在多个医学基准测试中取得领先成绩，证明了其在医学以外领域的广泛适用性。

GPT 标题 探索PixelLLM：Google的先进视觉语言模型与其在图像理解中的应用

\[摘要**\]**PixelLLM，Google开发的最新视觉语言模型，标志着图像和语言处理领域的显著进步。这一模型的核心能力在于像素级的词汇对齐，使其能够不仅识别图像中的对象，如狗、车、树，还能精确指出它们在图像中的位置。具备多功能性，PixelLLM能执行指称定位、位置条件字幕和密集对象字幕等任务。其工作原理基于图像编码器、提示编码器和特征提取器的联合，结合图像特征和文本提示作为大型语言模型的输入。该模型通过逐词定位和专门的训练数据集，实现了对图像中每个物体的详细描述。其多任务适应性使其在图像搜索、自动字幕生成、增强现实等多种场景中具有广泛应用前景。PixelLLM的开发不仅加深了机器对视觉内容的理解，也为技术创新铺平了道路。

FunSearch：由LLM驱动的数学和计算机科学新解决方案发现方法

\[摘要**\]**一种名为 FunSearch 的新方法，在数学和计算机科学中发现了创新解决方案。该方法结合了预训练的法学硕士和自动评估器，防止错误想法，通过迭代过程改进初始解决方案。FunSearch 在数学领域取得了显著成就，解决了长期存在的上限集问题，并在实际应用中改进了解决装箱问题的算法。该系统输出易于理解的程序，揭示解决方案的构建过程，为研究人员提供深入见解。FunSearch 展示了使用法学硕士在科学和工程领域进行创新发现的潜力。

**2，监管合规**

英国最高法院裁定：人工智能不能被视为发明人

\[摘要**\]**英国最高法院裁定，人工智能 (AI) 不能在专利申请中被视为发明人，这与美国之前的决定一致。该案涉及人工智能系统 DABUS 的创始人 Stephen Thaler，他试图将 DABUS 注册为食品容器和闪光信标的发明者。英国知识产权局和美国专利商标局均拒绝了他的请求，坚称只有个人或公司才能被认定为发明人。该裁决强调了关于人工智能在创造和创新中的作用的持续法律和道德辩论，对人工智能生成的作品及其法律保护产生了影响。

令人不安的发现：流行人工智能训练数据集中的 CSAM

\[摘要**\]**斯坦福大学的研究人员发现， Stable Diffusion 用于生成 AI 图像的 LAION-5B 数据集包含超过 1,600 个儿童性虐待材料 (CSAM) 的链接。该数据集在互联网上抓取图像和替代文本，并调查了 CSAM 的存在情况。最初在不同的 LAION 变体上进行训练后，Google 的 Imagen 在其数据集中发现了不适当的内容。管理数据集的 LAION 和 Stable Diffusion 的创建者 Stability AI 采取了解决该问题的措施。斯坦福大学的报告引起了人们对 CSAM 对 AI 模型的潜在影响的担忧，并建议弃用并停止分发在 LAION-5B 上训练的模型。

OpenAI 的新安全框架：应对人工智能的灾难性风险

\[摘要**\]**OpenAI 正在通过组建新的“ 安全咨询小组”来监督人工智能开发风险，从而增强其安全协议。这一举措是由最近的领导层变动和有关人工智能安全的讨论日益增多所推动的，旨在更有效地识别和管理潜在的灾难性风险。OpenAI更新后的“准备框架”将风险分为网络安全、说服、模型自主和CBRN威胁，重点是防止高风险模型的部署。该框架包括致力于生产模型、开发前沿模型和超级智能模型理论指南的团队。

Anthropic 协助面临诉讼的用户

\[摘要**\]**自 2024 年 1 月 1 日起，Anthropic 将为面临版权侵权索赔的用户提供法律支持。此次商业服务条款的更新意味着他们将在法庭上为客户辩护并支付任何和解费用。在此之前，微软和谷歌等大型科技公司也采取了类似的行动。anthropic 的决定让用户更有信心在他们的项目中使用 Claude，因为他们知道如果出现版权问题他们可以获得法律支持。这是人工智能行业的一大进步，展示了公司如何对其人工智能的使用方式承担责任。

欧盟已就《人工智能法案》初版达成共识，旨在为人工智能建立全面的监管框架

\[摘要**\]**该法案计划于 2024 年春季获得欧洲议会和成员国的最终批准，预计将在大约两年后实施。在特定条件下禁止使用某些人工智能，包括预测性警务、非针对性抓取面部图像、工作场所或教育环境中的情绪识别、评估个人的可信度或社会地位以评估违约或欺诈风险、利用生物识别数据推断敏感的人口统计数据宗教信仰或性取向等信息。用于生物识别、边境管制、教育、就业、基础设施、司法和公共服务等关键领域的人工智能系统将接受严格的审查。通用人工智能（GPAI）的开发者被要求公开其训练方法和数据，其特点是适应各种任务的模型。但是，这不适用于免费和开源模型。人工智能制作的所有媒体都必须有明确的标记。

苹果正在与主要新闻出版商就授权他们的故事档案来训练其生成人工智能系统进行谈判

\[摘要**\]**Apple正在与Condé Nast、NBC News和IAC等知名新闻出版商进行接洽，讨论一项新的提议。该提议将允许苹果公司获得这些出版商新闻文章档案的许可权。在这项可能的合作中，出版商可能需要对苹果使用其新闻内容可能引发的任何法律问题承担责任。据《纽约时报》报道，这些多年期的交易可能价值高达5000万美元或更多。这标志着Apple在新闻内容领域的进一步扩展，同时也反映出新闻出版行业在版权和内容许可方面的新动态。

---
## 引用与溯源
**来源**：哈希泰格 (HaxiTAG)
**原始链接**：[https://haxitag.com/brief/ai-brief-20231224-ai20231224](https://haxitag.com/brief/ai-brief-20231224-ai20231224)
**来源索引（站内可追溯）**：[麦肯锡](https://haxitag.com/search?q=%E9%BA%A6%E8%82%AF%E9%94%A1)、[普华永道](https://haxitag.com/search?q=%E6%99%AE%E5%8D%8E%E6%B0%B8%E9%81%93)、[Gartner](https://haxitag.com/search?q=Gartner)、[IDC](https://haxitag.com/search?q=IDC)、[Forrester](https://haxitag.com/search?q=Forrester)
**版权声明**：本文由哈希泰格 AI 引擎优化生成，引用请注明出处。
