全部案例研究

MiniMax M2.7开源

MiniMax M2.7模型开源,在SWE-Pro和Terminal Bench 2基准测试中表现出色,具备复杂代理构建和生产力任务完成能力,推动模型和组织自我进化。

#软件开发#办公软件#娱乐#SWE-Pro基准测试得分56.22%#Terminal Bench 2基准测试得分57.0%
73 浏览·0

ERNIE 5.1发布

百度发布ERNIE 5.1,在Arena搜索排行榜上表现优异,训练成本仅为竞争对手的6%,展现AI技术高效与经济性。

#搜索技术#AI模型优化#Arena搜索排行榜第4位#训练成本降低至竞争对手的6%
45 浏览·0

OpenAI文档智能体MCP服务

OpenAI推出公共文档MCP服务器,允许智能体直接搜索和读取官方文档,集成到工作流程中,构建文档感知型助手,为互联网互联模式提供新范例。

#文档处理#智能体集成#提高文档处理效率#增强智能体功能
53 浏览·0

OpenAI语音模型升级

OpenAI发布GPT-Realtime-2、GPT-Realtime-Translate和GPT-Realtime-Whisper,提升实时语音推理能力,支持多语言翻译和流式转录,应用于房地产、旅行和客户支持等领域,引领AI语音交互新时代。

#房地产#旅行#客户支持#实时语音推理能力提升15个百分点#支持70多种语言翻译
45 浏览·0

NPM供应链攻击防范

本案例探讨因copy.fail漏洞导致的一系列安全问题,分析其影响,并提出通过暂停软件安装以防范供应链攻击的措施。

#软件开发#网络安全#降低供应链攻击风险#保护软件生态安全
42 浏览·0

OpenAI Codex Chrome 扩展

OpenAI Codex Chrome 扩展通过集成大型语言模型 Codex,提供代码补全、代码审查和文档生成等功能,提高开发者效率。

#软件开发#代码审查#代码补全准确率提升#代码审查效率提高
61 浏览·0

Cloudflare人工智能应用与裁员

Cloudflare通过大规模裁员重组业务,以人工智能工具和智能工作流程为核心,探索新的运营模式,引发业界对人工智能影响岗位意义的关注。

#企业转型#人工智能应用#裁员约20%,超过1100名员工离开#第一季度营收达6.398亿美元,调整后收益高于预期
46 浏览·0

开源Petri工具

Anthropic开源内部一致性审计工具Petri,通过模拟用户对话探测AI模型的不一致性行为,为AI安全领域带来可重复测试,引发行业关注。

#AI安全审计#模型测试#14个模型测试#111条指令引发不协调行为
39 浏览·0

Scale AI获5亿美军事AI合同

Scale AI获得美国国防部5亿美元合同,用于军事人工智能系统数据准备、模型评估和红队演练,标志着Meta在人工智能领域的战略投资得到军方认可。

#军事人工智能#数据标注#合同金额增长五倍#AI支出增长40%
57 浏览·0

Chrome Gemini Nano模型争议

Chrome浏览器未经用户同意推送Gemini Nano AI模型,引发隐私和能耗争议,欧盟或视为违法。

#互联网隐私#欧盟法规#能源消耗增加#用户隐私受损
41 浏览·0