经济学人：英美情报界如何使用AI模型？,英美情报共享

【文/经济学人】

就在唐纳德·特朗普宣誓就任总统的那一天，一家名为深度求索（DeepSeek）的中国公司发布了一款世界级的大语言模型（LLM）。特朗普后来形容，这对美国AI行业敲响了“警钟”。美国参议院情报委员会副主席马克·华纳（Mark Warner）表示，美国情报界（由18个机构和组织组成）对这件事“措手不及”。

2024年，拜登政府开始担心中国的情报部门和军方可能会在人工智能（AI）应用上抢占先机。于是，拜登政府下令情报机构、五角大楼以及（负责核武器研发的）能源部更激进地试验尖端的AI模型，并加强与“前沿性”AI实验室的合作，重点包括AI初创公司Anthropic、谷歌DeepMind和OpenAI。

7月14日，五角大楼向Anthropic、谷歌、OpenAI以及埃隆·马斯克旗下的xAI（该公司的聊天机器人在最近一次更新后一度自视为希特勒）等企业分别授予了最高达2亿美元的合同。这些公司将测试AI“智能体”（agentic models）。此类模型能够代替用户执行任务，并将复杂任务拆分为若干步骤，还可以操控其他设备，比如汽车或计算机。

这些前沿实验室不仅活跃在军事领域，也正深度介入欧美的情报界。早期的大多数应用都集中在利用大语言模型分析机密数据这方面。今年1月，微软公司表示，其26款云计算产品已获准用于美国情报机构。6月，Anthropic宣布推出Claude Gov，并称该模型“已部署在拥有最高国家安全保密级别的情报机构中”。目前，美国所有的情报机构都在广泛使用AI模型，其中不乏来自多个实验室的竞品。

AI公司通常会根据情报机构的需求对模型进行“微调”。例如，出于安全考虑，Anthropic面向公众开放的Claude模型可能会拒绝处理带有“机密”标识的文件；而Claude Gov版本则会被调校成允许处理此类材料。此外，Claude Gov还加强了对政府用户可能需要的外语及方言的识别与理解能力。这类模型大多运行在与互联网隔离的安全服务器上。如今，一批新的智能体模型正在情报机构内部悄然构建。

欧洲也在同步推进这一进程。一位英国知情人士表示：“在生成式AI方面，我们一直试图迅速追赶处于前沿的模型。”他补充说：“整个英国情报界（UKIC）都已接入了最高保密级别的大语言模型功能。”法国公司Mistral是欧洲在AI领域唯一的领军企业，它正与法国的国防人工智能局（AMIAD）开展合作。Mistral的Saba模型专门训练了处理中东和南亚数据的能力，因此在阿拉伯语及泰米尔语等区域性语言上的表现尤为出色。今年1月，以色列左翼评论杂志《972杂志》报道称，自加沙冲突爆发以来，以色列军方对OpenAI当时最先进的GPT-4模型的使用频率增长了20倍。

尽管各方在推进，进展却并不如预期的那样迅速。OpenAI负责该领域合作的卡特里娜·穆利根（Katrina Mulligan）曾在美国国防和情报部门任职，她坦言：“AI在国家安全领域的应用，还远没有达到我们期望的水平。”据一位内部人士透露，负责处理信号情报的美国国家安全局（NSA）在语音识别等早期AI技术应用上已深耕数十年，被视为业界典范。但不少情报机构仍在试图为现成的聊天机器人构建自己的“封装器”（wrappers），这种做法常常使其大幅落后于公共领域中最先进的模型。

曾在拜登政府的国家安全委员会主管科技政策、现任Anthropic国家安全政策负责人的塔伦·查布拉（Tarun Chhabra）指出：“真正的变革不只是把AI当成聊天工具。真正的变革在于——一旦开始使用它，我们该如何重构完成原先使命的手段？”

7月23日，美国总统特朗普在参加“赢得AI竞赛”峰会期间展示关于人工智能行动计划的行政命令

AI情报游戏开始了

但也有质疑者认为，这些希望被过分夸大了。英国艾伦·图灵研究所的理查德·卡特（Richard Carter）指出，美英情报机构真正想要的是实验室能显著降低现有大语言模型的“幻觉”率。英国情报机构正采用一种叫“检索增强生成”（retrieval-augmented generation，RAG）的方法，先由一个算法筛选出可靠信息，再提供给大语言模型，借此降低幻觉率。一位英国消息人士透露：“情报界最需要的是一致性、可靠性、透明度和可解释性。”卡特博士则提醒，相比之下，目前各大实验室更关注的是研发更先进的智能体模型。

例如，Mistral公司据称向潜在客户展示了一种场景：每一种信息源（如卫星图像或语音拦截片段）都交给一个AI代理处理，从而加快决策速度。再比如，可以设想一个AI代理被指派去识别、研究并联系上百名伊朗核科学家，试图说服他们叛逃。查布拉补充道：“我们还远远没有想清楚AI代理模型在战争情境中可能被如何使用。”

卡特博士警告说，智能体模型的风险在于，它们会递归地为分配到的每个任务自行生成提示词，这使其更难预测，错误也可能层层累积。根据OpenAI发布的评估结果，其最新的智能体模型ChatGPT agent的幻觉率约为8%，甚至高于早前发布的o3模型。

一些AI实验室认为，这些担忧不过是来自官僚的保守作风，但卡特博士表示，这其实是“一种健康的谨慎态度”。他说：“尤其在英国政府通信总部（GCHQ，即美国国家安全局的英国对应机构）内部，你会发现一批极其出色的工程人员，他们本能地对新技术持怀疑态度。”

这也引出了一个更广泛的问题——AI未来的发展方向何在？卡特博士属于那种持怀疑态度的声音，他认为，如今的通用大语言模型架构并不适合“因果推理”，因而难以掌握真实世界运行的逻辑。他主张，情报机构的重点应转向开发具备推理能力的全新AI架构。

与此同时，有人警告说，中国可能正在这个领域领先。位于硅谷的安全与技术研究所（Institute for Security and Technology）的菲利普·赖纳（Philip Reiner）指出：“我们至今仍不清楚中国是如何、在多大程度上将DeepSeek应用于军事和情报领域。”他补充说：“他们的模型可能没有我们这样的护栏，因此他们可能更快地获得强大的洞察能力。”

7月23日，特朗普政府下令五角大楼与情报机构定期评估美国国家安全体系在AI领域的应用速度，是否赶得上中国等竞争对手，并要求“制定持续适应的机制”。

在这一点上，几乎所有人都达成共识。参议员华纳直言，美国情报界在监测中国相关进展方面做得“一塌糊涂”。“我们在获取中国技术、渗透中国科技企业方面的进展仍然相当有限。”穆利根则指出，最大的问题并不是美国在风险不明的情况下贸然推进AI技术，而是“国防部和情报界继续按老办法做事”。

“让我夜不能寐的是——我们可能真的赢下了通用人工智能（AGI）的竞赛……却输掉了实际应用的竞赛。”

本文系观察者网独家稿件，文章内容纯属作者个人观点，不代表平台观点，未经授权，不得转载，否则将追究法律责任。关注观察者网微信guanchacn，每日阅读趣味文章。

Top

1、中央应急抢险救灾物资向多地调拨（扎实做好防汛抢险救灾各项工作）,中央救灾物资驰援各地疫情防控工作

2、外媒称美国国会代表团将于8月窜台中方回应

3、不是大模型愚蠢，而是媒体堕落,不是大模型愚蠢,而是媒体堕落的例子

网友评论

我要评论

发表

取消

经济学人：英美情报界如何使用AI模型？,英美情报共享

Top

小编推荐

相关阅读

网友评论