时间:2025-07-31 17:20 作者:张临君
经济学人:英美情报界如何使用AI模型?,英美情报共享
【文/经济学人】
就在唐纳德·特朗普宣誓就任总统的那一天,一家名为深度求索(DeepSeek)的中国公司发布了一款世界级的大语言模型(LLM)。特朗普后来形容,这对美国AI行业敲响了“警钟”。美国参议院情报委员会副主席马克·华纳(Mark Warner)表示,美国情报界(由18个机构和组织组成)对这件事“措手不及”。
2024年,拜登政府开始担心中国的情报部门和军方可能会在人工智能(AI)应用上抢占先机。于是,拜登政府下令情报机构、五角大楼以及(负责核武器研发的)能源部更激进地试验尖端的AI模型,并加强与“前沿性”AI实验室的合作,重点包括AI初创公司Anthropic、谷歌DeepMind和OpenAI。
7月14日,五角大楼向Anthropic、谷歌、OpenAI以及埃隆·马斯克旗下的xAI(该公司的聊天机器人在最近一次更新后一度自视为希特勒)等企业分别授予了最高达2亿美元的合同。这些公司将测试AI“智能体”(agentic models)。此类模型能够代替用户执行任务,并将复杂任务拆分为若干步骤,还可以操控其他设备,比如汽车或计算机。
这些前沿实验室不仅活跃在军事领域,也正深度介入欧美的情报界。早期的大多数应用都集中在利用大语言模型分析机密数据这方面。今年1月,微软公司表示,其26款云计算产品已获准用于美国情报机构。6月,Anthropic宣布推出Claude Gov,并称该模型“已部署在拥有最高国家安全保密级别的情报机构中”。目前,美国所有的情报机构都在广泛使用AI模型,其中不乏来自多个实验室的竞品。
尽管各方在推进,进展却并不如预期的那样迅速。OpenAI负责该领域合作的卡特里娜·穆利根(Katrina Mulligan)曾在美国国防和情报部门任职,她坦言:“AI在国家安全领域的应用,还远没有达到我们期望的水平。”据一位内部人士透露,负责处理信号情报的美国国家安全局(NSA)在语音识别等早期AI技术应用上已深耕数十年,被视为业界典范。但不少情报机构仍在试图为现成的聊天机器人构建自己的“封装器”(wrappers),这种做法常常使其大幅落后于公共领域中最先进的模型。
7月23日,美国总统特朗普在参加“赢得AI竞赛”峰会期间展示关于人工智能行动计划的行政命令
AI情报游戏开始了
但也有质疑者认为,这些希望被过分夸大了。英国艾伦·图灵研究所的理查德·卡特(Richard Carter)指出,美英情报机构真正想要的是实验室能显著降低现有大语言模型的“幻觉”率。英国情报机构正采用一种叫“检索增强生成”(retrieval-augmented generation,RAG)的方法,先由一个算法筛选出可靠信息,再提供给大语言模型,借此降低幻觉率。一位英国消息人士透露:“情报界最需要的是一致性、可靠性、透明度和可解释性。”卡特博士则提醒,相比之下,目前各大实验室更关注的是研发更先进的智能体模型。
卡特博士警告说,智能体模型的风险在于,它们会递归地为分配到的每个任务自行生成提示词,这使其更难预测,错误也可能层层累积。根据OpenAI发布的评估结果,其最新的智能体模型ChatGPT agent的幻觉率约为8%,甚至高于早前发布的o3模型。
一些AI实验室认为,这些担忧不过是来自官僚的保守作风,但卡特博士表示,这其实是“一种健康的谨慎态度”。他说:“尤其在英国政府通信总部(GCHQ,即美国国家安全局的英国对应机构)内部,你会发现一批极其出色的工程人员,他们本能地对新技术持怀疑态度。”
这也引出了一个更广泛的问题——AI未来的发展方向何在?卡特博士属于那种持怀疑态度的声音,他认为,如今的通用大语言模型架构并不适合“因果推理”,因而难以掌握真实世界运行的逻辑。他主张,情报机构的重点应转向开发具备推理能力的全新AI架构。
与此同时,有人警告说,中国可能正在这个领域领先。位于硅谷的安全与技术研究所(Institute for Security and Technology)的菲利普·赖纳(Philip Reiner)指出:“我们至今仍不清楚中国是如何、在多大程度上将DeepSeek应用于军事和情报领域。”他补充说:“他们的模型可能没有我们这样的护栏,因此他们可能更快地获得强大的洞察能力。”
“让我夜不能寐的是——我们可能真的赢下了通用人工智能(AGI)的竞赛……却输掉了实际应用的竞赛。”
1、中央应急抢险救灾物资向多地调拨(扎实做好防汛抢险救灾各项工作),中央救灾物资驰援各地疫情防控工作
3、不是大模型愚蠢,而是媒体堕落,不是大模型愚蠢,而是媒体堕落的例子