发布日期:2026-04-13 07:42点击次数:

作者|三北
编辑|漠影
2026年开年,开源AI Agent框架OpenClaw火遍全球。它像只不知疲倦的“龙虾”——有记忆、能动手、低门槛,让数人次直观感受到AI真的能干活。
然而,当企业从“请几只试试”到“入职几万只”,画风突变。这些能力强但没受过规训的Agent,在共享的企业基础设施上7×24小时自主行动,带来的是失控的恐惧:升失忆、密钥泄露、脚本失控、预限……
用马斯克的话来说,这就好比把上膛的枪交给了只猴子去用。
马斯克X发文截图
面对龙虾“横爬”的难题,腾讯云提供了新解法——为Agent造属“数字办公环境”——Agent Runtime沙箱案,试图为每只“龙虾”装上“爆箱”和“交通规则”,让企业能够在不削弱龙虾能力的前提下,实现安全可控的大规模部署。
该技术目前已在多头部企业落地,比如其已在知名大模型公司MiniMax的强化学习训练等场景验证,支持十万并发、百万吞吐事故训练。
其助力MiniMax的强化学习框架Forge,在大规模Agent训练场景下做到“环境秒开、用完即删”,让训练快、稳、成本低,为“龙虾军团”的企业落地,写下了坚实的技术注脚。
腾讯云已宣布将Agent Runtime底层沙箱技术Cube开源,为企业提供灵活的部署服务。
、通三道坎济南PVC管道管件粘接胶,让企业真正接得住、管得好AI员工
OpenClaw这类AI Agent正快速被员工自发用起来,企业也看到了规模化造“AI员工”的契机。但真要让几万只“龙虾”安全上岗,迎面就是三道躲不开的课题。
,现有基础设施敢不敢接?Agent有状态、能动手、7×24小时自主行动,几万个实例跑在共享环境里,状态怎么管?行为怎么控?出了事怎么溯源?密钥和危权限散落各处,风险谁来兜?
二,跑了半年对企业有什么沉淀?技能、记忆、协作关系都锁在个人实例里,人走茶凉,Agent之间互不认识,没法协同。企业投入了力,后什么都没留下。
三,组织真能用起来吗?哪些操作要审批、流程怎么改、Token花了多少值不值、Agent 之间怎么协作——这些问题不解决,AI就永远是“玩具”。
腾讯云Agent Runtime的企业Agent理案,正是为了通这三道坎,让企业真正接得住、管得好AI员工。
1、让基础设施扛得住
这里解决的是“敢不敢接”的问题,核心是两件事:Agent状态管理和行为理。
状态管理面,Agent不是状态服务,它会积累依赖、缓存、上下文。直跑着成本太,销毁又丢状态。Agent Runtime把状态和力拆开。空闲时释放力,请求来时原地恢复整个文件系统,不需要预设 Agent 把东西写在哪。再加上任意时刻可做快照,个调教好的 Agent能随时克隆成百个,经验可复制、可继承。
行为理面,每个Agent跑在立VM沙箱里,彼此隔离,个出问题不影响其他。凭证从不落地,由网关按需注入、用完即销毁;所有外部访问统过网关,危操作可配置审批或拦截。全链路审计记录每步谁调了什么模型、花了多少Token。这样来,Agent的能力不削弱,但每步都运行在可控、可追溯的边界里。
2、数据资产留得下
人走了,经验不能丢;框架换了,积累不能废。
奥力斯 pvc管道管件胶批发 联系人:王经理 手机:15226765735(微信同号) 地址:河北省任丘市北辛庄乡南代河工业区济南PVC管道管件粘接胶
Agent Runtime让技能(Skill)、记忆(Memory)、协作关系这三类资产从天起就立于框架存储:技能以制品形式入库,版本管理、权限可控,任意实例可引用;记忆从本地同步上云,跨实例共享,新Agent能继承老员工的积累;协作关系通过 Gateway做服务发现和路由,不依赖框架私有协议。
老张离职了,他调教好的同审核技能和行业经验还在,新人入职直接继承。知识和能力跟着企业走,不跟着个人或某个开源项目走。
3、组织接得住用得好
技术能跑通是回事,组织真能用起来是另回事。
Agent Runtime为企业提供了全局管控的能力。平台团队可以把Agent的初始化脚本、镜像、配置封装成模板,统管理版本变;通过策略控制所有Agent的工具调用、数据访问、LLM调用等行为边界;按实例、用户、组织三层设置Token额度,成本目了然。
但这只是起点,Agent之间怎么协同、工作流程怎么改、考核和预怎么跟上,保温护角专用胶不同行业还在探索。Runtime先把底座搭好,让组织先“接得住”,后续才能“用得好”。
有了这三大特,企业才敢让几万只“龙虾”安心上岗——不是削掉它们的能力,而是让每步都运行在可管、可控、可继承的底座上。
二、百万吞吐、十万并发,MiniMax“尝鲜”实证
腾讯云Agent Runtime沙箱产品早已获得外部头部厂商认可,比如已率先在MiniMax等知名大模型厂商的核心训练场景中成功落地。
自2022年初成立起,MiniMax自研了MiniMax M2.7、Hailuo 2.3等多模态大模型,并出Forge智能体强化学习框架,提升模型复杂任务能力。AGI发展关键期,Agentic RL需海量交互试错,对计资源的安全沙箱、弹调度与并发能力提出要求。
为此,MiniMax与腾讯云度作,基于腾讯云Agent Runtime沙箱搭建Agent Infra,实现大规模交互环境调度与安全隔离,显著提升Forge训练率与稳定。
Forge: 大规模原生Agent RL系统-MiniMax News
从场景痛点来看,Agent强化学习训练面临致挑战:MiniMax的“Forge” Agentic RL框架进行大规模强化学习训练时,需要模拟海量并发交互环境,让Agent在真实、可交互的执行环境中进行探索、试错与交互。这种强度的智能体自主进化,要求底层计资源须具备并发、对安全隔离的沙箱环境,这对基础设施的弹调度、安全隔离与大规模并发能提出了前所未有的要求。
Agentic RL对Infra的四大核心诉求
之所以被MiniMax选中,腾讯云Agent沙箱在此场景中展现出突出的优势:
1、毫秒启动:80ms速启动,P99延迟
资源池化与快照恢复:80ms交付可用沙箱
2、百万吞吐、十万并发:每分钟可并发创建六十万沙箱实例,成功率达99.99,承载Agentic RL的海量试错需求。依托腾讯云百万核资源池,系统可每分钟扩容十万实例,从容应对并发挑战。
腾讯云Agent Runtime支持每分钟60W沙箱创建
3、复杂环境模拟:支持代码、浏览器甚至OSWorld等全场景沙箱,为模型训练提供媲美真实世界的“练兵场”。论是Browser Use Agent的网页操作,还是Computer Use Agent的桌面办公,都能在安全隔离的环境中模拟。
4、Agent First工具链:提供对外开源的SDK、API、CLI、Cookbook,兼容E2B协议,并度集成主流训练框架,让MiniMax团队能缝对接。
MiniMax Agent席架构师阿岛提到:“腾讯云的沙箱产品,开始就是面向我们这样的场景去设计的。”
“开始我们在K8s上跑,发现真的不行,并发起不来。后来我们和腾讯云走到起,有了沙箱案。这就是产业、行业在前沿的AI技术上,需要的基础设施和能力。”阿岛称,“在M2.7开始,我们已经能让Agent自主驱动大部分Agentic RL过程。这里面任何个环节卡住,有可能卡住的就是沙箱环节,它就会大的影响我的模型的迭代。腾讯云的沙箱能、稳定、低延迟,对我们的训练迭代速度至关重要。”
MiniMax的案例证明,腾讯云Agent Runtime面是支持Agent运行的“数字总部”,层次,其是支持前沿AI技术训练的生产基础设施。
四类沙箱×多种交互式,覆盖主流Agentic RL场景
论是企业里成千上万只OpenClaw的日常上岗,还是Agentic RL场景下百万吞吐、十万并发的限训练,其实都在验证同件事,Agent时代需要种不同于传统云计的新型运行底座。
结语:AI Agent加速普及,可控、可用是关键
OpenClaw的爆火,证明了AI Agent的生产力价值,也提醒我们安全可控的重要。让每只龙虾都在“跑得稳、管得住、看得清、养得起”的规矩下安全运行,企业才能真正从“试用AI”走向“与AI协同工作”。
从护航MiniMax模型训练,到给OpenClaw龙虾上规矩,腾讯云正以扎实的底层能力,为智能体时代铺就安全可控的基础设施。当每只AI龙虾都能在“爆箱”中安心工作,企业大规模拥抱AI的爆发时刻,才真正到来。
相关词条:铝皮保温 隔热条设备 钢绞线厂家玻璃棉 泡沫板橡塑板专用胶1.本网站以及本平台支持关于《新广告法》实施的“极限词“用语属“违词”的规定,并在网站的各个栏目、产品主图、详情页等描述中规避“违禁词”。
2.本店欢迎所有用户指出有“违禁词”“广告法”出现的地方,并积极配合修改。
3.凡用户访问本网页,均表示默认详情页的描述,不支持任何以极限化“违禁词”“广告法”为借口理由投诉违反《新广告法》,以此来变相勒索商家索要赔偿的违法恶意行为。
18232851235