OpenSquilla 发布 0.4.0：AI 写代码首次能"自我验证"

3小时前

开源 AI Agent 项目 OpenSquilla 近日发布 0.4.0 版本，核心更新是推出编码工作流 coding模式，并首次为 AI 编码引入"自我验证"机制：AI 不再止步于"我改好了"的口头交付，而是在交回结果前，先用测试为自己跑出一份可复核的、证明"改对了"的证据。

在官方的案例演示中，Coding模式为知名开源项目 micrograd，AI 教育圈顶流、Anthropic研究员Andrej Karpathy 的极简自动微分库，新增了"计算正确梯度"的功能——而梯度一旦算错，模型不报错也不崩溃，只会悄悄越学越偏，是最难靠肉眼发现的 bug。演示分两步：先由 AI 走完上述"红→绿→回归"三关、自交证据；再由人把 micrograd 的新功能与行业标准工具 PyTorch 在同一道题上并排比对，前向值与每一个梯度小数点后 10 位完全一致。换言之，不是"AI 自己说对"，而是"它和官方标准答案分毫不差"。这也是在Coding赛道上，团队继新一代基准claw-swe-bench之后，落地agent runtime的最新实践。

同期，OpenSquilla 还推出首个签名并公证的桌面安装包，macOS 与 Windows 均可双击安装、无需命令行。

OpenSquilla 主打"提升单位成本的 Agent 智能"，以Learnable Harness为切入点，目标打造性价比最高的Agent产品。OpenSquilla 官网则称，常规场景内测综合成本可下降约 60–80%。

基元律动创始人王云鹤曾负责头部科技公司大模型研发，CTO 为韩凯。OpenSquilla 上线后数周内 GitHub star 增至数千量级；据公开报道，公司成立仅数月即完成首轮融资，是 Harness和Agent原生模型方向上为数不多的代表性玩家。

格隆汇声明：文中观点均来自原作者，不代表格隆汇观点及立场。特别提醒，投资决策需建立在独立思考之上，本文内容仅供参考，不作为实际操作建议，交易风险自担。

19.2k

商务、渠道、广告合作/招聘立即咨询