From 99b3d17ddfda8ef4cbec593f3b2570559a4f0aa7 Mon Sep 17 00:00:00 2001 From: Hunter Bown Date: Tue, 26 May 2026 10:10:53 -0500 Subject: [PATCH] docs: correct sub-agent event and OS sandboxing claims in all READMEs --- README.ja-JP.md | 4 ++-- README.md | 8 ++++---- README.zh-CN.md | 8 ++++---- 3 files changed, 10 insertions(+), 10 deletions(-) diff --git a/README.ja-JP.md b/README.ja-JP.md index 9916ec32..f5db5dad 100644 --- a/README.ja-JP.md +++ b/README.ja-JP.md @@ -73,13 +73,13 @@ DeepSeek V4 はこのハーネスの一部を書くのを手伝いました。 **憲法的階層。** システムプロンプトは法の抵触エンジンです。ユーザーの意図は古いメモリより上。ライブの証拠は仮定より上。検証は自信より上。各ターンは明確な権限チェーンを継承するので、モデルはどの指示に従うべきか推測する必要がありません。 -**構造化された信頼。** ハードな境界を持つ3つのモード——Plan(読み取り専用)、Agent(承認ゲート付き)、YOLO(信頼済みワークスペースで自動承認)。OS レベルのサンドボックスが境界を支えます:macOS の Seatbelt、Linux の Landlock、Windows の Job Objects。危険なコマンドはモードに関係なく分類・ゲート制御されます。 +**構造化された信頼。** ハードな境界を持つ3つのモード——Plan(読み取り専用)、Agent(承認ゲート付き)、YOLO(信頼済みワークスペースで自動承認)。OS レベルのサンドボックスが境界を支えます。macOS Seatbelt はアクティブな適用パスです。Linux Landlock は検出されますが(カーネル 5.13+)現在は適用されていません。Windows サンドボックスはまだ公開されていません。危険なコマンドはモードに関係なく分類・ゲート制御されます。 **フィードバックの鼓動。** 失敗したコマンド、失敗したテスト、LSP 診断——これらは行き止まりではありません。モデルがチューニングできる信号です。非ゼロの終了コードは情報です。型エラーは修正ベクトルです。ハーネスは失敗を読み取り可能にし、ユーザーが常に舵を取り直さなくてもモデルが回復できるようにします。 **継続性。** メモリはセッションをまたいで持続します。ハンドオフはコンテキスト圧縮後も生存します。セッションは保存・再開・兄弟パスへのフォークが可能です。次の知性——人間であれ機械であれ——が、すでに学ばれたことを再発見する必要なく、前回の中断点から引き継ぎます。 -**分散作業。** サブエージェントが並行実行、一度に最大 20。`agent_open` は即座に戻り、親は作業を続けます。結果は構造化された完了イベントとして到着し、境界付きハンドルで——完全なトランスクリプトで親コンテキストを埋める必要はありません。[docs/SUBAGENTS.md](docs/SUBAGENTS.md) を参照。 +**分散作業。** サブエージェントが並行実行、一度に最大 20。`agent_open` は即座に戻り、親は作業を続けます。結果は完了センチネルとしてインラインで到着し、サマリー付き。完全なトランスクリプトは `agent_eval` から取得可能な境界付きハンドルに保持されます。[docs/SUBAGENTS.md](docs/SUBAGENTS.md) を参照。 **適正な知性。** Fin——thinking off の安価な Flash——がモデル自動ルーティング、RLM 子呼び出し、要約、調整を処理します。Pro はアーキテクチャ、デバッグ、セキュリティレビューに使用。`--model auto` がターンごとにモデルと思考レベルを選択します。各問題に適切な量の知性を。 diff --git a/README.md b/README.md index c3fd6722..827e8975 100644 --- a/README.md +++ b/README.md @@ -85,13 +85,13 @@ DeepSeek V4 helped write parts of this harness. That matters because it means Co **Constitutional hierarchy.** The system prompt is a conflict-of-laws engine. User intent outranks stale memory. Live evidence outranks assumptions. Verification outranks confidence. Every turn inherits a clear chain of authority, so the model never has to guess which instruction to follow. -**Structured trust.** Three modes with hard boundaries — Plan (read-only), Agent (approval-gated), YOLO (auto-approved in trusted workspaces). OS-level sandboxing backs the boundaries: Seatbelt on macOS, Landlock on Linux, Job Objects on Windows. Dangerous commands are classified and gated regardless of mode. +**Structured trust.** Three modes with hard boundaries — Plan (read-only), Agent (approval-gated), YOLO (auto-approved in trusted workspaces). OS-level sandboxing backs the boundaries: macOS Seatbelt is the active enforcement path. Linux Landlock support is detected (kernel 5.13+) but not yet enforced; Windows sandboxing is not yet advertised. Dangerous commands are classified and gated regardless of mode. **Feedback beats.** Failed commands, failing tests, LSP diagnostics — these are not dead ends. They are signals the model can tune against. A non-zero exit code is information. A type error is a correction vector. The harness makes failure legible so the model can recover without the user constantly re-steering. **Continuity.** Memory persists across sessions. Handoffs survive context compaction. Sessions can be saved, resumed, and forked into sibling paths. The next intelligence — human or machine — picks up where the last one left off without having to re-discover what was already learned. -**Distributed work.** Sub-agents run concurrently, up to 20 at a time. `agent_open` returns immediately so the parent keeps working. Results arrive as structured completion events with bounded handles — no need to flood the parent context with full transcripts. See [docs/SUBAGENTS.md](docs/SUBAGENTS.md). +**Distributed work.** Sub-agents run concurrently, up to 20 at a time. `agent_open` returns immediately so the parent keeps working. Results arrive inline as completion sentinels with a summary; full transcripts stay behind bounded handles retrievable through `agent_eval`. See [docs/SUBAGENTS.md](docs/SUBAGENTS.md). **Right-size intelligence.** Fin — cheap Flash with thinking off — handles model auto-routing, RLM child calls, summaries, and coordination. Pro engages for architecture, debugging, and security review. `--model auto` selects both the model and thinking level per turn. The right amount of intelligence for each problem. @@ -115,8 +115,8 @@ CodeWhale can dispatch multiple sub-agents that run in parallel — like a concu - **Non-blocking launch.** `agent_open` returns immediately. The child gets its own fresh context and tool registry and runs independently. The parent keeps working. - **Background execution.** Sub-agents execute concurrently (default cap: 10, configurable to 20). The engine manages the pool — no polling loop needed. -- **Completion notification.** When a sub-agent finishes, the runtime delivers a structured `` event with a summary, evidence list, and execution metrics. The parent model reads the `summary` field and integrates findings. -- **Bounded result retrieval.** Large transcripts are parked behind `var_handle` references. The model calls `handle_read` for slices, ranges, or JSONPath projections — keeping the parent context lean. +- **Completion notification.** When a sub-agent finishes, the runtime injects a `` sentinel into the parent's transcript. The human-readable summary — including the child's findings, changed files, and any risks — sits on the line immediately before the sentinel. The parent model reads that summary and integrates findings without an extra tool call. +- **Bounded result retrieval.** The full child transcript lives behind a `transcript_handle` accessible through `agent_eval`. When the summary isn't enough, the parent calls `handle_read` for slices, line ranges, or JSONPath projections — keeping the parent context lean without losing access to the details. See [docs/SUBAGENTS.md](docs/SUBAGENTS.md) for the full sub-agent reference. diff --git a/README.zh-CN.md b/README.zh-CN.md index 2087f223..1134887c 100644 --- a/README.zh-CN.md +++ b/README.zh-CN.md @@ -80,13 +80,13 @@ DeepSeek V4 参与了这套框架的部分编写。这很重要——它意味 **宪政层级。** 系统提示词是一个冲突法引擎。用户意图优先于陈旧记忆。实时证据优先于假设。验证优先于自信。每一轮继承清晰的权威链,模型永远不需要猜测该服从哪条指令。 -**结构化信任。** 三种模式,硬边界——Plan(只读)、Agent(审批门控)、YOLO(可信工作区自动批准)。OS 级沙箱支撑边界:macOS 的 Seatbelt、Linux 的 Landlock、Windows 的 Job Objects。危险命令无论在哪种模式下都被分类和门控。 +**结构化信任。** 三种模式,硬边界——Plan(只读)、Agent(审批门控)、YOLO(可信工作区自动批准)。OS 级沙箱支撑边界。macOS Seatbelt 是主动执行的沙箱路径。Linux Landlock 可被检测(内核 5.13+)但当前未实际执行;Windows 沙箱尚未开放。危险命令无论在哪种模式下都被分类和门控。 **反馈节拍。** 失败的命令、失败的测试、LSP 诊断——这些不是死胡同。它们是模型可以调谐的信号。非零退出码是信息。类型错误是修正向量。框架让失败变得可读,模型可以在用户不必不断重新掌舵的情况下恢复。 **连续性。** 记忆跨会话持久化。交接在上下文压缩后存活。会话可以保存、恢复和分叉到兄弟路径。下一位智能体——人或机器——从上一位置继续,无需重新发现已经学到的东西。 -**分布式工作。** 子智能体并发运行,一次最多 20 个。`agent_open` 立即返回,父进程继续工作。结果以结构化完成事件形式到达,带有有界句柄——无需用完整对话记录淹没父上下文。详见 [docs/SUBAGENTS.md](docs/SUBAGENTS.md)。 +**分布式工作。** 子智能体并发运行,一次最多 20 个。`agent_open` 立即返回,父进程继续工作。结果以内联完成哨兵形式到达,携带摘要;完整对话记录可通过 `agent_eval` 的有界句柄读取。详见 [docs/SUBAGENTS.md](docs/SUBAGENTS.md)。 **适度智能。** Fin——关闭思考的廉价 Flash——处理模型自动路由、RLM 子调用、摘要和协调。Pro 用于架构、调试和安全审查。`--model auto` 每轮选择模型和思考强度。每个问题匹配恰当的智能量。 @@ -110,8 +110,8 @@ codewhale 可以同时调度多个子智能体并行运行——类似于并发 - **非阻塞启动。** `agent_open` 立即返回。子智能体获得独立的上下文和工具注册表,独立运行。父进程继续工作。 - **后台执行。** 子智能体并发运行(默认上限 10,可配置至 20)。引擎管理线程池——无需轮询循环。 -- **完成通知。** 子智能体完成后,运行时发送结构化的 `` 事件,包含摘要、证据列表和执行指标。父模型读取 `summary` 字段并整合结果。 -- **按需读取结果。** 大型对话记录暂存为 `var_handle` 引用。模型通过 `handle_read` 按切片、范围或 JSONPath 投影读取——保持父上下文精简。 +- **完成通知。** 子智能体完成后,运行时向父对话注入 `` 哨兵。人类可读的摘要(包含子智能体的发现、变更文件和风险)位于哨兵的紧前一行。父模型读取该摘要并整合结果,无需额外工具调用。 +- **按需读取结果。** 完整子对话记录通过 `agent_eval` 获取的 `transcript_handle` 暂存。摘要不够时,父进程通过 `handle_read` 按切片、行范围或 JSONPath 投影读取——保持父上下文精简而不丢失细节。 详见 [docs/SUBAGENTS.md](docs/SUBAGENTS.md)。