首頁

Research Notes

StraTA：策略導向的 Agentic RL 訓練方法 — 從 Reactive Agent 到 Strategy-Guided Execution

StraTA（Strategic Trajectory Abstraction）提出在長任務 AI Agent 中，先產生 compact strategy 再用 strategy 約束每一步 action 的 RL 訓練方法。本文深入解析其技術架構、實驗結果、相關技術線，以及對企業 Agent 專案的落地建議。

Research Notes

Reality: The Final Eval — Andon Labs 的真實世界 AI 評估框架

從 VendingBench 到 Luna 實體商店，Andon Labs 揭露了 LLM 在長期自主運行中的崩潰模式、競爭環境中的攻擊性行為，以及為什麼「用錢評分」是 benchmark 的未來

AI Infrastructure

Agent 原生雲基礎設施：為什麼互聯網正在為機器重建

AI 代理流量徹底改變雲架構——計算儲存解耦與 scale-to-zero 成為新常態

AI Infrastructure

生產級 LLM Agent 的推理基礎設施：vLLM 四層優化與世界狀態管理

從 vLLM 四層累積優化到世界狀態架構，系統化拆解本地 LLM Agent 的推理與上下文挑戰

AI Infrastructure

MinT：管理百萬級 LoRA Adapter 的訓練與服務基礎設施

MinT 如何在 1T 參數基座模型上實現百萬級 LoRA 策略的端到端自動化管理

AI Infrastructure

XCENA MX1 與 CXL：當記憶體成為 AI 推理的真正瓶頸

XCENA 以 CXL + RISC-V 顛覆 AI 記憶體架構，$135M 融資背後的技術邏輯

AI Infrastructure

Block Attention 與 KV Cache 重用：RAG 場景的推理加速新途徑

透過語義分割與塊蒸餾，讓 Block Attention 達成近乎全注意力的性能，開啟 RAG 場景 KV Cache 完全重用的路徑

AI Infrastructure

NVIDIA Vera Rubin 與 Agentic AI 基礎設施：記憶體如何取代算力成為核心瓶頸

記憶體取代算力成為 Agentic AI 核心瓶頸，Vera Rubin 架構深度解析

AI Infrastructure

OpenAI 131K GPU 訓練網路的五大反直覺設計：MRC 協定與乙太網路的勝利

OpenAI 131K GPU 訓練網路的五大反直覺設計決策，MRC 協定如何以乙太網路取代 InfiniBand

AI Infrastructure

Railway Agent-Native Cloud：當雲基礎設施為 AI Agent 重新設計

Railway 以裸金屬經濟學與 MCP 整合，重新定義 AI Agent 部署範式

AI Infrastructure

RvLLM：15MB 二進位的 Rust LLM 推論引擎與邊緣部署新思維

RvLLM 以 15MB Rust 二進位重寫推論引擎，結合兩層 KV Cache 與 SONA 學習架構，開拓邊緣 LLM 部署新可能

AI Infrastructure

TTT 邊推論邊學習：打破訓練與推論邊界的序列建模新範式

TTT Layers 以梯度下降將隱藏狀態轉為可學習權重，長文本下記憶體降十倍、推論吞吐量達 Transformer 的 2.7 倍

AI Infrastructure

OpenMythos：循環深度 Transformer 架構深度解析

Kye Gomez 以第一性原理理論重建 Claude Mythos 核心架構，開源 OpenMythos 專案，實作 Recurrent-Depth Transformer 結合 MoE、MLA、LTI 穩定性約束與 ACT halting。本文深入分析架構設計、實作細節、學術基礎、社群爭議與產業影響。

AI Infrastructure

Harness Engineering：AI Agent 的控制平面設計與實作

從傳統 test harness 到 AI agent harness 的演進，涵蓋核心架構、ACP/MCP 協議、安全模型、實作模式與真實案例分析。

AI Infrastructure

StraTA：策略導向的 Agentic RL 訓練方法 — 從 Reactive Agent 到 Strategy-Guided Execution

StraTA（Strategic Trajectory Abstraction）提出在長任務 AI Agent 中，先產生 compact strategy 再用 strategy 約束每一步 action 的 RL 訓練方法。本文深入解析其技術架構、實驗結果、相關技術線，以及對企業 Agent 專案的落地建議。

Reality: The Final Eval — Andon Labs 的真實世界 AI 評估框架

從 VendingBench 到 Luna 實體商店，Andon Labs 揭露了 LLM 在長期自主運行中的崩潰模式、競爭環境中的攻擊性行為，以及為什麼「用錢評分」是 benchmark 的未來

Agent 原生雲基礎設施：為什麼互聯網正在為機器重建

AI 代理流量徹底改變雲架構——計算儲存解耦與 scale-to-zero 成為新常態

生產級 LLM Agent 的推理基礎設施：vLLM 四層優化與世界狀態管理

從 vLLM 四層累積優化到世界狀態架構，系統化拆解本地 LLM Agent 的推理與上下文挑戰

MinT：管理百萬級 LoRA Adapter 的訓練與服務基礎設施

MinT 如何在 1T 參數基座模型上實現百萬級 LoRA 策略的端到端自動化管理

XCENA MX1 與 CXL：當記憶體成為 AI 推理的真正瓶頸

XCENA 以 CXL + RISC-V 顛覆 AI 記憶體架構，$135M 融資背後的技術邏輯

Block Attention 與 KV Cache 重用：RAG 場景的推理加速新途徑

透過語義分割與塊蒸餾，讓 Block Attention 達成近乎全注意力的性能，開啟 RAG 場景 KV Cache 完全重用的路徑

NVIDIA Vera Rubin 與 Agentic AI 基礎設施：記憶體如何取代算力成為核心瓶頸

記憶體取代算力成為 Agentic AI 核心瓶頸，Vera Rubin 架構深度解析

OpenAI 131K GPU 訓練網路的五大反直覺設計：MRC 協定與乙太網路的勝利

OpenAI 131K GPU 訓練網路的五大反直覺設計決策，MRC 協定如何以乙太網路取代 InfiniBand

Railway Agent-Native Cloud：當雲基礎設施為 AI Agent 重新設計

Railway 以裸金屬經濟學與 MCP 整合，重新定義 AI Agent 部署範式

RvLLM：15MB 二進位的 Rust LLM 推論引擎與邊緣部署新思維

RvLLM 以 15MB Rust 二進位重寫推論引擎，結合兩層 KV Cache 與 SONA 學習架構，開拓邊緣 LLM 部署新可能

TTT 邊推論邊學習：打破訓練與推論邊界的序列建模新範式

TTT Layers 以梯度下降將隱藏狀態轉為可學習權重，長文本下記憶體降十倍、推論吞吐量達 Transformer 的 2.7 倍

OpenMythos：循環深度 Transformer 架構深度解析

Kye Gomez 以第一性原理理論重建 Claude Mythos 核心架構，開源 OpenMythos 專案，實作 Recurrent-Depth Transformer 結合 MoE、MLA、LTI 穩定性約束與 ACT halting。本文深入分析架構設計、實作細節、學術基礎、社群爭議與產業影響。

Harness Engineering：AI Agent 的控制平面設計與實作

從傳統 test harness 到 AI agent harness 的演進，涵蓋核心架構、ACP/MCP 協議、安全模型、實作模式與真實案例分析。

從 Claude Code 洩漏源碼學到的：如何打造生產級 AI Coding Agent

基於 Claude Code 512K 行洩漏源碼的工程分析，系統性整理 AI coding agent 的核心架構模式、安全設計、記憶系統、Context 壓縮、多 Agent 編排等關鍵工程決策，形成一套可複製的 agent 開發藍圖。