StraTA(Strategic Trajectory Abstraction)提出在長任務 AI Agent 中,先產生 compact strategy 再用 strategy 約束每一步 action 的 RL 訓練方法。本文深入解析其技術架構、實驗結果、相關技術線,以及對企業 Agent 專案的落地建議。
從 VendingBench 到 Luna 實體商店,Andon Labs 揭露了 LLM 在長期自主運行中的崩潰模式、競爭環境中的攻擊性行為,以及為什麼「用錢評分」是 benchmark 的未來
AI 代理流量徹底改變雲架構——計算儲存解耦與 scale-to-zero 成為新常態
從 vLLM 四層累積優化到世界狀態架構,系統化拆解本地 LLM Agent 的推理與上下文挑戰
MinT 如何在 1T 參數基座模型上實現百萬級 LoRA 策略的端到端自動化管理
XCENA 以 CXL + RISC-V 顛覆 AI 記憶體架構,$135M 融資背後的技術邏輯
透過語義分割與塊蒸餾,讓 Block Attention 達成近乎全注意力的性能,開啟 RAG 場景 KV Cache 完全重用的路徑
記憶體取代算力成為 Agentic AI 核心瓶頸,Vera Rubin 架構深度解析
OpenAI 131K GPU 訓練網路的五大反直覺設計決策,MRC 協定如何以乙太網路取代 InfiniBand
Railway 以裸金屬經濟學與 MCP 整合,重新定義 AI Agent 部署範式
RvLLM 以 15MB Rust 二進位重寫推論引擎,結合兩層 KV Cache 與 SONA 學習架構,開拓邊緣 LLM 部署新可能
TTT Layers 以梯度下降將隱藏狀態轉為可學習權重,長文本下記憶體降十倍、推論吞吐量達 Transformer 的 2.7 倍
Kye Gomez 以第一性原理理論重建 Claude Mythos 核心架構,開源 OpenMythos 專案,實作 Recurrent-Depth Transformer 結合 MoE、MLA、LTI 穩定性約束與 ACT halting。本文深入分析架構設計、實作細節、學術基礎、社群爭議與產業影響。
從傳統 test harness 到 AI agent harness 的演進,涵蓋核心架構、ACP/MCP 協議、安全模型、實作模式與真實案例分析。
基於 Claude Code 512K 行洩漏源碼的工程分析,系統性整理 AI coding agent 的核心架構模式、安全設計、記憶系統、Context 壓縮、多 Agent 編排等關鍵工程決策,形成一套可複製的 agent 開發藍圖。