Tags
1 page
Long-Horizon-Tasks
StraTA:策略導向的 Agentic RL 訓練方法 — 從 Reactive Agent 到 Strategy-Guided Execution