Tags
1 page
Trajectory-Optimization
StraTA:策略導向的 Agentic RL 訓練方法 — 從 Reactive Agent 到 Strategy-Guided Execution