簡介
過去二十年,整個雲基礎設施的設計哲學都建立在一個核心假設上:使用者是人類。人類搜尋、點擊、滾動、串流——流量模式相對穩定、可預測,因此資源可以預分配、計費可以按容量。
但 AI Agent 正在打破這個假設。
當一個代理被觸發時,它可能在數秒內並行查詢數百個資料庫、調用數十個 API、檢索大量文件,然後瞬間消失。沒有預熱、沒有滾動頁面、沒有持續串流——只有極端的突發暴增和隨後的完全空閒。傳統以人為中心的雲架構根本無法有效應對這種模式。
Cloudflare 的數據更揭示了這個趨勢的規模:機器人已佔 HTTP 總流量的 31%,而 AI 爬蟲與助理約佔所有機器人請求的 25%。Cloudflare 高級產品經理 Lai Yi Ohlsen 明確預測:2027 年上半年,非人類流量將超越人類流量。
這不是漸進式演進,而是範式轉移。本文將從流量特徵、技術變革、產業趨勢和架構設計四個維度,分析互聯網為什麼正在為機器重建。
代理流量的突發本質
傳統雲架構的負載曲線是一條平緩的波浪——日間高峰、夜間低谷,整體可預測。AI Agent 的負載曲線則像一道閃電:
graph LR
A[User Trigger] --> B[Agent Activated]
B --> C[Spike: Hundreds of<br/>parallel DB queries]
B --> D[Spike: Dozens of<br/>API calls]
B --> E[Spike: Massive<br/>document retrieval]
C --> F[Results Merged]
D --> F
E --> F
F --> G[Agent Idle<br/>Zero traffic]
G -.-> A
這種流量模式帶來三個核心挑戰:
| 挑戰 | 說明 | 傳統架構的困境 |
|---|---|---|
| 突發性(Spike) | 瞬間觸發大量並行請求 | 預分配資源成本高,動態擴展速度不夠 |
| 空閒性(Idle) | 任務完成後流量歸零 | 實例閒置仍計費,資源浪費 |
| 不可預測性 | 無法提前預知觸發時機和規模 | 基於歷史模式的 auto-scaling 策略失效 |
AWS Amazon OpenSearch Service 的 GM Tia White 在接受 TechCrunch 採訪時精準描述了這個問題:
“Agents are moving from experimentation into production, and they create traffic patterns that previous infrastructure simply wasn’t designed for. They spike without warning, they go idle without notice.”
AWS OpenSearch Serverless 新世代:計算儲存完全解耦
作為對這種流量模式的直接回應,AWS 推出了 OpenSearch Serverless 新世代架構。核心變革在於徹底打破計算與儲存的耦合關係:
| 維度 | 舊版 Serverless | 新世代 Serverless |
|---|---|---|
| 計算/儲存 | 耦合(至少 1 實例) | 完全解耦 |
| 擴展速度 | 受限於耦合架構 | 秒級自動擴展 |
| 閒置成本 | 持續付費(至少 1 實例) | $0(完全縮減) |
| 計費模式 | 「停車位」固定成本 | 「計費停車錶」純變動成本 |
| 適用場景 | 穩定人類工作負載 | 突發代理工作負載 |
新架構的運作邏輯非常直觀:
graph TD
subgraph "Legacy Architecture"
L1[Compute + Storage<br/>Coupled Instance] --> L2[Minimum 1 Instance<br/>Always Running]
L2 --> L3[$$$ Idle Cost]
end
subgraph "Next-Gen Architecture"
N1[Storage Layer<br/>Always Available] --> N2[Compute Layer<br/>On-Demand]
N2 --> N3[Request Arrives<br/>Compute Scales Up in Seconds]
N3 --> N4[Request Done<br/>Compute Scales to Zero]
N4 --> N5[$0 Idle Cost]
end
這個變革的意義不只是成本節省。它代表了基礎設施從「為人類設計的系統上加裝 AI 層」到「為機器原生設計的全新架構」的根本性轉變。搜尋與向量資料庫是 Agent 最頻繁互動的基礎設施層,因此成為這場變革的第一戰場。可以預見,未來會有更多資料庫服務推出類似的 agent-native 版本。
2027 上半年:流量逆轉點
Cloudflare 提供的數據為這個趨勢提供了量化基礎:
| 指標 | 數值 |
|---|---|
| 機器人佔 HTTP 總流量 | 31% |
| AI 爬蟲/助理佔機器人請求 | ~25% |
| AI 爬蟲/助理佔總 HTTP 流量 | ~7.75% |
| 預測非人類流量超越人類流量的時間 | 2027 年上半年 |
當非人類流量超過人類流量,意味著互聯網的「主流使用者」將從人變為機器。這對所有基礎設施層都有深遠影響:
timeline
title Infrastructure Impact Timeline
2026 : CDN - Request patterns shift<br/>toward API calls
2026 : Load Balancer - Burst handling<br/>becomes primary concern
2027 H1 : Traffic Reversal - Non-human<br/>traffic exceeds human
2027 H2 : Security - Distinguishing legitimate<br/>agents from malicious bots
2028 : Protocol - Agent-native<br/>communication standards emerge
產業共識:多供應商同步轉向
值得注意的是,這不是單一供應商的行動,而是一場產業層面的同步轉向:
- Google I/O 2026 宣布用戶可向 AI 系統委託複雜任務——研究購買決策、預訂旅行、瀏覽網頁、與應用互動——這些任務將產生大量的幕後 M2M(Machine-to-Machine)流量。
- AWS 從搜尋與向量資料庫切入,推出計算儲存解耦的新世代架構。
- Cloudflare 從網路層提供流量分析和防護,並公開呼籲業界正視這個趨勢。
- 企業端 則在內部和面向客戶兩個方向同時部署 Agent,創造新型的場景機器流量。
基礎設施供應商的共識很明確:為人類設計的系統需要為代理世界重新設計。
風險與不確定性
在追蹤這個趨勢時,有幾個需要保持清醒認知的面向:
-
數據來源集中:Cloudflare 的 31% 機器人流量和 2027 預測目前是單一來源,需要其他 CDNs(如 Akamai、Fastly)的數據交叉驗證。
-
行銷敘事與真實需求的界線:部分論述(特別是 AWS 產品推廣)帶有商業行銷色彩。真正的架構需求確實存在,但需區分哪些是技術必然、哪些是市場包裝。
-
標準化真空:各供應商各自設計 agent-native 方案,目前缺乏統一的 Agent 流量協議、身份驗證標準或行為規範。
-
安全攻擊面擴大:M2M 流量的爆發增長帶來新挑戰——如何區分合法代理與惡意機器人?傳統的 CAPTCHA 和速率限制對 API 呼叫的 Agent 無效。
架構分析
從基礎設施工程師的視角,Agent 原生雲架構需要重新思考以下層次:
graph TB
subgraph "Agent-Native Cloud Stack"
direction TB
L1[Agent Runtime Layer<br/>Task orchestration, tool calling]
L2[Compute Layer<br/>Scale-to-zero, per-request billing]
L3[Data Layer<br/>Search + Vector DB, compute-storage decoupled]
L4[Network Layer<br/>CDN for API, M2M traffic management]
L5[Security Layer<br/>Agent identity, bot detection, API auth]
end
subgraph "Traditional Cloud Stack"
direction TB
T1[Web Server Layer<br/>HTTP request-response]
T2[Compute Layer<br/>Fixed instances, reserved capacity]
T3[Data Layer<br/>Monolithic DB, coupled compute-storage]
T4[Network Layer<br/>CDN for static assets, SSL termination]
T5[Security Layer<br/>WAF, CAPTCHA, rate limiting]
end
L1 -.->|Evolution| T1
L2 -.->|Evolution| T2
L3 -.->|Evolution| T3
L4 -.->|Evolution| T4
L5 -.->|Evolution| T5
核心設計原則的對比:
| 原則 | 傳統架構 | Agent 原生架構 |
|---|---|---|
| 容量規劃 | 基於歷史峰值預分配 | 基於即時需求動態擴縮 |
| 計費粒度 | 按實例/按容量 | 按請求/按實際用量 |
| 空閒狀態 | 維持最小實例數 | 縮減至零,零成本 |
| 延遲容忍 | 毫秒級優化 | 秒級擴展可接受(非互動式) |
| 安全模型 | 人類身份驗證 | 代理身份 + 行為驗證 |
總結
互聯網基礎設施正在經歷一場從「以人為中心」到「以機器為中心」的結構性轉變。這不是未來的遠景,而是正在發生的現實。
三個關鍵訊號值得基礎設施從業者關注:
-
技術路線已清晰:計算儲存解耦加上真正的 scale-to-zero,是應對代理突發流量的核心方案。AWS OpenSearch Serverless 新世代是這條路線的具體實現,不是概念驗證。
-
時間框架已明確:Cloudflare 預測的 2027 年上半年流量逆轉點,給了業界大約一年的準備窗口。在這個時間點之前完成架構轉型,將獲得先發優勢。
-
計費模式正在重塑雲經濟:從「停車位」固定成本到「計費停車錶」純變動成本的轉變,將大幅降低 AI Agent 部署的門檻,加速 Agent 從實驗走向生產的進程。
對基礎設施工程師而言,agent-native 架構設計將不再是可選技能,而是核心競爭力。現在正是投入學習和實踐的最佳時機。