Cloud Run cold start 翻三倍,帳單給我上了一課
當 min-instance 從 1 調回 0,省下的不是錢——是用戶。一篇從 GCP billing 反推出的架構檢討。
講的是帳單、cold start、SLO、tech debt、團隊決策——所有你 onboarding 簡報不會告訴你的事。
真實工程 case study。連 Cloud Run cold start 比例、retry 策略、token 開銷都拆給你看。
每篇文章都收斂回到可重用的決策框架——30% 天花板、形式化鴻溝、認知卸載陷阱、園丁哲學。
同一個 AI 產品問題,工程師與 PM 看到的是不同切面。 我們把這兩個切面拆成兩個獨立子站——各自完整,互為註腳。
當 min-instance 從 1 調回 0,省下的不是錢——是用戶。一篇從 GCP billing 反推出的架構檢討。
市面上 90% 的 Agent 教程停在 tool calling。但真正讓 Agent 不崩的是另外三件事:state、observability、failure mode。
LangChain vs LlamaIndex 是假議題。真正卡住產品的是——你的領域知識能不能被形式化到 30% 的那條線。
每個框架都從一個真實工程現場長出來。不是抽象理論,是「下次再遇到時,你不用從零想起」的決策工具。
AI 能把 70% 的事做到 60 分,但剩下 30% 才是用戶實際付錢的部分。判斷產品可行性的第一道濾網。
領域知識能不能寫成可被機器評估的規則,決定 AI 產品的天花板。寫不出 eval,就做不出 product。
把思考交給 AI 的代價,是你的團隊集體失去 judgment。一個比 hallucination 更隱性的長期風險。
AI 產品不是工廠,是花園。你培育、修剪、觀察季節——不是排班、計件、壓榨產出。
產品 / 工程 / 領域專家三軸對齊的治理模型。AI 專案翻車多半是某一軸缺席,而不是技術問題。
把每個 service、prompt、agent 都當成有性格的存在。觀察它們的「脾氣」,比讀 log 更早發現問題。
Eugene。Staff Engineer at OnRampLab。AIPM.TW 主理人。 日常工作是把模糊的 AI 命題收斂成 production 上跑得起來的東西——並把過程拆給你看。
// 園丁,不是牛馬。
完整經歷與寫作脈絡新文章上線當天寄到信箱。沒有運營話術、沒有 affiliate、沒有「五個工具讓你變超人」。 只有一篇從工程現場長出來的拆解。
// 隨時退訂,不寄第二件商品