Coinbase 發布宕機事件報告,稱此前無法加載或與TLS 證書遷移有關
11月19日,Coinbase發布“11 月16 日網站和移動應用短時出現無法加載的情況”的事後分析報告。報告指出,在美東時間11 月16 日15 點32 分,交易所的交易處理請求流量急劇降至零,15 點38 分,啟動事件報告流程,隨後便懷疑,這可能與正在運行的、用於更新服務之間的內部TLS (傳輸層安全協議)證書的遷移有關。因此我們開始準備回滾最重要和關鍵的服務。由於開始重新部署服務,無法完全重新啟動。在查看相關指標、日誌和跟踪記錄後發現,這很可能是一個驚群效應問題。對此,我們採取了兩個措施,一是暫時取消連接,阻止核心後端服務流量,並使之能夠充分重新部署;二是增加了用於此服務的計算機的數量。 17 點05 分,幾乎所有服務都已恢復。
評論
推薦閱讀