據外媒報導,亞馬遜雲端服務Amazon Web Services(AWS)25日遭遇了持續數小時的故障,導致部分網站和服務系統崩潰。
AWS的服務狀態頁面上的通知顯示,因其處理大量數據流的伺服器Kinesis出現問題,導致一些網站的「錯誤率增加」,亞馬遜已經對該問題進行了修復,但完全恢復還需要一段時間,並貼出了當前受到影響的服務。
該故障主要影響美國東部地區的服務,目前,AWS亞太區暫未受到波及。
最新更新(太平洋標準時間下午6:23):我們想提供一個關於影響美國東部1區內Kinesis數據流API和其他相關服務的問題的更新。我們現在已經減輕了對Kinesis中負責處理傳入請求的子系統的影響,不再看到錯誤率或延遲的增加。但是,我們還沒有完全承擔流量負載,正在努力放寬對服務的請求限制。在接下來的幾個小時裡,我們希望將這些節流閥放寬到以前的水平。我們預計,隨著這一時間段的結束,客戶將開始恢復。
美國東部1號地區的CloudWatch指標仍處於延遲狀態。一旦我們將Kinesis的限制恢復到以前的水平,我們將恢復CloudWatch度量功能。我們希望在那個階段看到CloudWatch度量的恢復,以獲得新的度量,但是度量完全復原可能需要更長的時間。
我們將繼續向您通報我們的最新進展。
據AWS稱,這次宕機僅影響亞馬遜23個地理AWS區域之一,但這個問題已經嚴重到影響到了大量網際網路公司的服務。
許多公司在推特上吐槽有關AWS中斷如何影響它們的信息。
包括1Password、Acorns、Adobe Spark、Anchor、Autodesk、Capital Gazette、Coinbase、DataCamp、Getaround、Glassdoor、Flick、iRobot、《費城問訊報》、Pocket、RadioLab、Roku、RSS播客、《坦帕灣時報》、Vonage、《華盛頓郵報》和紐約公共廣播電臺(WNYC)。專門監測網絡狀況的網站Downdetector.com也顯示,全天許多用戶紛紛反映亞馬遜的不少服務出現了問題。
值得一提的是,正值北美「黑色星期五」前夕,AWS宕機可能影響到亞馬遜的電商業務。有賣家稱,其亞馬遜上的訂單數據突然急劇下降,甚至廣告費用也出現了異常。
AWS是世界上使用最廣泛的雲計算服務之一,因此,任何問題都可能對其他Web服務和應用程式產生嚴重的連鎖反應,這一點可以從受今天宕機影響的公司數量中看出。
此前,AWS雲存儲服務S3也曾在2017年出現大宕機,該錯誤持續了4個小時,彼時AWS解釋稱該故障是由於一名程式設計師在調試系統的時候,運行了一條原本打算刪除少量伺服器的腳本,結果輸錯了一個字母,導致大量伺服器被刪。被錯誤移除的服務其中運行著兩套S3的子系統,從而導致S3不能正常工作,S3 API處於不可用狀態。