IT之家公告:完成阿里雲至百度雲站點遷移工作

2020-12-21 IT之家

致IT之家所有讀者,

今日早間5:00-7:00期間,我們完成了IT之家核心數據從阿里雲平臺至百度雲平臺的遷移工作,並切換更新了域名解析。7點之後到下午4點,基本完成了遷移工作的「後遺症」處理,解決各種遷移帶來的一些訪問或者報錯問題,到現在全平臺的各項網絡服務基本全部OK。

遷移網站是個龐大繁瑣的事情,最近一直在做各項準備,最終選定今日早5點(每天訪問的低谷時段)進行了遷移,避開白天時段最大程度實現站點底層平臺的平滑過渡。

這兒要特別對大家說聲抱歉,畢竟從7月初遭遇隨機故障到後來的持續性問題,已經過去了3個半月,在此期間我們一刻也沒有鬆懈,持續與原服務平臺做各種交涉和等待改進,直到最後不得不重新接洽選擇雲服務商。下面我就把個中的具體情況和大家解釋說明一下——

本次遷移主要起因和過程簡要說明:

  • 2016年3月份IT之家正式使用阿里雲平臺,2016年7月10日開始,大約每周會出現1-3次的間歇性訪問卡頓、無法訪問故障,尤其是在21:00-22:30這個晚高峰期間,頁面加載慢或加載不了,登錄失敗……但是基本上都是5-30分鐘之後恢復正常,一般這邊接到簡訊通知異常開始排查,那邊很快就正常了。我們在這期間保持高度關注,但基本處於可忍受狀態。

  • 2016年8月14日星期日早8點開始,出現嚴重的全天性卡頓(網站和APP每隔幾十分鐘就出現無法連接),ECS主機的CPU佔用率持續100%,IT之家產品部網站技術組的同事和開發組的同事10餘人投入參與問題跟蹤,從APP接口、網站性能、伺服器日誌、資料庫算法、新聞小偷非法高頻抓取、站點訪問量等各方面進行排查,沒有發現絲毫異常。在發生問題的當天為解決這莫名問題,還付費進行了伺服器硬體配置升級,卻始終被提示升級失敗;

  • 次日2016年8月15日,在工單和IM服務群裡各種催促,問題查明,阿里雲技術人員答覆物理機負荷過大,導致分配給ECS雲主機的計算資源縮水,同時滿負荷也導致無法追加新的硬體升級需求。阿里雲客服間的溝通分分鐘持續不間斷,晚上21點開始關閉伺服器主機,技術人員安排遷移雲主機到新的物理主機上,遷移只用了幾分鐘,高峰期間的CPU直接從100%降到了50%前後;

  • 次日2016年8月16日,遷移後的主機顯示配置升級成功,和客服人員溝通一切恢復正常,不再需要升級配置,但卻被拒絕:「升級訂單已生效,因此不支持退款,且伺服器降配,需要在伺服器到期時進行續費降配,請你了解,謝謝」……因為自身技術原因,客戶無奈升級配置,發現實為一個平臺本身故障的時候,也不給退款。好吧,就這樣吧,不是啥大事,只要服務穩定,忍了吧,畢竟溝通一次的成本太大,一切通過工單溝通,再設法催工單,一個簡單的事情幾個小時得到正確的回覆都算快的。然而,到了18點整,故障再次發生,這次是徹底服務中斷,伺服器ping都無法ping通,18:24伺服器恢復,客服答覆原因:物理主機宕機了……連續3天的高頻故障,遷移到新的物理平臺,竟然物理平臺死機了,所有上面的雲主機都自然「失聯」……接近半個小時的服務全面中斷;

  • 接下來的時間,我們給阿里雲做了一個提案,希望阿里雲給接入一個更靠譜的平臺,物理平臺能保證不縮水所購買的計算能力,畢竟缺斤短兩這是任何時候任何商業單位都不能接受的「價值觀」。客服組非常熱情,建議我們不要對用戶發布通知公告,會有負責的領導來和我們溝通,然……

  • 2016年9月21日開始,晚高峰再次出現卡頓問題,症狀依舊認真分析排查各種可能,最後還是回歸到物理平臺的超載;阿里雲在此期間給我們發來一個通知,針對之前的各種情況,決定給我們賠償:延長服務期1天。之前有聽說過百倍賠償的各種傳聞,今天也沉默著看到了這種結果。等不來誠摯的道歉溝通和服務改進卻等來了這個,便立即開始安排網站技術組和產品部負責人去選擇新的雲平臺,必須在國慶節後第一時間安排遷移。

  • 2016年9月30日開始測試百度雲平臺,因為IT之家構建於微軟的.NET和SQL Server資料庫架構之上,這就篩掉了絕大多數國內雲服務平臺,同時考慮域名備案和國內線路的特殊性也過濾掉了外企雲平臺,從站點連通率、速度、高峰期計算能力壓力測試、CDN業務等多方面對百度雲進行了測試,一直到10月20日結束。

  • 2016年10月19日晚高峰期間,阿里雲各平臺又出現半小時以上的卡頓……再次關機進行了物理平臺遷移……

  • 2016年10月20日-24日,百度雲各項測試和接入預演;

  • 2016年10月26日早上5點-7點,百度雲RD工程師和軟媒工程師進行主資料庫遷移和域名解析,7-15點各種細節問題修復,15點開始著筆這份遷移工作匯報。

後語:

以上是事情的真實經過,我們希望這個站點遷移公告能讓所有讀者了解整個過程概況,也希望阿里巴巴集團高層和阿里雲高層能像月餅事件一樣重視目前的問題,缺斤短兩、超賣是更為嚴重的價值觀問題,直接是信譽和品行問題。我們期待著遲遲未等到的官方的回覆,我們也會收到溝通後及時向大家公示他們的改革和進步。阿里雲平臺的技術能力和客服組的熱忱,都是非常到位的,其實我們從內心深處相信,每一個雲平臺的初心都是想給客戶提供最好的服務的。

每次的遷移都希望是最後一次,每次的遷移都是非常的痛苦和折騰。回想2003年第一次創業做商業網站到現在,從虛擬主機、伺服器託管、雙線機房、多線機房、真BGP機房、自建節點、CDN加速、雲主機……這樣一路走來,IDC業務上該經歷的基本全經歷了,坦言說,「雲化」確實是最佳的選擇,一旦上雲,欲罷不能。

今天是遷移的第一天,我們還會持續觀察各項服務的穩定性,同時也會從今天起開始重新優化站點架構,對圖片、視頻等資源引入百度雲CDN節點加速服務,我們會很認真的做好最基礎的服務和我們的內容服務、產品服務。

再次對最近幾個月的不穩定情況向朋友們表示深深的歉意!

刺客,軟媒 CEO,

2016年10月26日,16點,青島。

相關焦點

  • 阿里雲和百度雲公有雲馬拉松戰,IT之家成「炮灰」
    今天一篇《IT之家因無法忍受阿里雲而遷移至百度雲》的文章引起了業內極大的關注;大家關注的焦點也逐步從事件本身拓展到:阿里雲底層架構是否落後了、哪些要素是公有雲的核心競爭力以及目前公有雲行業競爭格局是否會發生變化;下面就上述幾個問題談談我們的理解。
  • 網際網路史上最大數據遷移之一:115科技遷至阿里雲
    6月7日,上海雲棲大會上,115科技和阿里雲宣布完成阿里雲史上最大數據遷移上雲項目,115科技的全部數據都搬遷至阿里雲上,規模超過100PB,整個項目耗時僅45天,創造了新的「中國速度」,這也是中國網際網路史上涉及用戶量最多、數據規模最大的遷移項目之一。
  • 《復仇者聯盟2》背後特效公司Animal Logic遷移上阿里雲
    【獵雲網北京】11月15日報導擁有近30年歷史的澳洲知名視覺特效製作公司Animal Logic日前首次將海量數據從本地遷移到雲上,通過阿里雲提供的技術,不但保證了數據安全,還大大提升了特效製作的效率。
  • 阿里雲趙殿奎:PolarDB的Oracle平滑遷移之路
    在DTCC 2020大會分布式資料庫實踐專場上,阿里巴巴高級資料庫專家趙殿奎為大家介紹阿里巴巴電PolarDB的Oracle平滑遷移之路。演講嘉賓簡介:趙殿奎,阿里巴巴高級資料庫專家,從事OLTP資料庫和OLAP資料庫產品的研發工作10餘年,現為阿里雲PolarDB資料庫內核北京研發負責人。以下內容根據演講視頻以及PPT整理而成。
  • 阿里雲、騰訊雲的新戰場:金融雲
    2015年7月,政府發布指導意見,提出「探索推進網際網路金融雲服務平臺建設」,鼓勵探索利用雲服務平臺開展金融核心業務。2016年7月原銀監會發布指導意見,要求到「十三五」末期,銀行業面向網際網路場景的重要信息系統全部遷移至雲計算架構平臺。2018年8月央行連發三項金融行業雲計算標準。到2019年8月央行發布了明確的金融科技發展規劃。
  • 雲賽道競爭加劇,百度智能雲機會何在?
    它需要全鏈路的支撐,百度智能雲在服務和支撐政企客戶的過程中自然會形成自身的市場空間。針對細分領域做深服務,這是百度智能雲最大的機會所在。」2020年是雲與計算產業的拐點之年。突發的新冠疫情讓「上雲」成為剛需,新基建政策倡導讓雲計算基礎設施成為政府、企業的建設目標。
  • 工場微金:因數據遷移工作暫時停止平臺網站和APP相關服務
    網貸天眼訊,4月28日,工場微金對外發布公告稱,公司於2020年4月29日將數據及服務從原機房遷移至阿里雲,並同時完成線上線下數據備份工作。屆時工場微金及金融工場網站和APP相關服務將停止。公告還表示,目前平臺技術人員正在進行數據遷移及查詢程序開發工作,此項工作將持續40天左右。
  • 中國雲市場,誰在挑戰阿里雲、騰訊雲?
    這個市場格局有點類似當前美國雲市場的「三家馬車」模式。奇怪的是,這份報告裡,阿里雲跌出了前四,IBM升至谷歌之後。一般在Gartner的報告裡,阿里雲與AWS和Azure一直是穩定的「3A」格局,這次可能是由於加入了「託管私有雲」的市場,阿里雲有所下跌(被谷歌擠下),甚至排在IBM之後。
  • 拋棄傳統集中式架構 江西農信攜手阿里雲實現業務系統平滑遷移上雲
    來源:時刻頭條12月4日,記者採訪獲悉,江西農信日前攜手阿里雲,使用最前沿的雲原生技術,實現了傳統業務系統從集中式技術架構下移,並平滑遷移上雲,為整體核心系統進行分布式架構升級和演進探索和積累了堅實的技術基礎。
  • 雲伺服器租用價格多少錢?阿里雲伺服器低至82元/年
    與其說他們是幸運兒,不如視為成功者,仔細了解,他們必定會有一些與眾不同之處。「就我所認識的一些資深站長而言,他們不但懂技術,而且深知雲伺服器哪家好,甚至連不同品牌的雲伺服器租用價格都了如指掌,這就相當不一般!」阿里雲伺服器教程網負責人如是說。
  • 濰坊市人社局信息系統遷移上雲公告
    濰坊市人力資源和社會保障局信息系統遷移上雲公告按照信息系統上雲工作要求,濰坊市人力資源和社會保障局信息系統將於2020年12月25日18:00至12月27日24:00遷移至濰坊市雲計算中心政務雲服務平臺。
  • 考拉海購全面雲原生遷移之路
    「年初,我們就完成了考拉全部遷移至阿里雲。但我們認為這還不夠,又給自己定了新的KPI,9月之前讓所有的應用擁抱雲原生。」  最終,考拉海購全量完成了遷移,性能沒有出現任何問題。「整個遷移過程比較穩定順滑,到了阿里雲,雲網絡這塊也放心多了。」  考拉海購100%全站遷移至阿里雲後,穩定支撐了今年3.8女神節大促。據了解,這是考拉遷移上雲後的首個大促,當天流量峰值較2019年雙12增長了72%,但相比之前成本大幅度降低。考拉海購各業務線也在當天被證明100%打通,形成閉環。
  • 百度網盤:是時候向115網盤和阿里雲學習了
    ,如今阿里雲突然強勢登場,針對百度網盤的各種軟肋重拳出擊,形成聲勢浩大的圍剿之戰...... 古語有云,不是不報時候未到;一山還比一山高,惡人自有惡人磨,這些話用來形容當下的百度網盤再確切不過了。百度網盤在業界看似沒有對手,但早已危機四伏,阿里雲網盤的突然襲擊,就是最好的證明...... 截至2020年7月,國內網盤存儲APP月活躍用戶前三名,分別是百度網盤、微雲、115網盤。
  • 阿里雲高防伺服器多少錢?阿里雲高防雲伺服器價格表
    但是,就具體的市場份額佔比來看,排名第三的阿里雲品牌增幅最快,其全球市場份額由2018年的7.7%,再度上揚1.4%,直接漲至9.1%,亞太市場份額上漲2.2%,一如既往地保持著「亞太第一」的實力頭銜。
  • 華為雲助力錦江都城1小時完成數據遷移
    暑期已至,各地酒店面臨營業高峰。然而,很多酒店從業者可能還沒意識到當自家的IT系統遇上日益高速增長的訂單時,壓力稍大就會有「掛掉」的危險。對此,酒店行業正面臨一場有關於「雲」的變革機遇。誰能當機立斷、將核心業務遷移至高效、安全、穩定的公有雲平臺上,誰就能在未來的經營中「高枕無憂」。
  • 「百度雲」開,不見世明-虎嗅網
    而當時,2009年成立的阿里雲已經手握超50%的市場份額,2013年開始進軍雲計算的騰訊雲也已經在市場上站穩了腳跟。雖然百度在李彥宏口中是「天生具有雲計算基因」的公司,但這絲毫不能掩蓋百度智能雲起步晚的事實。
  • 阿里雲「雲網絡3.0」:構建應用、雲、邊一體網絡
    中國聯通也提出了雲網一體化戰略,並構建了雲聯網系統。  如果說運營商是由網及雲,那麼雲服務商就是從雲到網,兩者之間更深入地連接、協同。作為雲計算行業領頭羊,阿里雲可謂典型代表,在雲網絡領域已經探索10年之久。在近日舉辦的2020中國雲網絡峰會上,阿里雲智能事業群研究員、網絡產品負責人祝順民首次提出了「雲網絡3.0」的概念。  如何理解雲網絡?
  • 全球第四大航空南方航空與阿里雲合作,成首家雲上航空公司
    11月22日在2017雲棲大會•廣東分會上,中國南方航空電子商務部副總經理盧春分享了南航與阿里雲的合作:作為首個實現全流程電子化的航空公司,南方航空又率先與阿里雲合作,利用雲計算重構信息化系統,並將網上銷售系統的部分應用搬到雲上。
  • 百度雲突圍之戰
    從收入絕對值來看,百度雲離阿里雲差了不止一個騰訊雲,在當下的時間點,也許更能看出百度云為雲計算賽道寫好的劇本。百度雲對百度的戰略意義看百度雲,首先要看百度雲在百度集團的戰略定位。張亞勤曾言,百度是一家AI公司,作為百度 AI 戰略的載體和源動力,百度智能雲是百度大腦的雲化。
  • 網際網路史上最大數據遷移 原來阿里雲用了它
    6月7日,上海雲棲大會上,115科技和阿里雲宣布完成阿里雲史上最大數據遷移上雲項目,115科技的全部數據都搬遷至阿里雲上,規模超過100PB,整個項目耗時僅45天。有好奇的快科技網友進行了速度計算,就算這45天一刻不停的連續傳輸,也需要27GB/秒的速度,工程堪稱海量。