無論是在家上網課的小朋友,還是積極擁抱公有雲的企業,或者為企業和個人提供雲服務的 MSP ,都已經切切實實處在這紛繁複雜的多雲世界。如下圖所示,各種類型的訪問者,在不同位置訪問各自的應用和服務,完全不需要知道底層走過了哪些運營商線路,也無需知道應用服務落地在哪個城市。
然而,用戶享受便利的另一面是多雲給運維帶來的巨大挑戰。比如當用戶體驗變差時,如何判斷是智能終端的問題?還是某一個運營商線路的問題?抑或是雲服務或企業服務商的問題呢?思科在近期納入麾下的又一個 AIOps 產品(基於人工智慧的運維) — ThousandEyes ,正是為了解決這個難題而生。ThousandEyes 成立於 2010 年,針對各類企業/服務供應商/金融提供豐富的網絡全路徑透視解決方案,能夠可視化地展示全網絡企業本地和雲端的應用響應情況。典型客戶包括微軟、salesforce、CapitalOne、PayPal、mastercard、NTT 通信、CenturyLink (運營商) 、COMCAST 等等。
下面我們用 4 個場景來看看 ThousandEyes 如何幫我們看透多雲世界的迷霧,享受滿分服務。
場景一 令人抓狂的網課
「爸爸,我的在線課堂回放又看不了啦。嗚嗚嗚…」
爸爸趕忙跑過來。
「寶貝別著急。爸爸來找支持熱線。」
「喂喂喂,你們這個怎麼回事啊?「
沒有 ThousandEyes 的情況下…
「 先生您好,我們其他大部分用戶都能正常上課。
要不您重啟一下應用試試?
……
要不您重啟電腦試試?
……
要不您重啟路由器試試?
……
都不行……那過會您再試試?」
「 都快下課了!你們到底知不知道問題出在哪兒?」 爸爸憤怒地摔了電話。
有 ThousandEyes 的情況下…
客服熱線接到客戶投訴後打開運維界面,即可反饋給家長是網絡某段鏈路問題還是內容服務端有問題,並給出正確的建議,省卻了無盡的猜測和扯皮。
ThousandEyes 是如何做到的呢?
以訪問 Webex 的一段視頻錄像課為例,ThousandEyes 會自動診斷電腦本身,無線、網關以及目標網站的訪問速度是否有異常。
如果確認不是家裡網絡的原因,可以查看全鏈路的健康狀態判斷哪個運營商哪段線路可能有問題。
瀑布流( Waterfall )甚至可以揭示非網絡的問題,比如下圖會議視頻的回放失敗,是因為該內容已經失效。
更棒的是 ThousandEyes 提供完善的 「分享」 (運維畫面的網址) 功能,任何故障,可以分享給合作的運營商 (或多雲運營商) 運維團隊,便於高效、精準的定位和修復故障。無需盲目重試重啟,就能讓運維團隊知道在何處施力。
場景二,千年等一回的網頁
「 每天都要連回公司的伺服器提交項目匯報已經夠累了,現在這頁面不但越來越慢,還經常打不開。我一定要找運維的人問問怎麼回事。」
沒有 ThousandEyes 的情況下…
「 小王,這應用怎麼越來越慢啊?是不是網絡不好?」
「 有可能是網絡,只是不知道是哪個環節的網絡。其實吧,也有可能是伺服器容量不夠?或者這個新應用性能不夠優化?」
「 到底是什麼原因?能不能趕緊解決?」
「 我找其他幾個團隊問問去… 」
若干天后…
「 小王,上次說的問題好像有點改善了?你們怎麼解決的?」
「 我剛湊齊應用部門,伺服器部門和網絡部門的人,應用反應速度又自己變快了。所以我們也不知道怎麼回事。」
「 啊!那沒找到原因,以後再出事了還是不知道怎麼辦嘛?」
「 嘿嘿,這個嘛… 我們打算請法師給貼個平安符…」
有 ThousandEyes 的情況下…
「小王,這應用怎麼越來越慢啊?是不是網絡不好?」
「 讓我看一下 ThousandsEyes 的分析 」
一分鐘後…
「 老闆,不是網絡原因。我們的用量比較大,應用系統反應有點慢 。」 伺服器部門反映 「虛擬機資源有點不夠了,我們加點伺服器資源就能解決了。」
ThousandEyes 是如何做到的呢?
ThousandsEyes Enterprise Agent (企業版本的代理) 除了能裝在網絡設備上外,還可以安裝在企業私有雲或公有雲平臺的虛擬機或者伺服器上,檢測目標服務,模擬不同區域的員工對於同一個服務的訪問。可視化頁面讓 IT 運維團隊一目了然前後數日的訪問性能,避免了從不同部門收集數據的麻煩:
可視化運營商全路徑、節點和線路質量,讓運維團隊精準定位故障點:
ThousandEyes 的 「 神通 」 遠不止以上這些,歡迎移步到本文的下篇了解更精彩內容。