文經授權轉載自公眾號: 腦極體(ID:unity007),作者: 風辭遠
AI的萬丈高樓,正在拔地而起。
但是顯然,這座高樓不可能突然從地基變成一百層。在2019年,我們更多看到的是產業智能化基礎設施的演進、大量開發者的湧入,以及行業AI應用的滲透。
在這一過程中,有一條賽道可能並不聲張,但卻與產業智能化發展進程息息相關,那就是數據。
我們都知道,算法、算力、數據是AI三要素。算法的進化是AI產學各界的主要關注點,代表算力的AI晶片如今成為了社會各界共同觀眾的焦點。而作為「三巨頭」之一的數據與數據服務基礎設施,似乎相對有些沉默。
事實上,在即將過去的一年中,面向智能紀元與技術融合時代的數據開發環境,同樣迎來了一場巨大變局。對於開發者來說,很多難以克服的數據問題如今都找到了解決方案。當這一年的時間額度已經明顯不足,讓我們來回顧一下開發者眼中的數據變局。
為了回顧這個問題,華為在今年5月15日發布的GaussDB可以作為一個明顯的標誌物。它的出現,意味著智能時代開發者的數據問題,正在被產業正視和解決。
讓我們從開發者的視角,理順著GaussDB的脈絡,來回憶一下2019年的數據基礎設施,究竟發生了什麼變化。故事的開始,我們要先回到開發者在智能洪流到來時的思考與彷徨。
智能開發時代的數據基石
AI技術在產業應用中走向成熟,需要體系嚴密、具有清晰邏輯關聯性的產業支撐。也就是說,想要在智能時代最大限度釋放開發者的潛能,讓智能走入千行萬業,與大量新技術融合產生「智能溢出」效應,是一個典型的木桶理論——所有IT基礎設施與開發工具必須適配新階段的智能開發需求。
這個邏輯下,資料庫為代表的數據基礎設施,也就必須跟上智能的節奏,扛住時代的壓力。之所以這樣說,是因為智能時代的開發者,會清晰地感受到來自不同領域的明顯數據壓力。這些問題只能交給數據集成設施來拆解,否則就會成為整個智能開發體系的明顯短板。比如說,智能時代有這樣幾個典型的「數據壓力」:
1、數據潮:AI、5G、IoT、移動網際網路,所有這些新技術驅動,都意味著空前大的數據井噴,對現有資料庫的容量、存儲與調用效率、運維管理能力提出新的挑戰。數據如洪水般湧來,是開發者眼中最顯著的時代挑戰。
2、業務複雜性無限延申:智能時代,意味著雲邊端多場景都將出現複雜的業務部署與數據調用需求,這給資料庫帶來了分布式架構的挑戰,也對故障檢測維修、運維等課題帶來了新的挑戰。
3、強烈的異構計算需求:多技術融合是今天開發者的另一個重點工作,當傳統企業業務與雲原生、AI計算等新趨勢融合到一起。
或許可以這樣理解,能夠解決這三大挑戰的數據基礎設施產品,是智能開發時代必不可少的基石,也是數據產業走向下一產業階段的必經之路。而在開發者的立場上,最關注的顯然是走向AI紀元的資料庫產品何時能夠誕生,是否能真實支撐起現實產業場景裡的開發需求。
這樣的思慮下,GaussDB如約而至。
GaussDB與技術躍點
鎖定了問題之後,下一個階段就是回答。
在總結了產業智能化進程中,數據領域可能面臨的數據爆炸、複雜部署和異構計算三大難題後,華為推出了資料庫GaussDB。
而GaussDB之所以可以看作是給開發者的答案,原因也就蘊藏於其中。其一,在資料庫中運用AI技術,來解決傳統資料庫無法處理的諸多問題;其二。面向AI開發和AI應用,提供更領先、具備針對性的資料庫支撐作用。
當GaussDB包含著著兩層涵義而來,對於開發者們來說,一個新的技術躍點也隨之誕生,關於資料庫如何與智能時代關聯的諸多問題也就有了答案。
在面向產業智能化應用與開發過程裡,GaussDB通過異構計算創新框架,實現了x86、鯤鵬、GPU、NPU多種算力優勢的結合,在TPC-DS測試集中,性能表現較比業界提升了50%。
作為全球首款既支持x86架構,又支持華為鯤鵬架構的資料庫產品,GaussDB具備一系列性能表現領先性,比如支持單機、分布式和主備三種主流部署模式,可以滿足企業核心應用的訴求,高性能表現可以達到單機部署實測百萬級tmpC,分布式達到千萬級tpmC。
此外,GaussDB支持本地部署、私有雲、公有雲等多種場景,能為各行業提供資料庫進化的關鍵支撐。GaussDB攜帶的產業進化特性,可以看作是這一年中數據基礎設施變革的風向標。自此開始,數據產業的生態迭代開始步步推進。
資料庫的生態應用進展
在開發者的真實視野中,單一產品顯然不可能滿足所有開發需求與行業場景。想要讓資料庫真實發揮價值,就需要整個應用生態的配合進展。
這個層面,我們可以看到GaussDB在並不長的誕生時間裡,已經完成了一系列生態合作探索。在華為在「鯤鵬+昇騰」的計算戰略布局下,GaussDB 也成為了重要的生態支點與產業協作通道。
2019年9月,伴隨著華為「鯤鵬+昇騰」雙引擎正式全面啟動,一系列擁抱生態開放的計算產品策略被提上了日常。其中,GaussDB OLTP單機版資料庫宣布開源,開源版本的資料庫名稱為openGauss,可以覆蓋企業70%以上的資料庫業務場景,讓開發者可以在最底層擁抱智能時代的數據基礎設施。
在主動的軟體開源之外,一系列產業生態合作構成了另一條GaussDB生態化的主線,其中的進展完成了GaussDB的產業應用矩陣,帶動了IT服務市場上一系列新升級的發生。
比如在華為全聯接大會2019期間,上海愛數信息技術股份有限公司手華為發布了基於華為GaussDB資料庫的備份解決方案。這一解決方案面向數據保護領域面臨的海量數據安全問題,為GaussDB資料庫提供定時備份及恢復、集群全庫數據保護、集群恢復、傳輸和存儲加密,有效保障數據安全,並且能夠使存儲支持分布式架構,提升備份及恢復速率,有效應對PB級數據保護挑戰,形成了對GaussDB生態的重要補完。
在此之前,用友網絡科技股份有限公司與華為合作,宣布將基於用友企業雲服務和華為GaussDB 資料庫打造領先的聯合解決方案。雙方將共享產品計算優勢,共同完成大型企業數位化平臺NC Cloud等產品對GaussDB的適配。並在9月推出了NC Cloud+GaussDB的聯合解決方案。
同樣在9月的金蝶雲·蒼穹高峰論壇上,金蝶軟體(中國)有限公司與華為聯合發布了金蝶雲·蒼穹+GaussDB解決方案。金蝶雲·蒼穹解決方案是雲原生架構的新一代數位化企業共生平臺,採用分布式架構,支持微服務、容器服務、DevOps等為代表的雲原生技術,能夠幫助企業用戶構建PaaS+SaaS一體化企業級雲服務平臺。這可以看作GaussDB在企業服務領域的關鍵進展,為GaussDB技術優勢走入真實的產業空間拓寬了道路。
此外,在生態建設方面GaussDB還廣泛賦能培養資料庫人才培養。華為在9月份宣布將發起高校金種子發展計劃,並提供1.5億元的GaussDB創新研究啟動基金,與高校展開GaussDB實訓課程,成立十大GaussDB 高校聯合創新實驗室,通過產學研一體化進程打造世界級資料庫產品。
在軟體開源、產業生態合作與產學研一體化三條軌道上,GaussDB都在短時間中構建了完善的產業生態進展。這對於開發者來說,意味著具備更多真實使用GaussDB相關解決方案、基於GaussDB生態進行開發,融入GaussDB產業進程的機會。
而在容納廣度不斷提升的基礎上,GaussDB還做了另一件事,就是快速完成了大型政企與數據高標準應用行業的合規認可,讓GaussDB走向了深度應用的關鍵賽道。
從合規走向行業深入
一直以來,資料庫領域的核心爭議點在於,對於金融行業等特殊行業,以及大型政企等特殊用戶來說,他們對資料庫的性能、安全、運維有具體入微的要求。這些場景也成為了數據基礎設施走向智能時代的第一座產業高地。
某種程度上來說,特殊場景的數據產品滯後,會成為大型政企基於突破數據障礙,走向智能創新的關鍵問題。而解決之道,只能是資料庫代表的數據基礎設施,突破層層考驗,走向價值自我證明的極致。
GaussDB自誕生以來,完成的另一條重要突破,就是面向這些場景展開了不間斷的自我挑戰,完成合規測試。從而在三個關鍵詞:大型政企、高數據要求行業、核心業務,解鎖了自身技術支撐價值的獨特性。最適合大型政企的資料庫,也成為了GaussDB的代名詞。
2019年,GaussDB的合規測試成果可謂頗豐。8月,華為GaussDB資料庫與中標麒麟高級伺服器作業系統完成兼容性互認證測試。測試結果顯示,GaussDB與中標麒麟伺服器作業系統兼容性良好,安裝順利,系統功能正常,運行穩定。9月,億信華辰與華為正式宣布,雙方已完成億信BI(商業智能)產品與華為GaussDB資料庫兼容互認證工作。經嚴格測試,億信BI與華為GaussDB資料庫共同穩定運行,相互兼容、性能卓越、安全可靠,可為企業級應用提供全方位保障。這些測試證明了GaussDB在大型政企代表的高標準產業需求上,具備完善的適配性與高性能特點,成為GaussDB走入產業的基石。
在關鍵的金融領域,GaussDB在7月率先通過中金國盛金融行業標準符合性試點測評。基於華為鯤鵬處理器和通用CPU的GaussDB資料庫均通過本次檢測,82個檢測項全部為「符合」。這標誌著華為GaussDB資料庫的功能性、安全性、穩定性等方面都符合規範要求,並在銀行批量結息業務以及銀行信用卡代授權業務等場景中實現性能領先。換言之,GaussDB成功完成了金融大考這份頂級試卷。
此外,今年7月在數據中心聯盟發布了第八批大數據產品評測結果中顯示, GaussDB率先通過512節點分布式分析型資料庫基礎能力評測,為分布式資料庫的性能創新開創了新局面。
11月,華為發布了GaussDB OLTP資料庫雙分布式新架構。基於該創新架構與原創內核,GaussDB達成了面向金融行業核心生產交易系統,提供極致可用、應用透明、極致性能、強全局一致的資料庫產品與金融解決方案,保證金融核心數據實時可靠處理。並且基於創新內核,實現一套代碼滿足雙模業務分布式部署的需求,進一步強化了極致數據場景下最佳資料庫表現的特徵。至此,GaussDB達成了2019年在產業深度層面的不間斷探索,而更多的故事,就要交給2020了。
And more?
從5月誕生開始,僅僅7個月的時間,GaussDB完成了一系列高速進化,在技術特性、產業生態布局、行業合規測試方面不間斷拿出豐碩成果。這場資料庫的高速奔跑,意味著開發者可以在各行業、各場景中,尋找到與GaussDB合作完成開發工作的完整契機。當開發者面臨智能命題洶湧而來,雲、5G、IoT組成新的技術融合機遇時,資料庫不再是令人擔憂的短板。
但是顯然,這是故事的開始,而非旅程的結束。GaussDB和華為在智能數據領域的探索,這個命題上開發者的無盡想像,都會無縫銜接進入2020。年歲交替,更高的起點意味著更精彩的開發者傳奇。
在2020年2月11-12日,華為開發者大會2020(Cloud)亟待揭曉。GaussDB的進化和「智能+數據」的探索,將在其中繼續盛放。
今天,數據之變遠未完結——數據與AI的結合、產業場景的深入、技術融合趨勢中資料庫的戰略進化,都還等待著開發者們一個個去揭開謎題。
答案盡在不遠處,華為開發者大會2020(Cloud)也在不遠處。
開發者同樣是生態的重要角色。2020年2月13-14日,華為將在深圳與所有生態角色一起,共議數位化轉型路徑、共商生態演進策略、共建行業創新能力、共享未來成長空間,敬請關注「華為中國生態大會2020」。
特別聲明:本文為合作媒體授權DoNews專欄轉載,文章版權歸原作者及原出處所有。文章系作者個人觀點,不代表DoNews專欄的立場,轉載請聯繫原作者及原出處獲取授權。(有任何疑問都請聯繫idonews@donews.com)