里程碑式反超!中國自研數據庫超越Oracle登頂全球第一

發布時間:2019-10-04

微信圖片_20191006023618

10月2日,在濃濃的國慶氣氛中,一場“技術閱兵”在大洋彼岸上演。

結果再添喜氣:繼5G移動通信和高端芯片之后,中國公司在又一個“核高基”領域取得了重大突破。

螞蟻金服自主研發的數據庫OceanBase打破數據庫基準性能測試的世界記錄,成績是前世界記錄保持者、老牌巨頭甲骨文(Oracle)的兩倍。數據庫領域最權威的國際機構國際事務處理性能委員會(TPC,Transaction Processing Performance Council)在官網發表了這一最新結果。

對此,中國工程院院士、計算機專家李國杰表示:OceanBase打破了由甲骨文保持了9年之久的TPC-C基準性能測試的世界紀錄,“是中國基礎軟件取得的重大突破”。

長期依存

時間回到1997年,北京機場跑道上,國賓車隊一字排開、閃著大燈。

甲骨文創始人埃里森(Larry Ellison)初次到訪中國,這位數據庫帝國的掌門人計劃到長城拍攝推廣網絡計算機的宣傳片,時任甲骨文中國總裁的馮星君找了20個小學生一同參與拍攝。

約好早上8點開拍,但直到9點,埃里森還沒起床。

當天的北京零下二十幾度,小學生們在沒有暖氣的大巴上苦等,馮星君帶著哭腔給埃里森電話,一個多小時后,大老板才終于現身。

無奈的等待和敢怒不敢言背后,是國內在數據庫服務上對甲骨文的全面依賴。

彼時的中國,商業力量快速復蘇,外貿進出口總額突破4000億美元大關,相伴而生的,是信息技術需求的井噴。甲骨文的數據庫,正是軟件中最硬的核心技術。

不能說國產數據庫完全不行——但上世紀90年代才蹣跚起步的國產數據庫,中國已經來不及等它長大。戰場迫不及待需要成熟的戰士。

于是,國內幾乎所有機構和公司,從金融、電信到航空,清一色地使用甲骨文。

這意味著,中國人每一筆銀行取款、轉賬,每一次充話費、買機票的數字,都儲存和運行在美國的數據庫上。

自主研發

數據庫的重要性絲毫不亞于芯片,沒有數據庫,就沒有信息科技的發展。受制于人的局面急需改變。

2006年,國務院發布《國家中長期科學和技術發展規劃綱要(2006-2020年)》,提出“核高基”的概念。“核高基”是對核心電子器件、高端通用芯片及基礎軟件產品的簡稱,同時也是與載人航天、探月工程并列的16個重大科技專項之一。其中,基礎軟件就包括數據庫、操作系統、中間件等。

不過,趕超之路談何容易。

此次以兩倍優勢反超的阿里巴巴一度是甲骨文中國的標桿客戶,淘寶、支付寶等公司98%以上的軟件系統和業務都由甲骨文數據庫提供數據服務。但隨著雙11成為現象級商業活動,幾何級增長的交易量把一個嚴峻的問題擺上臺面:如果繼續使用甲骨文,為了應對天量數據,只能再花上億人民幣購買主機。

他們選擇了自主研發。

當時阿里有自己的數據庫研發團隊,但很多人不看好。畢竟甲骨文有十幾萬人,從事核心數據庫研發的超過兩千,而阿里數據庫團隊20多個人,團隊負責人陽振坤此前在另一家大廠開發數據庫,兩年多沒出成績被掃地出門。

所幸新東家給了足夠的耐心和支持,才有這個后來居上的故事。

如今,OceanBase已在螞蟻金服和阿里巴巴的業務系統中得到廣泛應用。數億人能夠隨時隨地網購、移動支付,背后都靠OceanBase數據庫的力量。從2017年開始,OceanBase數據庫開始對外開放,服務包括銀行、保險等金融機構。

創造紀錄

TPC-C是全球主流計算機硬件廠商、數據庫廠商公認的評價標準,被譽為“數據庫領域的世界杯”。

TPC-C標準模擬了經典商品銷售付款場景來做測試,通過每分鐘創建新訂單數量來評價數據庫的性能和性價比。OceanBase以60,880,800 tpmC(每分鐘內系統處理的新訂單個數)創造了新的聯機交易處理系統(OLTP)世界紀錄。

過去數十年,TPC-C一直是海外傳統數據庫廠商競技的舞臺,而OceanBase是登上TPC-C排行榜前列、由中國公司完全自主研發的第一款大型數據庫產品。

尤其值得一提的是,OceanBase不僅在性能指標上創造了新紀錄,還成為全球首個通過TPC-C審計的分布式無共享關系數據庫。據介紹,此次TPC-C測試結果是在阿里云標準云資源支持下實現的,改變了之前高性能測試結果都依賴專用集中式存儲設備和管理軟件的實現方式,以完全分布式的軟件架構達成這一突破性成果。

此次登頂國際權威排行,也是云時代中國數據庫換道超車的標志。

趟出新路

OceanBase的崛起,不只是商業力量競逐的結果,更有時代變革的紅利。

此前,國產數據庫之所以沒有得到廣泛使用,原因主要在于金融、電信、航空等關鍵行業必須確保數據庫的可用和穩定,無法給新興的國產產品試錯空間。

而電子商務完全是新興領域,雙11的交易規模,完全超出甲骨文的經驗范圍,反而有了趟出一條新路的機會。

OceanBase是云計算時代中國數據庫的代表。幾乎同一時期,達夢、人大金倉、神通、南大通用等一批國產數據庫都陸續應用到央企、國家財政、軍事等專用領域。華為、騰訊等中國公司也紛紛推出了自己的數據庫產品。

但與此同時,在底層核心技術突破、產業生態建設等方面,國產數據庫仍面臨挑戰。

據第一財經報道,深耕數據庫領域多年的南大通用首席技術官武新曾表示:甲骨文、微軟等公司經過幾十年的發展,建立起非常強大的生態系統,這種依存關系還將維持一二十年,而中國的生態系統仍然較為薄弱,這與缺乏技術基礎積累有關。

數據庫是支撐人工智能、區塊鏈等新技術的基礎技術,尤其是在核心敏感行業,自主可控意義重大。建設強大完善的自研數據庫,中國技術人仍在“升級打怪”的路上。 

(來源:科技日報  圖片均由本文作者提供) 

分享到: