破舊立新,6個問答看偶數科技在短短一年中的新變化?
2018年10月17日,偶數科技創始人常雷作為第十屆中國系統架構師大會的特邀演講嘉賓在會上進行了《新一代數據倉庫OushuDB演進之路》的主題演講,這是筆者第二次接觸採訪常雷,距離上次採訪已有一年之久了。
2017年10月到2018年10月,這一年時間對於偶數科技來說是一個很重要的時間節點,這一年中,偶數科技完成了紅杉中國領投、紅點中國跟投的A輪融資;核心產品OushuDB完成了多次產品迭代;入選微軟加速器並圓滿畢業;主導的HAWQ項目成功晉陞為Apache 頂級項目……
從上文中不難看出,這一年偶數科技不僅在積極破舊,同時也在立新,那麼對於這一年中的變化,常雷作為企業發展的領導者又是如何解讀的呢?下面我們就從公司定位、產品發展、競爭合作等多個維度來解讀一下。
嘉賓介紹:
常雷,偶數科技創始人兼CEO,2008年畢業於北京大學計算機系。常雷是 Apache HAWQ創始人,曾任EMC高級研究員、EMC/ Pivotal研發部總監,長期專註於人工智慧、大數據與雲計算領域,在國內外頂級數據管理期刊和會議(如 SIGMOD等)發表數篇論文,並擁有多項國際專利。
採訪實錄:
1.偶數的定位是「一家領先的AI和大數據軟體提供商」,請問偶數科技內部是如何定位人工智慧?
常雷:偶數最開始是做數據分析的工作,而數據和人工智慧是密不可分的。之前,我們並沒有把機器學習獨立出來,而是在OushuDB有一個機器學習的庫MADlib。後來,我們在人工智慧方面做了大量的工作,例如自動化機器學習等等,我們認為時機成熟了,是時候將人工智慧獨立出來做一個單獨的產品線了。
所以,對用戶來說,人工智慧是新出現的一條產品線,但是對偶數內部來說是一直存在的。
2.能否介紹一下「人工智慧」這條新產品線?
常雷:在產品方面我們是遵循一條主線——數據分析和人工智慧,圍繞這條主線,產品線的形態會發生一些變化。之前,我們的OushuDB以及內置的人工智慧庫都是在私有雲上跑,而現在我們和微軟合作將它們放到了公有雲平台上,形成了一個新的產品——Lava。Lava實際上是一個將OushuDB或LittleBoy放到公有雲上的系統,提供的服務仍然是數據倉庫服務和人工智慧服務。
剛才也提到人工智慧並不是全新的產品線,現在獨立出來,對用戶最大的好處是開發應用時能夠清晰明確在何種場景下該使用何種產品。
3.除了人工智慧產品線,大家也很關心偶數的核心產品OushuDB在這一年的發展變化。
常雷:2017年9月,偶數正式發布了Oushu Database 3.0。OushuDB 3.0其實是我們性能優化的第一個版本,當時它只可以支持一些簡單的查詢,在TPCH(國際上公認的SQL性能測試標準)的20多個查詢中只支持Q1和Q6,而且在語法上也有諸多限制。
這一年中,我們進行了從3.0到3.X再到4.0的版本研發,並支持了TPCH所有的22個查詢。而這一變化對於產品功能和用戶體驗來說都是一個巨大的提升,因為真實客戶環境中的工作負載是非常複雜的,它需要支持各種各樣的語法。另外,在性能方面也有了很大的提升,與我們自己之前的版本相比,大約是5到10倍的性能提升,而與傳統的SQL引擎來,可以快到幾十倍。
4.您剛才在演講中提到OushuDB 4.0也將很快和大家見面,能否提前劇透一下OushuDB 4.0的亮點?
常雷:OushuDB 4.0最大的亮點有兩個,第一個是新的SIMD執行器成熟了,之前可能只有少部分場景可以用得上新執行器,功能也不是很齊全;第二個是我們添加了update、delete等傳統資料庫支持的經典功能。這是SQL on Hadoop引擎一直解決不好的部分,它們做update、delete、index等操作是非常慢的,基本上不可用。OushuDB 4.0解決了這一問題對用戶來說意味著什麼呢?就是你在享受十倍性能提升的同時,還可以像使用Oracle那樣使用OushuDB。
5.上文我們提到了偶數去年加入了微軟加速器,能否透露一下雙方具體的合作事宜?偶數是如何選擇雲平台合作夥伴的?
常雷:加入微軟加速器對於我們的幫助其實不小,尤其是在產品和市場方面的幫助。在雲上,我們雙方的合作可以分為兩部分,一部分是把我們的產品直接發布在Azure上形成新的服務;另一部分是我們將OushuDB及其它一些組件放到了微軟的雲市場上。
企業要在雲平台上開發一些底層系統,如果不和雲廠商合作的話,相對來說會有一些局限。我們雙方的合作模式是微軟提供底層強大的IaaS平台支持,而我們提供數據分析和人工智慧產品。
在雲平台的合作方面其實我們是很開放的,因為我們的產品是獨立的組件。之所以優先選擇微軟,一是因為微軟Azure的知名度,二是因為微軟Azure在全球公有雲市場的份額也很靠前。之後,我們也會在其它雲上發布我們的產品,大家可以期待一下。
6.有合作肯定就也有競爭,現在進入資料庫領域的廠商越來越多,BAT、初創公司、跨界公司等等,您如何看待偶數和他們之間的關係?
常雷:很多廠商入局資料庫,證明這個行業有需求,而且只有大家一起做整個行業才能變好。關於競爭關係,我們認為至少現在還不存在。
首先,BAT等企業其實更專註於解決自家的業務需求,其使用了大量的開源軟體,甚至也會有我們的產品HAWQ。而偶數走的是另一個更加創新的模式,我們的產品能夠快速響應客戶需求,並快速迭代。另外,偶數是提供產品,BAT都有自己的雲平台,我們之間其實是互補的,更可能形成一種合作關係。
目前,做新一代雲數據倉庫的公司其實很少,我們算一家,大部分還是基於傳統數據倉庫,所以市場廣闊基本競爭還不是很大。雲數據倉庫是大趨勢,傳統廠商是必然要跟隨的,但是當傳統廠商的產品經過數十年的發展,很難對其產品進行很大的改動,所以,在技術的沉澱和積累期,偶數其實一直是「引領」的狀態。
寫在最後:
其實,我一直在思考用一個什麼樣的詞來形容偶數科技這一年的變化,後來我想到了一個貼切的詞——「新瓶陳釀」。這裡的「新瓶」指的是偶數科技全新的「人工智慧」產品線以及產品形態,而「陳釀」指的是偶數科技不斷創新加深的技術迭代。也許,未來你會看到偶數會有更多的產品形態,甚至是新的產品線,但其內在始終不變的是技術創新,隨著時間的沉澱,這「陳釀」定會越來越誘人!


※Splunk>live!2018北京開講:合格的大數據處理平台是什麼樣子?
※快狗打車CTO沈劍:開源框架VS自研框架,企業該如何選擇?
TAG:IT168企業級 |