斯坦福博士李紀為成立AI金融公司香儂科技,獲紅杉中國數千萬天使投資
機器之心原創
作者:李澤南
李紀為博士是近期湧現出的著名青年 AI 學者之一,在 2017 年 7 月份博士畢業之後不久,機器之心就對他進行了獨家專訪,並與他探討了 NLP 研究、博士生涯等問題。歷經半年,李紀為博士在大公司招攬與創業之間,毅然選擇了創業,加入了 AI 創業大軍。
李紀為等人成立的人工智慧金融公司「香儂科技」Shannon.AI,剛剛獲得紅杉中國數千萬天使輪融資。
香儂科技官方網站:http://shannon.ai/
李紀為博士期間研究方向是人工智慧的一個重要分支——自然語言處理(NLP),他是第一位僅用三年時間就獲得了斯坦福大學計算機科學博士學位的人。在三年的博士生涯中,他的多篇論文被各類頂級會議接收,他也是自然語言處理領域引用量最高的博士生之一。據統計,ICLR 2017 上李紀為有三篇論文被大會接收,其中兩篇為第一作者;在 EMNLP 2017 上,他有兩篇論文被大會接收,同樣均為第一作者。
李紀為此前在接受機器之心專訪時曾經表示,「如果有合適的機會,創業當然非常有可能。」如今看來,李博士最終還是選擇創業,他告訴機器之心,經過半年的準備,他與兩名大學同學共同創立了 AI 金融公司——香儂科技,專註於利用 NLP 技術提取、分析金融信息,為廣大投資者提供有效、準確、全面的投資信息。據了解,香儂科技已經獲得紅杉中國數千萬元人民幣天使輪投資。
在投資消息發布前,機器之心對李紀為博士進行了專訪,了解其創立的香儂科技、AI 金融、NLP 等方面的問題。
李紀為博士(右)接受了機器之心編輯的專訪。
機器之心:恭喜公司天使輪融資成功,目前你的感覺如何?
李紀為:創業是一種全新的體驗。在創業時,你能遇見到不同的人和事兒,無時無刻不在刷新著你對周圍世界的認識。不管是金融從業者(一級市場、二級市場、投行、券商等等),投資人,還是科研界學霸、工程大牛、產品經理等,他們所帶有的與生俱來的職業嗅覺與理念,都值得我們學習很久很久。這是一個非常有意思的過程,每天都有新的東西需要學習、新的挑戰。
這有一點像我剛開始讀博士的感覺——每天早上都是帶著對一天的憧憬起床。我非常願意用「有意思」這個詞來形容現在的生活。團隊每天都在學習和成長過程中,這也是最令人鼓舞的。
機器之心:能否簡單介紹一下新成立的公司?
李紀為:香儂科技-名稱來自於資訊理論創始人克勞德·香儂(Claude Shannon)。
這來源於一種情懷,在 CMU 學習的時候仔細拜讀過他在 50 年代那篇劃時代的論文「Prediction and entropy of printed English」. 當時我在 CMU 的老師 Eduard Hovy 一直想用這篇文章裡面的概念來定義不同 NLP 問題的難度,所以就讓我去讀這篇文章。這是一篇具有時代意義的文章,香儂與他的太太 Betty Shannon 完成了重要的實驗:給定英文一段話,告訴前面出現的字母,然後去猜下一個字母是什麼。這是一個劃時代的研究,它在語言上定義了信息熵的概念:語言的不確定性決定於熵的大小。現代很多的 NLP 的理論都是和它有關的。在 NLP 的問題中,你能猜得多准,基本定義了這個問題的難度。我也很崇拜他,這就是為什麼我們將創業公司取名為 Shannon。
註冊公司時我驚奇地發現,Shannon.AI 這個域名竟然還沒有被註冊,當時真的高興手舞足蹈。
同時,這個名字聽起來也給人一種溫暖的感覺,它有點像吳語里的「想你」(此處大笑)。
公司成立於北京,目前位於中關村。籌備方面,是從今年 11 月份開始正式推進這家公司的成立。從我的角度來講,我也在加入大公司與創業之間猶豫了很久,直到去年九月份,隨著幾位合伙人陸續到位,我們就開始了各項事務的籌備。
機器之心:可否透漏首輪融資得到了哪些投資機構的投資?
李紀為:本輪天使融資為紅杉中國基金獨家,融資金額為數千萬人民幣。
機器之心:這是一家 AI 金融領域的創業公司,它將面向哪些類型的業務?為什麼會選擇金融這個方向?
李紀為:我們希望人們能夠快捷、簡單、準確全面地獲取自己想要的金融信息。讓信息為大眾所用是我們的願景。
我們是這樣思考的:互聯網 1.0 時代讓世界更公平了,它就像廣播、電視一樣,是一個里程碑。互聯網讓人們獲取信息的機會變得平等了,曾經只有少數人可以接觸到的信息現在可以為大眾所有。但從另一個角度來看,互聯網時代的來臨也製造了巨量的信息。現在,在很多事情上使用簡單的搜索方法已經很難找到你想要的信息了。這又把互聯網 1.0(以門戶網站、搜索為典型)為我們帶來的這份平等給部分抵消了——信息太多,無從查找,只有某些特定的人群才知道去哪裡找到有用的信息。
在金融領域中,讓信息能更容易地為大眾所獲取是一個很有意義的方向。在國內,隨著國民生活水平的提高,投資需求正在逐漸升溫,越來越多的人們正在將眼光伸向股票、基金,甚至債券、期貨等二級市場方向上的投資。
然而,目前無論對於機構投資者,還是我們這樣的個人而言,傳統方式的信息渠道能夠解決的問題還是太少了。最簡單的一件事:現在我想搜索一下「最近有哪些上市公司的董事長正被證監會調查?」這是一個很明確的問題,也是對於市場行情非常重要的事情。還有很多其他事,我們是無法找到現成信息的,如果必須要找的話,我們必須一個一個地從不同信息源之中的信息里進行提取出來,自己進行分析。
我們希望能夠構建一個面對投資者的智能解決方案,來解決投資上對於信息的需求。能夠通過用演算法來解決這些問題。
機器之心:對你們來說,大陸的金融市場與海外(尤其是美國)有哪些不同?
李紀為:美國的二級市場中,機構資金佔比 90%,個人投資者習慣於把錢給機構託管;而在國內的股市裡,散戶佔據一大部分,由於信息的不對稱,甚至由於無法找到有效的信息獲取渠道,很多投資者會處於相對不公平的劣勢位置。我們所做的就是解決這一問題,讓所有人都能夠獲得信息。
機器之心:香儂科技的創始團隊構成是什麼樣的?
李紀為:我們的核心創始團隊為三人,我的博士專業是計算機科學(自然語言處理),另兩人均為金融領域背景, 都是我大學同學。沈盛傑本科畢業於北京大學物理學院,碩士畢業於光華管理學院,曾在對沖基金 Magnetar Capital 和中信證券等公司工作,主要負責金融數據處理,衍生品定價和交易策略研究等工作。另一位創始人何豪傑是國內二級市場資深研究員,長期從事行業和上市公司研究,曾就職於招商基金和私募基金星石投資等公司。
香儂科技創始核心成員,(圖中左至右)沈盛傑、李紀為、何豪傑
機器之心:選擇這個方向創業,是否意味著金融行業已經到了進入 AI 時代的節點?
李紀為:我堅信 AI 會革命化地改變很多行業,金融便是其中的一個。但這並不意味這這次革命會在一夜之間發生,它可能需要一段很長的時間,可能 3-5 年,也可能是 5-10 年,甚至更長。深度學習從爆發到今天僅僅經歷了五、六年的時間,而縱觀人類科技的發展歷史,具有重要意義的新科技都經歷了更長的發展。技術和傳統行業結合,慢慢地改變一個行業,會是一個漫長的過程。這個過程不僅僅是解決曾經的舊需求,而是在迭代中創造新的需求,新需求的創造恰恰是個慢慢發掘的過程。
我堅信人工智慧逐漸會給很多行業帶來變革。我認為,並不是 AI 造就了如今的時代,而是如今的時代催生了 AI 的發展:我們現在的工作正變得更加複雜,信息量變得更大。隨著海量數據的產生,我們有了更多的需求去分析、理解,去提取我們想要的東西。我們每天都在用頭條、滴滴、餓了么、美團這樣的應用,大量的需求意味著我們需要一種高效的工具來分析、整合其中產生的數據,讓人們能夠簡便地運用其中的知識。所以其實是社會需求推動了 AI,AI 反過來再推動了社會的變革。
站在金融的角度上,我們需要用新的方法來滿足用戶的需求,同時也可能會不斷發現、甚至改變用戶的需求,這是一個長期的過程。
機器之心:本輪融資過後,公司是否會開始進一步的團隊建設,主要會招募哪些方向的人才?
李紀為:當然需要人工智慧和深度學習方面的人才。不過,如何讓實驗室的深度學習技術落地,真正走進千家萬戶,這是一個全維度的任務。公司也希望招募更多前後端、資料庫等方面有經驗的工程師,以及產品經理、運維、UI 設計方面的大牛,大家把各自的特長相結合,互相促進,互相學習,得到一個真正可以造福行業的 AI 工具。
機器之心:此前有關人工智慧學界與金融行業的一條重磅新聞是鄧力加盟對沖基金巨頭 Citadel,我們知道,鄧力也研究自然語言處理(NLP)。NLP 與金融領域的契合點在哪些方面上?
李紀為:鄧力老師去 Citadel是機器學習最近的一個大新聞了。
NLP 與金融領域契合點主要是兩點,一種是幫助你收集信息。一種是幫你做決策。
幫你做決策就是幫你做交易。第二步要比第一步更難。我們目前專註於收集信息方面,做投資決策還需要時間和技術的積澱,它將是未來可能發展的方向。
機器之心:機器學習作為量化交易方法的方向之一,在交易中有哪些應用?
李紀為:舉一個例子,美國最著名的對沖基金——文藝復興的兩位 Co-CEO,Bob Mercer 與 Peter Brown。他們在自然語言處理(NLP)領域裡也曾是風雲人物。他們在上世紀 90 年代初把統計機器學習引入到了 NLP,革命性地改變了這個領域。直到深度學習火熱之前,他們提出的方法一直是 NLP 里的主流。他們在 1994 年提出的 IBM model 在機器翻譯領域盛行了 20 年,直到最近兩年才被神經網路的 seq2seq+attention 超越。有人笑談,那個年代,他們把 NLP 玩兒壞了(此處大笑)。
後來他們都加盟了文藝復興對沖基金,成為了用機器學習做量化投資的風雲人物。
值得一提的是,Peter Brown 是深度學習先驅 Geoffrey Hinton 門下第一個畢業的博士,1987 年博士畢業於 CMU。
所以說機器學習在量化投資里的應用由來已久,很多量化投資都在應用機器學習、統計學習的演算法。隨著原微軟研究院資深研究員鄧力老師這樣的學者加入金融領域,神經網路作為一種人工智慧中流行的方法也被金融界人士拿來開始嘗試於投資(量化模型)。但由於金融界是一個傾向於不公開新成果的行業,所以目前我們了解的不多。
本文為機器之心原創,轉載請聯繫本公眾號獲得授權。
?------------------------------------------------


TAG:機器之心 |