當前位置:
首頁 > 最新 > 星座分析有科學依據嗎?用大數據和機器學習揭開十二星座的真實面目!

星座分析有科學依據嗎?用大數據和機器學習揭開十二星座的真實面目!

數十萬互聯網從業者的共同關注!

作者:wwqqer,授權早讀課轉載

編輯:Juvae

「為什麼我的論文總發表不了,是不是我天生就不是做研究的料?」很多同學在寫論文中遇到挫折,經常會發出這樣的疑問。那麼今天我就用星座,真實的數據和「高大上」的機器學習來幫大家分析一下原因。首先聲明,我不是宿命論的支持者,也不懂占星術。本文也不是教大家如何成功,但利用本文的研究成果,可以幫助大家少走些彎路。現在網路上充斥著各種星座分析,但和本文相比都弱爆了。不管大家之前對星座分析持何種態度,我希望大家耐心讀完本文之後,能對星座與天賦有全新的認識。(本文很長,分上下兩部分。另外,本文中的「天賦」其實用「本性」更合適些,因為它還包括了性格等因素。)

本文的研究方法很簡單:聚天下之天才而觀察之。把各行各業中的天才們收集起來,看看他們哪個星座人數多,哪個星座人數少。方法簡單,人人都會。但操作細節很重要,這樣做出來的結果才會有意思(本文研究方法的具體細節見文末【附錄一】)。我們先來看一下有哪些天才被我當成了「小白鼠」。「表一」總結了本文所使用的數據。

表一:數據總結表

本文共選擇了27個行業,總共5700多個樣本,其中華人約佔350個,女性約佔600個,南半球約佔300個。如果沒有特別註明,各行業數據的歷史一般是從該獎項(如果有的話)設立開始,直到2017年為止。有些行業有嚴格的篩選過程,比如每年評選的諾貝爾獎,各種體育競技項目的國際比賽等,我們就可以利用它們來確定樣本。然而,另一些行業沒有固定的篩選過程,尤其是藝術類。所以,我們只能靠「時間」來篩選。具體來說,就是用搜索引擎搜索「歷史上著名XXX」(XXX為職業名,比如,建築師,作家等),來挑選舉世公認的行業領軍人物。本文使用的數據的總時間跨度大約是最近300年左右。

既然介紹了數據,那麼我們就來看一下使用所有的數據統計出的星座分布(圖一)(註:由於每個星座內的天數稍有不同,我用得到的每個星座的人數除以該星座的天數,從而算出星座分布的日均數,以排除天數不同帶來的影響。本文之後所有的計算和結論都建立在諸如此類的日均數上)。圖一的四種顏色分別代表土(黃色),水(藍色),火(紅色),風(灰色)四大星象。從圖一中,我們看到射手人數最少,而與之相鄰的摩羯座人數最多,兩者的平均數接近全部星座的平均數15.5。另外,兩頭的白羊座和雙魚座人數也不少。除此之外,就很難看出有其它什麼規律了。如果本文的星座分析是這樣的話,就太」圖樣圖森破「了。所以,讓我們接著往下看。

圖一:星座人數總分布圖

關於天賦的星座分析

我把判斷顯著差別的計分法則(見文末【附錄一】)運用到「表一」的27個行業上,我們就得到了「表二」(簡單理解,正2分表示「人數非常多」,正1分表示「人數比較多」,負1分表示「人數比較少」,負2分表示「人數非常少」,0分則表示「人數不多不少,處於平均水平」)。請記住「表二」,因為它是本文上半部分最重要的成果,它記錄了星座與人類天賦的關係!

表二:十二星座行業得分表

我在表的上方標註了每個行業可能需要的"(主要)能力"(以我這個外行的角度),有些能力是幾個行業共享的。另外,「表二」是僅僅基於北半球的樣本所得結果(至於為什麼分南北半球,我將在本文下半部分作詳細解釋)。行文至此,星座與天賦之間的關係就在「表二」建立起來了。是不是表中出現2分的情況比你想的要多得多?有同學可能會問: 「表中某星座在某行業得了2分,說明這個星座在這個行業的領軍人物的人數要超過其他星座,會不會是因為這個星座從事這行業的人本來就多呢?」 要回答這個問題,就得調查這個行業的所有從業人員的星座了,可惜相關數據很難獲得。另外,如果從事這行業的某星座人數很多,這本身就是一個很有意思的現象。與本文的研究並不矛盾。

言歸正傳,鑒於此表的信息量很大,我們可以先計算各個星座的大類(科研,藝術,體育)平均得分,這樣看起來可以更直觀一些。如下表所示,在科研方面,處女座和獅子座這兩個相鄰星座分別佔據著科研的頭名和末名。在藝術方面,白羊座是當仁不讓的第一,而雙子座,處女座和摩羯座則並列最後。在體育方面,摩羯座表現突出,而天蠍座則表現不佳。總的來說,這些星座如果在某一方面特彆強,那麼在其它方面就會差一點,甚至很差。反倒是巨蟹座和天秤座雖然沒有最強的某一方面,但是在全部三個方面都優於平均水平,屬於均衡發展型。

表三:十二星座大類行業平均得分表

下面我就基於「表二」對十二個星座依次進行分析。(請注意,下文括弧內的代表人物是一些個例,是按影響力大小選擇的,並不一定符合這裡統計意義上的性格特徵描述)

一,白羊座(代表人物:歐拉,格里高利·派克,黑澤明,卡拉揚,梵高)

白羊座在藝術類得分之高,無人能出其右,尤其是需要運用感情和強烈的肢體語言來表達的表演,指揮和鋼琴演奏。再加上導演和繪畫,網路上對白羊座的評價是:衝動,積極,思維活躍。我覺得還是有些靠譜的。同時,也說明他們擅長表達和詮釋事物的內涵。這樣才能做出出色的數學研究,去詮釋世間美妙的真諦!白羊座在計算機和圍棋上得分很低,說明他們不喜歡按部就班地進行計算和算計。

二,金牛座(代表人物:高斯,薩繆爾森,哈耶克,貝聿銘,范斯哲,奧黛麗·赫本)

金牛座在藝術類中的導演和時裝設計得分比較高但繪畫得分一般,說明他們畫面感很強,而且善於運用到實際中。金牛座在斯諾克和宇航員這兩項中得分較高,說明網路上流傳的「金牛座可靠,有耐心」並非空穴來風。優秀的斯諾克選手需要時刻保持紳士風度,斯諾克本身就是一項需要剋制情緒的運動,如果過度興奮或者過度悲觀,都難以打好。至於宇航員更是如此。眾所周知,宇航員的選拔條件非常嚴苛,必須具有非常堅強的意志品質和忍耐力來面對各種惡劣的生存環境。金牛座在網球項目上得到了為數不多的負2分,這更說明他們 「穩重,缺少爆發力」 。至於金牛座的其它性格,比如,吝嗇,古板,我們無法從行業表現中得到答案。

三,雙子座(代表人物:納什,赫伯特·西蒙,特朗普,吳清源)

雙子座不擅長做「大生意」,而喜歡「耍小聰明」,擺弄「小玩意兒」,比如,下個棋,照個相。他們也不擅長需要熱情衝動的行業,比如,表演,繪畫,時裝設計等,而且在斯諾克上表現也不好。這倒挺符合網路對雙子座的評價:「機智,善變,不安分」。即使是做研究也是關注「小」的方面,比如,在諾貝爾經濟學獎獲得者中,有10位是雙子座的,竟無一人研究宏觀經濟學。倒是有4人研究博弈論(John Harsanyi,Lloyd S. Shapley,Robert Aumann,John Nash),4人研究微觀經濟學(Maurice Allais ,Herbert Simon,George Akerlof,William Vickrey)。

四,巨蟹座(代表人物:圖靈,梅麗爾·斯特里普,喬治·阿瑪尼,伊隆·馬斯克)

巨蟹座在表演,尤其是時裝設計中得了高分。如果把表演細分成男演員和女演員,巨蟹座在女演員分布中的得分比在細分前還要高(僅次於天蠍座,「蛇蠍美人」原來是有數據支持的!呵呵。)。再結合他們在時裝設計中的搶眼表現,果然如同網路所說,這是一個「母性泛濫」的星座!照這個情況,巨蟹座不應該在鋼琴演奏中獲得低分。獲得低分的原因可能是因為它們對於枯燥的反覆訓練缺乏堅持下去的毅力。這一點得到了宇航員的佐證。在重壓之下,巨蟹座早早地就躲進了自己的蟹殼中,呵呵。儘管如此,巨蟹座因為他們的小心謹慎使得他們在玩德州撲克時立於不敗之地。難道這是傳說中的凱利公式(Kelly Formula)的真實寫照?(註:在重複賭局中,凱利公式根據贏輸的概率及獲利多少來決定投資(賭注)的大小使得(長期的)總預期收益最大,使用此公式就永遠不會有破產無注可投的情況出現。)而且,巨蟹座的小心謹慎幫助他們在科研中取得成就,巨蟹座在科研中的得分超過十二星座的平均水平。

五,獅子座(代表人物:香奈爾,聶衛平,雷-達里奧,索羅斯,李嘉誠)

自信大膽且具有大局觀的獅子座在商界和投資界傲視群雄,果然名不虛傳!這點也體現在了下棋,建築,文學和時裝設計上。另一方面,過分自信的獅子座就會變得武斷魯莽,做事不仔細考慮,觀察力不強,這一點在高爾夫球和哲學上表現尤具代表性。與之相關的,他們在繪畫,作曲,物理,醫學表現也不佳。

六,處女座(代表人物:黎曼,安藤忠雄,歌德,小澤征爾,巴菲特)

處女座是個很有意思的星座。他們在科研類中的得分是十二個星座里最高的,尤其擅長關注結構里的細節。而他們在藝術類的得分是最低的之一。另外,如同金牛座,處女座的忍耐力也是杠杠的,他們在斯諾克和宇航員這兩項中取得高分。由此可見,處女座既仔細又有忍耐力,但不按部就班,還有很強的觀察力,這是他們在搞科研時的制勝法寶。但另一方面,不感情用事的處女座缺少藝術創作中的那「神來一筆」。處女座在網上的評價, 「完美主義,吹毛求疵,頭腦清晰」。這一點在這裡應該是說得通的。

七,天秤座(代表人物:霍洛維茨,李雲迪,李安,艾略特,張愛玲,楊振寧)

天秤座的平衡感強,擅長分析處理結構問題,比如,化學,建築,尤其是文學。天秤座出人意料地在網球項目上得了高分,這可能也得益於他們的平衡感吧。在十二個星座中,天秤座在27個行業里得到的負分最少,所以,他們沒有明顯的短板。這裡,我們無法驗證天秤座是否如網路所說「平易近人,輕浮,優柔寡斷」。

八,天蠍座(代表人物:費雯麗,居里夫人,比爾蓋茨,畢加索,莫奈,屠格涅夫)

天蠍座在哲學和繪畫上都得到了超高分,而且在表演方面也很強。這表明他們敏感,思想複雜,具有很強的洞察力。僅憑他們在哲學上的優異表現,天蠍座就無愧於十二星座中「最理性星座」的稱號!由此可以推斷,他們已把感性的繪畫和表演提升到了理性的高度。然而,過分強調「形而上」的天蠍座在實際科研(比如,計算機,化學)及其它行業(比如,鋼琴演奏,網球,斯諾克)中顯出了缺乏耐心,不注意細節的弱點。天蠍座不擅長變魔術,應該也是理性思考的後遺症吧。這裡無法驗證網路上評價天蠍座的「疑心,善妒,報復心強」。

九,射手座(代表人物:勞倫斯薩莫斯,馬克吐溫,斯皮爾伯格,李政道)

與天蠍座正好相反,射手座在哲學和數學方面表現不佳,這可能與他們熱情開放的性格,以及缺乏縝密思維的特質有關。而且,缺少耐心和忍耐力的他們在斯諾克,宇航員,及商業等行業中難有建樹。所以,網上評價射手座「浮躁,做事易半途而廢」,好像有點道理。不過,值得一提的是,射手座在經濟研究方面的表現突出。一共有六位諾貝爾經濟學獎獲得者,以及五位克拉克獎獲得者。與雙子座相比,研究宏觀經濟學的射手座經濟學家的數量明顯增加,比如,Finn Kydland,Gunnar Myrdal,Eric Maskin,Trygve Haavelmo,Martin Feldstein,Lawrence Summers等。有意思的是,雙子座與射手座在經濟研究上都表現很好(僅管擅長的方面不同),但他們在商業領域表現都很糟糕。

十,摩羯座(代表人物:牛頓,史蒂文·索德伯格,舒馬赫,老虎伍茲)

摩羯座是十二星座里唯一一個在德州撲克和(尤其是)F1賽車都得高分的星座,難怪他們被網上評為「最有原則」的星座。如同小心謹慎的巨蟹座一樣,腳踏實地的摩羯座在計算機研究領域優於其它星座。然而,專註有餘的摩羯座想像力和創造力有點不足,這點可以從他們在建築,時裝設計,和魔術上的不佳表現看出。與此相關,分析處理結構問題也需要想像力和發散性思維(比如,化學,建築,文學,尤其是物理),但過於嚴謹的摩羯座並不擅長此類問題,即使有牛頓這樣的巨擎撐腰也無濟於事。

十一,水瓶座(代表人物:保羅紐曼,莫扎特,舒伯特,狄更斯,愛迪生)

都說水瓶座充滿智慧,可是「表二」 並沒有反應出這點。相反,水瓶座在科研類和文藝類的得分都處於十二個星座的下游。在體育類中,也只有高爾夫球是個亮點。崇尚自由的水瓶座確實不適合從事德州撲克,斯諾克和攝影等需要剋制情緒的行業。順便提一下,水瓶座在表演行業中處於中游,但如果把表演行業細分成男演員和女演員,水瓶座可以在男演員中排第二位(僅次於白羊座),接近一個標準差。所以,水瓶座的男同學們只要負責耍帥,打打高爾夫球就行啦。

十二,雙魚座(代表人物:喬布斯,默多克,肖邦,愛因斯坦,雨果,加加林)

在我看來,雙魚座大概是十二星座里最神奇的星座了。首先,與天蠍座相似,雙魚座依靠縝密的思維來思考「形而上」的哲學問題,但面對需要具體計算的計算機研究和德州撲克時都表現不佳。但與天蠍座不同的是,雙魚座有較強的忍耐力和專註力,這幫助他們在商界大展身手。而且,雙魚座是唯一一個既擅長高爾夫又擅長網球的星座,真是「靜如處子,動如脫兔」。更重要的是,雙魚座還是個會耍酷炫魔術的高手,說明他們在理性之中還帶有感性,可能還具有一定的膽量。總之,許多事物的兩面性都體現在這個星座中,真是件奇妙的事情。這些表現與網路上對雙魚座的評價「感性,濫情,意志力薄弱」很不相同。我覺得《名偵探柯南》中那個神出鬼沒,風流倜儻的怪盜基德更像是雙魚座的(僅管他被設定為與漫畫作者本人一樣的雙子座),呵呵。

行文至此,我把每個星座所擅長和不擅長的能力都分析了一遍,而且還藉此驗證了網上流行的星座性格分析是否靠譜。儘管性格與能力有密切聯繫,但是它們終究是兩個概念。所以,正如大家在上文中看到的,在大多數情況下,我只能驗證其中的一部分。驗證的結果總結如下(見表四):有些星座的分析,經過驗證是比較靠譜的,比如表最左側的雙子座,獅子座,處女座,巨蟹座和摩羯座。但還有一些,我只能檢驗其中的一部分。有時甚至一點也不能,比如,表最右側的天秤座和雙魚座。

表四:十二星座驗證表

在這裡我想插一個花絮:大家可能知道菲爾茲獎首位(也是迄今唯一一位)女性獲得者,伊朗著名數學家瑪麗安·米爾扎哈尼(Maryam Mirzakhani)最近(2017年7月)英年早逝,年僅40歲。當我在閱讀她的生平時(見【1】),發現了一些有意思的事情。

瑪麗安的家裡沒人是科學家,她從沒想過要學數學,但一直被鼓勵自立和追求興趣。跟所有女孩一樣喜歡看小說。想當小文青的她非但不是學霸,還對數學很頭痛,老師也說她沒天分。直到高二,她才在一個偶然的情況下發現了自己的數學天賦。米爾扎哈尼說自己很慢,是個「慢」數學家。到高二才發掘天分,解題也是耐心組合出辦法。當她從事數學研究時,她的心思都在研究上,說自己是「慢人」,不靠靈光一閃解決難題,「有些問題已經研究了十幾年,但經過數月甚至數年,你才能發現問題不同的一面。」有斯坦福大學同事說,她最獨特的是研究方法,能創新地將不同事物連接在一起,對難題特別興奮,毫無懼色。這種「慢」和「穩」的性格不光在工作上,生活上也一樣。瑪麗安的丈夫也是科學家。兩人一起去跑步。老公高大健壯,一開始跑前面,她體格嬌小,一直沒有放慢腳步,半個小時以後,老公精疲力竭,她還保持著最初的速度。米爾扎哈尼給世界留下過一句話:「只要有耐心,孩子總會發現數學之美。我不認為每個人都應該成為數學家,但我相信許多人不曾給數學一個真正的機會。」

當我讀完她的生平,我幾乎能90%地肯定她應該是金牛座。於是去查了她的生日(5月3日),發現果然就是!當然,這畢竟只是一個個例。在上文的星座分析中,我不做個例分析,是為了強調結果的統計屬性,避免給大家造成「以偏概全」的錯覺。不過,瑪麗安·米爾扎哈尼的例子是最近發生的,且非常具有傳奇性,所以就談一下,在下文中還會被提及。

言歸正傳,這裡需要指出的是,我對這27個行業中的大部分都不是很熟悉,所以,只能從外行的角度給這些行業加上所需的能力。這樣能夠幫助完成分析,並盡量避免無法解釋某些星座表現的情況發生。每個人對這些行業的理解不同,就有可能導致分析的結論不同。非常歡迎大家提出寶貴意見。

上述的十二星座分析只停留在文字描述,下面我要對「表二」進行量化分析。對數學不感興趣的同學可以略過,直接跳到小結部分。

星座量化分析

上文「表二」中的每一列是一個行業,也可以看成是一列數組,所以我們可以計算它們之間的關聯繫數。按道理,這應該是一個27乘27的相關係數矩陣,但篇幅有限,我只報告相關性最高的那些行業。而且,我比較關心大類與大類之間的行業相關性,而不是大類內部行業的相關性(比如,數學和物理屬於科研大類,繪畫和作曲屬於藝術大類,等等)。注意,這裡的相關性不一定是我們平常認知里行業間的相關性,而可能是由於十二個星座在行業中的表現造成的相關性。所以,我們會看到一些出乎意料的結果。

「表五」列出了相關係數大於0.5的行業(不等於零的顯著性都超過至少95%)。其中有些比較容易理解,比如,商業和投資。有一些乍看不明白,但稍微想一下就理解的,比如,德州撲克和計算機,哲學與繪畫,宇航員和斯諾克。但有好些就不那麼容易理解了,比如,相關係數高達0.83的指揮與數學,以及緊接著的作曲與醫學(相關係數0.82)。就拿指揮與數學來說,其相關係數高的原因是白羊座在這兩項都得了高分,而雙子座都得了低分,其它星座沒有一高一低相衝突的情況出現。

表五:行業相關性列表

具體來說,雙子座得低分可能是因為他們機智善變的性格不擅長思考「形而上」的數學或哲學問題(雙子座繪畫也不行,而繪畫與哲學相關性高達0.8)。同樣,這種性格也不適合從事需要投入感情的行業,比如,指揮。另外,他們在斯諾克的低分和圍棋的高分,更證實了他們機智而不穩重的一面。再看白羊座,情況稍稍複雜一些。衝動的白羊座不僅在指揮,還在表演和鋼琴演奏中取得高分,這是可以理解的。但他們在數學中的優異表現就不能單單用「衝動」來解釋了,我只能認為他們還擅長發掘事物的內涵,尤其從抽象的角度。這點可以由他們在繪畫中的表現來佐證。

縱向看完「表二」後,我們再橫向看一下。表中的每一行也是一列數組,按道理,我們也可以計算行與行的相關性。不過,我在這裡使用一個新方法:層次聚類(Hierarchical Clustering)。這個方法的原理很簡單:每列數組在初始時刻各自為一個類別,然後由下往上(agglomerative),每一次迭代選取距離最近的兩個類別(這裡使用的是Euclidean距離),把他們合併,直到最後只剩下一個類別為止,這樣「一棵樹」就構造完成了。這種方法的好處是不用在一開始就確定聚類數(number of clusters),可以等到建立樹形圖後再確定。這也是機器學習中的一種分類方法(非監督學習)。「表二」的聚類樹形圖和8個聚類(紅框)如下。

圖二:十二星座層次聚類樹形圖

如「圖二」所示,水瓶座與雙魚座,還有金牛座與處女座距離很近,所以它們最先分別組成一個聚類。倒是巨蟹座與射手座的結合有點出乎意料。再向上一層,天秤座與獅子座相近,所以他們歸為一個聚類。在樹形圖中,越往上,差異越大(距離越遠),例如,雙子座,摩羯座,白羊座,天蠍座。另外,除了同為土象的金牛座與處女座距離較近以外,土水火風四大星象的說法並沒有從「圖二」得到支持。順便提一下,本方法用到的距離與相關係數實際上是一回事:(已標準化的)數組間的相關係數等於數組間的距離(Euclidean距離)的倒數,即兩個數組相關係數越大,它們之間的距離就越小。這個結論符合一般認知,也可以從它們的數學定義中證得。由於篇幅有限,此處不再贅述。

最後,我對「表二」進行主成分分析(PCA,也屬於機器學習中非監督學習的一種)。如「圖三」所示,第一個因子(PC1),也是最重要的因子,只能解釋「表二」中20%的方差。要想累計貢獻率達到90%,必須用到前8個因子。這種情況是符合一般認知的,因為我們知道十二個星座之間有明顯差異,很難用一兩個因子就解釋全部信息。在進行主成分分析時,原有的分類被打破,所以很難解釋所得到的結果。這也是主成分分析的一個弱點。

圖三和表六:主成分分析方差累計貢獻率及相關星座

因此,我計算了前四個主成分因子與12個星座的相關性,並把其中係數絕對值最大的星座列在了 「表六」 。這樣我們可以大致了解這些主成分因子所代表的含義。比如說,第一個因子與雙子座的相關性高達93%,與白羊座為-70%。那麼,我們可以大致認為雙子座與白羊座的反面是十二星座里最主要的星座,儘管它們只能解釋所有信息中的五分之一。以此類推,由於越往後,所剩信息越少,所以因子與星座的相關性會變弱。但我們還是能夠看出個大概。值得注意的是, 「表六」列出的星座與前文中的層次聚類樹形圖最上方的星座大體相符,例如,雙子座,摩羯座,獅子座,白羊座等,說明這些星座的確比較特別一些(類似於矩陣中的基)。

小結與應用

我在本文(上半部分)考查了星座與天賦之間的關係。通過觀察十二星座在總共27個行業中的表現,我們把每個星座和它們各自的強項和弱項聯繫了起來。其次,藉助星座們在行業中的表現,我對網路上的星座評價進行驗證。有些星座經過驗證是靠譜的(比如,雙子座,獅子座),但有些我們只能驗證一部分,甚至於還有一些我們無法驗證(比如,天秤座,雙魚座)。最後,通過量化分析,我們了解了十二星座大致可以分成8個聚類(cluster),其中有些星座比較相似,比如,水瓶座與雙魚座,還有金牛座與處女座。但有些星座與其它星座比起來更不同一些,比如,雙子座,摩羯座,獅子座,白羊座等。另外,我們需要至少8個主成分因子,才能使累計貢獻率達到90%。

看到這裡,有同學可能會問:「我只是個普通人,你分析了一大堆關於天才的數據,那與我何干?」 這個可以從三方面來回答:挖掘個人潛能,改進個人短處,以及人際交往。

雖然本文探討的不是如何挖掘普通人的潛能,但本文的研究結果可以提供一個參考。從體育類及藝術類行業來說,一個初入某一新行業的成年人,要想通過挖掘潛能成為這一行業的領軍人物不太現實,但經過一定課時的基本訓練,把潛能發展成興趣愛好還是可行的。當然,我不是說其它星座的同學不能做,而是說這些星座的同學的性格比較適合玩這些項目。舉個例子,機智靈巧的雙子座同學可以試著學學圍棋,玩玩攝影。小心謹慎的巨蟹座同學可以玩玩德州撲克。衝動熱情的白羊座同學可以開發的項目就更多了,從表演,繪畫,到鋼琴,甚至導演。在如今「自媒體」橫行的時代,白羊座有了一個很好的施展的平台。說不定哪天,又會出來一個類似papi醬(水瓶座)的網紅。

另一方面,本文可以幫助大家更有的放矢地改進自己的短處。比如,小心謹慎的巨蟹可以試著加強韌勁和自信,在工作和學習中有意識地大聲說出自己的想法,遇到困難時不輕易打退堂鼓。當然,我不是說巨蟹座的同學一定就缺乏自信,而是說這種情況較其它星座更有可能發生。而且,我們也不一定要改進得與金牛和獅子不相上下。如果能做到他們的一半,甚至只有三四成,那和原來的巨蟹比起來,已經是不小的進步了。其它星座也可仿效此方法對自己的短處進行改進。無論是挖掘長處,還是改進短處,後天的自我完善和自我升華,無論對個人還是對國家,都會有是有益的。

本文的研究結果也可以應用於平常的人際交往中。舉個例子,如果你老闆(公司里或學校里)是獅子座,那就經常性地給他(她)帶高帽子,讓自信的獅子更出風頭。這樣你即使出點小錯,粗心的獅子也不會在意的。相反,你老闆如果是處女座,那你只能辛苦一下,必須比他(她)還仔細,否則既仔細又有忍耐力的處女會把你逼瘋的。又假如你老闆是白羊座,那你做事最好不要拖沓,衝動的白羊總是希望立馬看到效果。如果你老闆是雙子座,那他(她)倒不會怎麼為難你,因為他(她)自己也飄忽不定,不過你要時刻準備著應付他(她)不知從哪兒冒出來的「鬼點子」。再假如你老闆是金牛座,那就要避免與他(她)正面衝突或爭論(即使你是對的一方),否則他(她)會和你死扛到底。剩下的星座,我就不一一點評了,大家自己慢慢琢磨吧。

以上這些觀點也適用於戀愛中的男女朋友!而且,本文的量化分析結果也可以幫助大家「速配」。比如,金牛座和處女座,還有水瓶座和雙魚座這兩個容易湊到一起,可能他們之間的思維方式和性格比較相似一些吧。不過,如果我說得不準,大家不要怪我,要怪就怪機器學習吧,呵呵。

最後,在結束本文上半部分前,再次提醒一下大家,以上所有結論都建立在北半球的數據上,至於南半球的結論如何,以及為何要南北半球分開分析,這些都將在本文下半部分討論。當然,下半部分要討論的遠遠不止這些,內容非常勁爆!請看這裡:細思極恐!人的天賦從何而來?

附錄一:本文研究方法的具體細節

一,如何選擇行業?

在「表一」中,27個行業的選擇遵循以下三個原則:

要能夠突顯單個星座的特質。比如,諾貝爾和平獎得主沒有被選為研究對象,因為他們大多是政治家,後天因素起了主要作用,不符合本文的初衷。又比如,許多體育項目沒有被選中,因為大多數項目是集體活動,即使產生了許多體育明星,也很難區分他們的成功是由於團隊的力量還是個人的天賦造就的。而且,興奮劑在體育界的濫用也是另一個重要原因。

要有可靠的(經過篩選的)且樣本數不是太小的數據。比如,歷年諾貝爾獎得主就是很好的數據,僅管有些科目越來越強調團隊合作(比如,化學,醫學),從而掩蓋了單個星座的特質。

選擇範圍盡量地廣。人類的天賦具有多面性,所以選擇的行業要儘可能覆蓋它們,比如想像力,邏輯推斷力,表達能力,等等。

當然,我也不敢肯定這27個行業就一定能代表人類的所有天賦。但由於數據的限制,要想選出符合上述三個原則的行業並不是很容易。歡迎大家多提寶貴意見。

二,為什麼要選擇每個行業中的天才?

這是因為在他們身上所體現的某些特質較普通人明顯,僅管(在研究前)我們暫時不知道到底是哪些特質。而且,他們在行業中的表現是客觀存在的,不會受到他人主觀評價的影響。其次,如同上文提及的,天才們是經過了嚴格的篩選後得到的,數據可靠且容易獲得。

最後也是最重要的一點,如上所述,本文不是討論如何挖掘天賦,而是假設天賦已顯露出來後,研究它與星座的關係。我不是宿命論的支持者,一個人的天賦與他(她)最後取得的成就沒有必然聯繫,因為會受到許多後天因素的影響。我使用『天才』們的數據恰恰可以控制這些後天因素,尤其是學術類和體育類行業,使得我更有效地觀察星座與天才之間的關係。打個比方,我們可以不失一般性地認為諾貝爾經濟學獎獲得者的經濟學基本理論知識都很紮實,並且背景相似(都具有博士學位,都在高等學校任教,等等)。而且,我們也無法推斷說今年的諾獎獲得者比往屆的都要勤奮刻苦。至於藝術類,後天因素的影響就更小了,有人天生對聲音敏感,而有人天生對色彩敏感,諸如此類。即使有老師指導,也只是起輔助作用。所以,如果在後天因素被控制的情況下,某個星座的人數相較其它星座還存在顯著差別,那麼我們有理由懷疑造成這種差別的原因不是來自後天,而是先天!

三,如何判斷一個星座的人數比另一個星座的人數多(或少)?

這裡我使用簡單的統計學方法。假設給定一個行業的星座分布(如圖一),我可以算出分布的平均值與標準差。如果某個星座在離開平均數1個標準差附近,那麼情況就 「有點意思」 了,計正(負)0.5分。如果明顯超過1個標準差,那麼情況就 「很有意思」 了,計正(負)1分。如果超過2個標準差,那麼情況就 「非常有意思」 了,計正(負)2分。如果是在1個標準差以內,則視為 「無差別」 ,計0分。這樣做的好處是可以排除某些行業樣本數過大帶來的影響(注1:所有行業的星座分布都是人數分布,除了圍棋。每位圍棋選手按水平高低有一個實力評分,圍棋的星座分布建立在這些評分上)。

Read More

本文由作者授權早讀課發表,轉載請聯繫作者。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

借鑒師生互動模式來訓練機器學習模型
機器學習演算法可近似性的量化評估分析
初學者必讀的八個趣味機器學習項目‖教程 數據集
無需編程,僅用攝像頭,Google 最新項目讓你 3 分鐘學會機器學習
谷歌新項目公開:無需學編程,用手機攝像頭和瀏覽器即可機器學習

TAG:機器學習 |