當前位置:
首頁 > 科技 > 謝宇:大數據,「大」就行了嗎? | 專訪

謝宇:大數據,「大」就行了嗎? | 專訪



圖片來源:

http://www.quanjing.com




 

 




不久前,美國普林斯頓大學教授、《知識分子》主編謝宇接受《嚴肅的人口學八卦組》專訪,主要探討了三個問題:


 



1. 現在似乎已經進入了大數據時代,大家很看重大數據,每個人都在談論大數據,那麼,社科研究應該怎麼做或怎麼看待大數據問題,大數據和傳統研究數據的關係是什麼?



2. 關於在新媒體時代,科學工作者應該如何面對大眾的問題。對於公眾號這種形式,科學工作者是否應該參與到對大眾的科普中?




3. 關於人口學的發展問題,中國社會處在快速轉型時期,中國的人口學發展也面臨很多挑戰,未來人口學的主要研究方向和重要研究議題有哪些?




《知識分子》獲《嚴肅的人口學八卦組》授權轉載。

 


大數據是什麼



 

Q:人人都在談論大數據,到底何為大數據?


 

謝宇

:你這個問題提得很好。我覺得社會上對大數據有很多誤解,也有一些盲目的追求。總體來講,中國民眾對數據的需求很大,但真正懂數據、認識數據的人並不多。現在隨著大數據的產生,每個人都在談論大數據,大數據就變成了一個時髦的、甚至被一些人濫用的詞語。


 


至於我對大數據的理解。首先我同意你講的,大數據的產生會影響到社會、研究和文化。但是它為什麼重要、怎麼來用,絕大多數人都是茫然的。什麼是大數據?

大數據是我們現代生活或工作留下來的數字腳印

(footprint)

。這些數據不是為研究採集的,而是一個生活的副產品。


 


現代化生活在很多地方都會留下數據的腳印,比如打電話、付帳、乘地鐵、使用打車軟體等,我們所有的行為都電子化了,這種電子化的生活方式和工作方式就為我們提供了可以利用電子化數據的機會。所以我說大數據實際上不是為研究而存在,而是我們的生活工作留下來的痕迹、是一種電子腳印。

 


從這個意義上來理解大數據,就會認識到大數據有幾個典型的特點。

首先它並不是一個新事物,過去就有電子化的數據,

比如美國的人口普查很早就有,當然有些已經失去了,而且並不是電子化的,但是它有數據,是為政府服務的。後來我們有檔案、有文本,雖然沒有完全電子化,但是我們的生活已經留下了很多數據,這些是可以電子化的,而且現在也正在變成電子化。


 


其次,大數據並不意味著 「大」很重要

,很多人說大數據的優勢在於它很大,它這個「大」的確有它的規模很大的這層涵義,因為生活每時每刻都在產生數據,所以它的量很大。

但這個意義上的「大」還不是主要特徵,它的主要特徵是它的產生方式不一樣,它不是為了研究而存在的,而是由我們生活和工作本身就能產生很多數據。


 


有的時候我將大數據叫被動數據,因為它不是為研究目的而有目的性地收集,而是被動產生的,比如打個電話,這些電話的記錄留下來。這時,你並不是為了研究而去打電話記錄數據,打電話只是你的日常工作和生活,這些數據是被動記錄的。 



Q:大數據的重要意義在哪裡?


 


謝宇

:以前我們沒有數據,特別在中國,相對來講,

數據獲得途徑是受限的,

而且學術數據特別缺乏,很多數據不共享。對於官方數據,一是不能得到,二是不知道準確不準確。所以,

中國很多年來由於數據的貧乏和質量的不確定性,以及數據獲得受限

,民眾對數據的需求難以滿足,大家想知道現實到底是什麼。


 


在沒有其它數據來源的情況下,大數據的產生使得大家有了一些了解情況的渠道。這個產生從無到有,一下子就激發了人們的興趣,覺得大數據非常好。

大數據的出現打破了過去那種數據被壟斷封鎖的局面

,給我們提供了以前沒有的數據。


 


另外,以前很多方面是沒有數據的,比如說交通的數據非常難收集,還有社交網路的數據也非常複雜難以掌握,

所以大數據最重要的貢獻,並不是它量大,而是我們能夠通過大數據獲得在社會現象和行為方面過去沒有的數據。


 


在西方,數據系統相對比較完善,有些政府的數據是公開的,是共享的,研究者的數據也要求要公開,還有一些商業數據、企業的數據、NGO的數據、智庫

(think tank)

的數據等都是共享的。


 


西方的數據文化大約有100年左右的歷史,社會調查的數據大概有70年左右,數據文化是一個緩慢的發展過程,在這個過程中,大數據慢慢填補了很多空白,在這個數據生態裡面逐漸起到了作用,但大數據沒有把其他的數據完全排擠出去,所以數據領域呈現出一個各種數據都有的

全生態景象


 


而在中國,因為學術數據、政府數據相對來講比較缺乏,所以大數據一出,給人的感覺就像把其他數據都取代了,但實際上不應該是這樣的。



 Q:您談到了大數據的特點和優勢,那麼您如何看待大數據的缺陷?




謝宇

:大數據有幾個缺陷:


 



1. 它雖然量大,但你仍然需要懷疑它的代表性。


有的人用手機,有的人不用;有的人一天發很多條微博,也有人一條不發;有人有幾個銀行賬戶,有的人沒有賬戶。所以它的代表性是有缺陷的,你不知道它的總體是什麼,這是選擇性的問題,是難以克服的。因為它是行為數據,是被動記錄的,很難控制,所以我們只能用統計的方法盡量減少偏差。總體是什麼,到底能不能推論,今天的總體和明天的總體是不是一樣,推論的對象是誰,這些異質性問題和選擇性問題都很難解決。


 


2. 大數據的變數可靠性和數據質量也是不確定的。


比如機器學習中的文本分析,正面情緒的一個形容詞和一個主語在一起,機器認為它是正面的,但它可能是諷刺的,或者有其他的含義。你只有讀完這句話才能讀出背後的情緒,但機器不一定能讀出來,所以有很多干擾

(noise)

在裡面。數據量大了以後,數據清理的代價也很大,很多人不做數據清理,可能也不做verification

(數據驗證)

。如果不做最基本的工作,數據質量將是個很大的問題。


 


3. 它的測量問題

(measurement)

 。


大數據是被動數據,很多事情沒法問,比如情感問題、滿意度問題。在被動數據裡面,除非是非常非常不滿意,或者是抱怨這個客戶,才能通過數據讀出這個人的情感,可是一般人的情感可能沒有那麼強,是否滿意他不會主動告訴,而且很難用設計來把內在的

(隱私的)

東西挖掘出來,也是不合法的。大數據作為被動數據是本來就存在的,就不能再改造它,也不能通過設計來改進,所以它的測量是有限的。


 


4. 第四個缺陷可能是更致命的,就是數據整合

(data integration)

和數據厚度問題。


比如你有電話數據,銀行數據,銀行數據和電話數據整合起來可以知道一個人的很多事情,但也是不確定的,因為你的錢可能放到別人賬戶里了,或者說我們也並不知道你賬戶的錢是不是你的、是哪裡來的。還有很多類似問題,需要整合其他數據,比如學歷、病歷等。


 


合併這些數據是非常困難的,首先是電子數據產生沒幾年,可以使用的信息有限,其次是大數據的變數非常少,不夠用來對一個人的長期軌跡做描述。


 


而傳統調查卻不同,調查數據可能有幾千個變數,各種方面都有,而大數據他只有一個方面,手機就是手機,微博就是微博,你對個體其他的特徵知道得非常少,而且沒有一個長期的跟蹤,所以大數據比較致命的就是很薄,對一個人的了解很少,很難深入探索異質性問題。


 


比如,個體差異的原因是什麼?可能有關他過去的經歷、家庭背景等一些我們不能通過大數據看到的東西

(缺失變數)

非常多。再比如,看微博但並不知道他發帖還是留言是真人還是假的,是一個人在操作還是多個人。


 


所以很多事情是沒法確定的。這就導致大數據的厚度受到很大限制,時間的長度也受限制。

因為異質性問題,大數據用於因果推測仍然十分困難,也需要諸如工具變數、斷點回歸等方法,還是需要假設,所以大數據不能解決最根本的困難。雖然大數據對研究有很多幫助,但是最根本還是要靠學者自己的能力,所以好的學者永遠有優勢,好的訓練底子永遠有優勢。想要通過大數據本身來解決方法上困境的想法和做法是行不通的。 


 


實際上,所有社會現象的數據都是有局限的,這也就是為什麼我們要收集不同的數據,從不同的方面、不同的角度看一個問題。


 


這和我以前講的三個基本原則有關:為什麼需要數據、為什麼需要不同的數據?就是因為個體的異質性很強,個體與個體不一樣,這個人不能代替那個人,那麼如何知道這個人的特徵?


 


我們可能需要不同的測量,包括現在學者們想測量的基因、這個人小時候生下來的情況、家庭背景、中年生活、老年生活等整個生命歷程。我們經常需要跟蹤性調查,而中國其實很少有這種幾十年的跟蹤調查,這種數據都是需要相當長期的積累。


 


雖然大數據獲取速度快、量大,但它相對來講信息量中每一個個體的信息非常少,一個人的各個方面也不能夠聯繫在一起。所以,我覺得大數據是一個薄數據或者淺數據,而不是深數據,不是一個暢通數據。


 


也因此做研究用大數據還是有缺陷的。但也不能因為大數據有缺陷就不用,恰恰相反,大數據可以從另一個角度反映事實的真相。正是因為每種數據都會有缺陷,現在的大數據可以彌補其他數據的缺陷,同樣,其他類型的數據也可以彌補大數據缺陷。


 


所以我對大數據的看法就是,

我們需要一個數據生態,這個生態應該是有各種各樣的數據,各種數據發揮不同的作用,大數據有大數據的作用,調查數據有調查數據的作用,政府數據也有政府數據的作用。

 


 


我這裡把政府數據和大數據分開,實際上大數據也可以包括政府數據,因為政府管理也是工作,也產生大量的數據。


 


一般數據類型基本的劃分是包括三種:商業的、行為的數據,這是一般的大數據;政府的管理數據,這實際上也是大數據;第三種就是研究性的調查,這是傳統數據,也就是常說的抽樣調查數據,此外還有一些為研究目的而特定產生的數據。


 


這三種數據在社會裡、在學術團體里、在國家制定的政策里都有它們的作用。

我們不能夠只重視一種數據而忽略其他的數據,不同的數據、不同的主題、不同的類型、不同的人群、不同的數據結構都需要存在,因為它們能夠互相彌補各自的缺點





Q:您主張建立一個數據的生態,它是各種數據的融合。進一步從方法論的角度,現在社會科學定量研究也有一套方法論,比如說以因果分析為核心的一系列方法論。但大數據進入數據生態,是將繼續這種研究範式,還是可能帶來研究範式的革新?


  


謝宇

:伴隨大數據的產生,我覺得

社會科學基本的研究範式並沒有變。用數據檢驗理論的研究範式沒變,因果分析的標準、方式也沒變

。從研究設計來講,我覺得大數據的產生給我們的研究帶來了很多便利,以前不能做的現在能做了,但是整個大的範式並沒有改變。


 


那麼它帶來的改變在哪呢?首先是

選題的改變

,以前很多不能做的現在有數據能做了,數據量比較大,能夠支持一些以前傳統數據不能做到的。


 


其次它對計算的要求也高了,也

給方法上帶來了挑戰,主要是計算方面的挑戰,

比如機器學習

(machine learning)

,small area的非參數

(non-parametric)

估計,這些理論上的範式上以前都是有的,但是以前沒有數據來支持這樣的設計和方法。

所以從計算方法和選題上都有很大的進步,我們不再局限於傳統的命題和傳統的方法。


 

Q:一些人認為人工智慧或新的方法的出現,可能加大學術界的貧富分化:可能有部分人掌握了新的方法而走在前面,而另一部分人只會傳統的研究方法、數據計算。這樣是否真的會造成分化,或者說是朝著兩個不同的方向發展?


 


謝宇

:大數據的產生會造成分化,但我認為不是像你說的那種分化。

我覺得主要的分化就是資源的不平等,大數據的價值在於數據的獲得和使用。


 


有一些數據,比如說政府部門的數據,

只對一部分人開放,

這樣的話能否獲得政府資源就決定了你能不能有這方面的資料做研究。很多商業的數據也是只對部分人開放,所以有頭銜的、受到信任、受到委託的,或者成就高的人更可能有資源,所以是資源的不平等造成的分化。


 


還有一個不平等,現在的

大數據研究需要團隊合作

,因為大數據研究可能需要不同的專業、需要計算能力、需要編程、需要可視化等,各方面都有團隊要求。單槍匹馬做研究比較困難。


 


這兩個方面的不平等實際上也會反映到機構層面,比如可能更好的學校更容易得到資源,更可能有不同的團隊來支持他,可能像北大清華這樣的學校會更有利,一般的學校一般的老師他們可能就沒有得到資源,或者不能夠有一個很大的團隊,我覺得這個不平等是有的。


 


研究方法上的分化和不平等,我並不認為會產生

。因為大數據技術的使用跟以前的方法一樣,我覺得

掌握技術並不難

。真正有了大數據,要學要做都能做到,因為數據是有限的,方法也是有限的。


 


像機器學習、參數估計這些方法都是以前人們就知道的。在這些大數據出現之前我們就假想了有這樣的數據要怎麼樣做。我們當時就知道,再換一個很大的數據會怎樣,像今天運用到的一些例子的確證明了我們原來的想法。


 

Q:關於大數據您還有什麼要補充的嗎?


 


謝宇

:有時候,很多學者和民眾會抱有一種幻想,覺得什麼新東西的到來就可以改變一切。當然這與人們在中國見證的經歷相符,比如經濟上的改革開放之後市場就變得繁榮,智能手機的出現改變了很多生活方式等等。而學術實際上並不是這樣,並不是說有新的技術、新的數據,就可以去改變它的所有方面,這些技術和數據當然會有很大幫助,但並不能完全改變一切。

因為根本的問題還不能解決,這需要我們的學者有很好的訓練,寫出好的文章。這些訓練、文章來自於對理論的把握、對文獻、對人的觀察等各方面最基本的訓練,這些都是不會改變的。


 


把科學作為一種思維和生活方式來提倡



 

Q:在您看來科學家是否擔負著對公眾進行科普的責任?


 


謝宇

:我覺得我們應該承擔這個責任。我參與了《賽先生》公眾號的創立,後來又做了《知識分子》。我有很多朋友是自然科學家,所以我先講講自然科學。我認為中國的自然科學發展非常快也非常好,特別當你在北大清華,可以看到中國自然科學真的走上了國際水平。如今中國有謝曉亮、施一公、饒毅等優秀的學者歸來,而且他們幾個人不單單是回國,他們也改變了學術生態。自然科學的生態,就是一個高標準的生態,是國際化的生態。中國的自然科學家當中有很多人已經對世界性的科學、前沿領域作出了很大的貢獻。


 


所以中國的自然科學現在已經非常好了,

當自然科學的學術發展好了以後,就會對科普提出更高要求

。因為要科普前沿的東西實際上是很難的,中國以前沒有很多很好的科學家,民眾需求也沒那麼高,一些記者、學生就自己做科普,這是可以有的,在過去他們可能已經做了很多,

但到了介紹最前沿的科學的時候,就需要真正的科學家。因此,有一些科學家直接參与科普和與大眾接觸,我覺得是自然而然的事情。


 

 Q:科學家參與科普,對普通公眾的最大意義在哪裡?


 


謝宇

:我覺得科學家參與科普是很好的事情。為什麼呢?在這裡,我的想法就更廣了。中國現在有很多方面實際上都在突飛猛進,進步非常大。比如現在中國電商的很多技術、營銷手段和行為已經超過美國。又比如中國中小學教育也做得非常好,除了給學生的壓力太大,但至少教育質量還是過得去的,甚至本科教育也不錯。


 


中國的很多行業,實際上也都已經走到了世界比較前沿的地方

。但是到底是第一第二第三,這其實不重要,我個人比較反對動不動就講中國是第一、中國什麼了不起的說法,這其實不是很健康的情緒。


 


但中國現在也存在很多問題,除了不平等還有很多其他問題。

我認為中國許多社會問題的核心實際上都可以歸結為沒有一個共同話語體系的問題,實際上就是個理念的問題

。所以呢,我覺得我們提倡科學,就是希望給大家一個新的選擇。通過科學,我們可以培養自己的興趣,提高自己對自然的理解,可以尊重事實、尊重科學規律,形成一種客觀的、而不是主觀的,國際化的、而不是狹隘的民族主義的取向。在科學的事實上,在科學文明的影響下,我們會對科學本身肅然起敬。在中國,有很多現象,比如說迷信、不禮貌、不文明,實際上就是因為缺乏這種敬畏。


 


科學是很偉大的,當偉大的科學家做出來偉大的研究,你就不能不佩服他們。

所以在我看來,強調客觀事實、講客觀性、尊重科學性和國際化,在當代中國,都應該作為一種生活方式和思維方式來進行提倡。

那些看起來比較敏感的話題,往往就是因為沒有一個統一的話語體系能夠把不同的人聯繫起來,所以才會擔心誤解、擔心謠言被輕信。科學的話語是得到國家和政府支持的,至少我至今從未碰到一個幹部,說科學不重要,他們都說重要,都是支持的,因為它也是經濟基礎之一。


 


科學能影響到經濟,實際上對做人的方式也能夠有所影響。

我為什麼覺得科學家重要呢?

作為公眾人物,科學家可以發揮正能量的作用。

在中國需要一些能夠產生這種正能量的公眾人物,讓他們發些聲音,給大眾特別是年輕人帶來正面的想法,而不是像有些「網紅」靠庸俗題材出名。

我覺得科學家應該可以站出來,以科學家的形象,提倡科學地考慮問題和科學的生活方式,這對年輕人乃至整個社會都會有幫助。



Q:在中國現有獨特的社會和網路生態下,科學家或者知識分子應該如何參與其中?


 


謝宇

:中國如今從比較閉塞的農業社會走向了一個比較開放的現代化社會,大眾對知識的需求迅速增加。中國文化本身就有推崇教育、推崇知識的傳統。但是由於這個轉型過程太快,個體處於不同的環境、來自不同的背景,獲得信息的渠道也有限。

在這種情況下,價值觀和情緒的社會分化比較嚴重。就是這種情緒分化對知識的需求和傳播造成了很多不確定性。


 


比如,轉基因的事情在美國也有爭論,但不像中國這樣發展到極端的地步。所謂極端,就是覺得我一定對,也不聽別人的,而且很情緒化。這對社會實際上不太好,因為社會是有分工的,社會現象需要研究,需要理性探討。這個社會還是缺乏優良的知識傳播生態。

我覺得對社會現象的討論也應該有一個生態:

這個生態裡面有對應領域的專家,有其他領域的專家,有關心相應議題的社會/公益人士,有退休老幹部,有政府的職責執行部門,有志願者,有贊助商家等等。

但不同的人都要理性地參與。


 


我覺得中國的教育還是有一定缺陷。大眾很容易情緒化,很容易不信任別人,喜歡小道消息,喜歡和朋友飯桌上討論。中國大眾其實一方面很飢餓,他們很想知道事實,想參與,一方面沒有很好的信息。有很多記者發布的東西並不準確,造成了很多人的憤怒和情緒。所以這就是為什麼科學家能夠並且非常需要參與到這個生態里。


 


對生活中的社會現象來說,如生育的問題、養老的問題,需要有更多嚴謹的研究,有更多更好的數據來支持,也應該有更多的人參與討論。這並不是說一個學者做了一個報告,或者在著名雜誌發表了就一定是對的。政府也應該了解民眾需要什麼,應該多支持社會科學研究有不同的聲音。如果是嚴謹的、好的討論,民眾就不會有那麼多怨言,因為你是有證據的、是理性的。 


 


假如說

(政府)

支持了比較好的、比較嚴謹的學術研究,民眾就會尊重,就會懷有一種敬意。往理性的方向去討論,能夠說客觀的話,就不容易情緒化。而現在我覺得社會環境還是不太重視社會科學,認為它不重要。而缺乏支持就不能有很好的研究,不能好好研究,就只能簡化成幾句很簡單浮躁的口號。





Q:在這種互聯網以及新媒體的環境下,科學家如何能更好地擔當這樣的責任?


 


謝宇

:互聯網的產生,實際上為中國的社會科學家提供了很多良機。

除了對學術研究和合作的幫助之外,還有就是使學者跟大眾能夠有很好的互動

,這在以前是沒有的,現在一個微信

(文章)

可能有500萬人讀過,通過這樣的方式,很多人都開始知道以前都沒法知道的。互聯網的產生同時加速了信息的傳播。因為網上的信息很容易廣為傳播,不是靠報紙編輯控制的。所以我們的學術成果也是可以很快被許多人接觸到的。


 


從這一點來講,自然科學家和社會科學家都肩負著相當的社會責任,因為他們的參與有可能改變這個生態,可以改變民眾的想法和思維,幫助他們理解很多事情。

我們做好了以後,實際上是可以給很多人很好的支持的,比如社會參與和社會創業都是需要知識的。


 


我覺得,這個社會中的很多問題,有社會學家的參與會幫助國家更好地應對,

不能只靠刪貼和保持網上輿論基調就能解決問題。大家的素質提高了,他們獲得的信息透明了、通暢了,整個生態也就會變好了。


 


跨學科視野下的人口學研究



 

Q:目前中國處於快速轉型時期,人口學的發展也面臨很多機遇和挑戰。從研究的國際視野來看,您認為哪些議題值得去關注和研究?


 


謝宇

:我2000年在JASA

(Journal ofthe American Statistical Association)

上發表了一篇文章「Demography: Past, Present, and Future」,是對人口學的一個回顧和展望。現在18年過去了,我覺得這篇文章的意義還在。我當時提出了「小」人口和「大」人口的概念。

「小」人口

(就是formal demography)

重點關注生育、死亡、遷移,更多地考慮人口結構的變數

,如年齡和性別,卻較少考慮社會的整體結構。

 「大」人口的概念即 population research /studies,提出這個概念是由於人口和很多社會現象有關聯

,人口學和社會學、人類學、生物學、心理學、經濟學等都有很緊密的聯繫。

所以我一直主張把人口學看作是跨學科的,

這樣它就很豐富,否則它就可能會有些單調。


 


人口學應該用理論來探討更深的社會議題,做更深入的研究,所以跨學科我覺得是最好的方案。

我認為這個「大」人口學的概念就是人口學和其他不同學科的交集

。這個交集點非常重要,為什麼呢?

因為任何量化研究,幾乎都離不開人口學

。人是有異質性的,當你考慮一個總體的時候,你就要考慮其中的異質性問題,就要考慮人口最基本的結構,比如說地區、年齡、性別、教育、婚姻狀況等等。從這個意義上講,只要是做量化研究的人,政治學也好、社會學也好、經濟學也好,研究只要跟個體的人有關,就離開不了人口學,就一定要把人口學作為一個基礎。


 


在這個情況下,人口學怎麼發展呢?

我覺得多推廣「大」人口很重要,比如研究養老、結婚、離婚、同居等等

。在我們做同居方面的研究之前,中國沒有同居方面的數據,也沒有這個議題。我們CFPS

(China Family Panel Studies,中國家庭追蹤調查)

在2008年就開始就設計同居相關的問題,如今顯示同居在中國也已經成為一種重要的社會現象和生活方式,我覺得這是我們需要去關心的。


 


我們每年在國內有一個社會學和人口學領域的量化方法研究年會,實際上量化的社會學和人口學研究是一回事。所以當很多人問我,你到底是社會學家還是人口學家,我就經常講我既不是人口學家,又不是社會學家,我就是謝宇。所以,沒必要把每個學者擺進一個盒子里,好像你就只能屬於這個「盒子」,不能屬於那個「盒子」了。我覺得做學者是沒有「盒子」的,它是個人的愛好、自己的興趣和工作。所以,不一定非要區分到底是社會學家還是人口學家。

我覺得學者之間不要因為你是這個專業、不是那個專業,而製造太多界限

。在學術上不交流,對學術的發展是很不利的。


 


對於你的問題,「大」 人口學的方向、議題很多。

比如不平等、社會地位這一套議題非常重要,也是我們人口學應該關心的。

這些問題不簡單是數量上的問題,還是一個社會分布、資源分配的問題,也就是說在不平等的大框架下面很多議題可以做。此外,即便是研究生育,除了關心生多生少,還應該關心孩子將來的發展,關心他/她的健康、智力發展、心理發展、教育和就業等等這一系列議題,也可以關注他/她的生命軌跡

(life course)

的變化,關注他/她一生經歷了什麼事情。


 


另一個比較重要的議題,也是我現在比較關注的,是家庭。

我覺得改革開放以後、城市化以後、不平等產生以後,尤其是大城市房價高了以後,中國的家庭發生了很多變化。以結婚為例,從建國以後到改革開放中期,基本上絕大多數人都會結婚,是universal marriage

(普婚)

。而如今,很多人晚婚,或者想結婚卻結不了婚。而結婚對於社會穩定很重要,對個人的身心滿足、事業與追求,都有幫助。但假如個人希望結婚卻結不了婚,就說明供需不匹配,供需不匹配就反映了很多問題。


 


擇偶困難可能有出生性別比失衡造成的男多女少方面的原因,這是數量問題,但一個人的社會地位或者接受的教育水平高卻找不到合適的對象,這卻是匹配的問題。而在當前的中國背景下,經濟實力是婚姻匹配中的重要因素,比如房價上漲,大家對消費又有很多的要求,於是婚姻市場中的不平等也增加。


 


在這個情況下,我覺得婚姻是家庭研究領域的一個重要話題。

而且結婚以後還有很多問題可以研究,比如婚姻的穩定性、家庭幸福感、生育行為、生育意願、代際流動的影響等,都是非常重要的問題。與婚姻行為有關的問題及背後反映的社會地位、社會流動、家庭關係機制等都值得關注。


 


再一個重要的問題是養老

。老齡化並不只是講贍養問題,而是要考慮到老齡生活的各個方面,包括老年人的經濟情況、健康狀況、和子女的來往,還有可能喪偶、離婚,也可能再重新組織家庭或者同居,以後可能會發現老年人同居也是個常見的現象,因為財產原因和子女反對

(老年人再婚)

。所以我們以後也要研究老年人同居,社會發展了以後,它既有固定的基礎,又有文化的改變,還有來自現實的壓力,社會變化中會有很多現象是需要我們研究的。


 


我覺得還可以多研究少數民族的問題,同樣從家庭的角度。

少數民族不僅生育率不一樣,實際上他們的婚姻、經濟、子女養育、養老也可能有很大的不同,而且這些方面都可能正在發生變化,這些問題都值得我們研究。


 


此外,還有主觀幸福感的問題。

我覺得社會上很多人會感到不滿足。這種不滿足,有可能是主觀的,比如他們想要什麼,他們的主觀認可是什麼。當我們想知道他想要什麼,才能知道怎樣讓他們滿足。


 


還有一個議題也與主觀幸福感有關,可能實際上已經有學者開始做了,

就是基因和環境對人的影響,我覺得這個議題也是蠻重要的,這也是跟大數據有關係的,

基因數據的量也是很龐大的。以後基因和人口行為的關係也是個研究方向。上面我講的議題是從主題上看,要從方法論和數據上看,有更多的問題。



Q:您剛才提到「大」的人口學其實是和計量社會學融合的,您認為二者在方法上是不是沒有任何差異?


  


謝宇

:是,不僅是和量化的社會學,我覺得和一些其他學科,比如勞動經濟學也是融合的。舉個最簡單的例子,比如說婦女的勞動力市場回報,就是勞動力市場的性別不平等,這是個很經典的經濟學問題、社會學問題、也是人口學問題。因為它牽涉面很廣,它可能牽涉到婦女的教育,可能牽扯到婦女的婚姻情況,涉及到她的家務、她的生育、以及其他方方面面。所以研究這個問題,就不要分社會學和人口學,實際上各方面的知識都需要有,可能還涉及心理學,所以這是很複雜的問題。 


  


社會學和人口學兩者的共性是:首先都需要有數據來說話,要有證據,即evidence-based,這是基礎。

其次,

手段都是通過數據和統計分析,這意味著使用的是同一套標準,

比如什麼叫causal influence

(因果推斷)

,什麼是significance

(顯著性)

,這是通用的。average

(均值)

和medium

(中位數)

大家都能理解,只是使用者偏好不一樣。

第三,兩個學科都關心同樣的問題,所以實際上理論也是可以通用的。

不同理論視角能夠給你不同的啟發,據此你希望提出一個假設,這個假設是對社會現象、社會行為的理解,這個假設和理解也是通用的。所以,你要做的就提出這個理解和假設並給予證明,但是怎麼來證明就要用到數據,兩個學科都是用同一種研究範式,實際上不同的社會科學只要是量化取向的就和人口學是一致的。


 




謝宇

,社會學家,美國國家科學院院士、美國藝術與科學院院士和台灣「中央研究院」院士,美國普林斯頓大學社會學和國際研究BertG.Kerstetter "66大學教授、當代中國中心主任,北京大學千人計劃講座教授、社會研究中心主任,微信公號《知識分子》主編之一。


 


謝宇教授的主要研究領域包括社會分層、統計方法、人口學、科學社會學和中國研究,代表性學術專著有《回歸分析》、《社會學方法與定量研究》、《分類數據分析的統計方法》、《科學界的女性》、《婚姻與同居》、《美國的科學在衰退嗎?》等。近些年,他致力於在中國推廣實證的社會學研究。 










更多精彩文章:





謝宇:成為知識界共同的平台






凱西·奧尼爾:盲目信仰大數據的時代必須結束 | 演算法密碼




製版編輯

 

|

 

皮皮魚






▼▼▼

點擊「閱讀原文」,直達知識分子書店。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 知識分子 的精彩文章:

學人說:「同志小軟體」到底給這個群體帶來了什麼?
劉勇軍:從數學不及格到跨國葯企研究部總裁

TAG:知識分子 |