當前位置:
首頁 > 最新 > 聊聊方法:在線民族志研究如何獲取樣本數據?

聊聊方法:在線民族志研究如何獲取樣本數據?

引言:蓬勃發展的互聯網環境為民族志研究提供了豐富的機會和素材,但目前研究並未完全展開,很重要的原因是一般性方法論的缺失,導致初期研究沒有門路。專註於人群和數據深層次信息挖掘的民族志研究者,常常感到被大量在線資源所壓制,因此更多選擇專註於非常小的在線樣本。這篇文章試圖通過對在線博客的系統性抽樣方法的討論,拓展在線定性研究方法的應用範圍,並重點強調在初步調查中可能遇到的技術及倫理障礙,以及潛在的解決方法。

(這是社論團隊第S615次推送)

在線研究:三種主流方法

1、大數據分析法(不再贅述);

2、傳統定量分析法(不再贅述)。

3、定性分析方法,這是民族志研究者利用在線網路進行研究時最常使用的方法。通常會使用地理上有界的社區(例如學校團體)作為在線研究的主體。定性方法也被運用到探索沉浸式和相對獨立的虛擬世界(例如魔獸世界)的民族志研究中,在這裡研究者成為了參與者以及分析的鏡頭。此外用戶在社交網站/平台上的行為研究是當前在線民族志研究的熱點之一。然而,在這些研究中,多數並沒有執行系統性的抽樣方法,極大地影響到樣本的代表性和分析結果的普遍性。以博客為例,主要的障礙在於,存在著多個博客平台互動(WordPress、Blogger等)和內容類型豐富等特點,造成傳統抽樣方法的不適用,目前研究者們普遍採取的緩解策略有:縮小樣本量;使用其他的數據收集形式;專註於對同一博客不同時間點的帖子的縱向分析;採用滾雪球等非隨機抽樣方式。本文作者認為,這些方法並沒有觸及方法論本身,無法實現真正的抽樣優化。

系統性抽樣方法

研究通過對個案——美國減肥博客的民族志研究的數據抽樣過程的介紹,提出了在線民族志研究實行系統性抽樣的可行方案,重點聚焦於三個議題:1、在線質性研究中,可以使用怎樣的系統抽樣技術?2、系統抽樣面臨的技術障礙有哪些,以及應該如何克服?3、在線質性研究存在哪些倫理困境,研究人員可以採取哪些策略來應對?

過往研究指出,減肥話題的博客內容,一般可以由其選擇的減肥方式不同而分為:節食、運動、手術等,並且博主選擇博客記錄的動機也存在著差異性:建立減肥社區相互激勵督促、減肥成功後「炫耀」成果及傳授秘笈等。同時,當前社會對肥胖者的刻板印象並未消除,很多博主通過自嘲式的幽默口吻來敘述自己的減肥歷程,事實上是通過自我陳述的方式機智地建構著在線讀者對其形象的認知。因此減肥方式的多樣性,以及博主對這一過程的敘述風格,都帶來了複雜而時有衝突的方法論和倫理挑戰。

本文作者在進行這項研究時,首先在抽樣之前建立了初步的包含和排除標準。挑選位置為居住在美國,或在「關於我」界面填寫了國籍為美國的用戶;另一個指標是僅收集那些直接參与減肥話題討論、記錄減肥進程、討論肥胖恥辱等話題的博客,包含了自我認定為減肥博客和討論過減肥話題的博客兩類。因為選擇了個人博文,而非博客賬號本身作為分析單元,所以情況更為複雜樣本。而具體抽樣策略共有四個階段,如下圖所示:

第一階段,由研究者根據過往研究結論,列出與話題相關的高頻關鍵詞(人為判斷),作為種子(seed),例如「體重歧視」、「節食餐單」等,使用Google對關鍵詞進行搜索,生產一個非系統性的隨機抽樣樣本。注意,這些辭彙提供的非隨機樣本並不包含在最終樣本中,僅用作試點分析,生成第二階段至第四階段數據收集/搜索所需的關鍵術語(經驗數據支撐)。

第二階段,基於第一階段分析獲得的12個高頻術語,查詢其在三大搜索引擎:Google、Bing和Yahoo中的分布情況,搜索引擎內及跨搜索引擎的重複結果僅記錄一次。最終收集到112篇符合標準的博客文章。

第三階段,在第二輪112篇博文基礎上進行迭代搜索,使用purposive sampling (目的抽樣)來擴展樣本博客的多樣性,尤其是性別、地理位置、宗教信仰及其他在過往研究中被認為是對肥胖和減肥態度有重要影響的人口學因素,第三輪收集的篩選標準與第二輪一致。儘管減肥在美國受到了廣泛關注,但人們的表達即表達的關切程度是明顯不同的,這也是採取目的抽樣的原因。這一步驟中,又有86篇博文納入到樣本中。

第四階段,使用DuckDuckGo對先前生成的搜索短語再進行一輪搜索。這是一款不會根據用戶的人口統計信息或搜索歷史來優化搜索結果的搜索引擎。目的在於驗證前述抽樣結果的代表性。在這一階段又產生了36篇博文樣本。

因此最終研究獲取了來自234位不同博主的234篇博文。為了確保樣本的多樣性以及進一步的分析需要,同時收集了博主的地域即背景信息。

對234篇博文的數據分析,採取了 Bernard, Wutich, and Ryan (2016)的定性主題編碼法(thematic coding methods)。同時,研究還收集了234個樣本在2005-2015十年間的減肥主題的更新狀況。收集了這10年1月和6月的相關博客條目(前者是新年計劃,後者是進入到泳衣季),通過縱向分析探討了博主對體重和減重態度的變化。

方法/技術挑戰

簡單來說,這份研究採取的系統性抽樣策略為:用「種子」搜索詞來對在線文本進行抽樣,生成經驗性的搜索短語(1階段);隨後使用迭代抽樣策略(2-4階段),以確保樣本的系統性和代表性。這之中遇到的技術障礙有:

1、搜索引擎本身演算法的影響,也就是說搜索引擎呈現的結果排序可能並不僅僅依據研究給出的標準。例如基於Google的搜索結果就可能受到其PageRank演算法的影響,顯示出系統頻繁鏈接的內容優先順序更高。此外,瀏覽器基於用戶「歷史瀏覽記錄」優化推送搜索內容也會對研究樣本的提取產生一定的影響,稱之為「cookies」。研究的解決策略是引入第三方搜索引擎,例如DuckDuckGo來克服。

2、與搜索引擎演算法相稱的搜索詞很難以經驗性和系統性的方式生成。多義詞、同義詞和垃圾郵件等因素,使得構建相關的關鍵詞非常困難。本文案例的策略是,首先使用關鍵詞的非系統性和非正式性列表(例如減肥博客和體重歧視)作為「種子」來定位和分析第一輪博客文章。然後,這些博客帖子的內容用於創建自然語言和關鍵詞所構成的搜索短語(例如「我的減肥鬥爭」、「節食體驗」等),這些來源於「經驗數據」的搜索短語相較於原始的關鍵詞(研究者列出的),更具統計科學性,同時為了過濾無效的廣告文本,另一個策略是僅收集個人博主的博客內容,但事實上仍然無法避免普通用戶博文被忽略的問題(寫作策略和關鍵詞選取的應修)。而對於未來研究而言,開發一套能夠記錄和糾正這些可能的錯誤來源的系統方法,將是推進研究方法改進的重要一步。

倫理挑戰

1、博客的隱私性和社交性的邊界模糊,因此研究者僅選擇了對公眾開放的博客。

2、匿名性的問題,研究的策略是尊重博主的個人聲明,例如不希望被轉載等。

3、儘管研究人員回根據博客中列出的高度私人性故事來對作者進行匿名處理,這種處理方式仍然帶有道德風險。因為匿名化實際上可能會抹去博主對於分享行為是否存在風險的主觀認知信息,並且與博主個人的建構線上身份和交流圈的嘗試相悖。本研究的策略是,儘可能引用博客原文來表述。當然,如果研究人員追求更為嵌入式的民族志研究,則可能會直接向被調取者詢問隱私級別。

4、另外,由於用戶可能擁有多個社交平台賬號,而各賬號之間可能會出現互相關聯的現象,那麼研究人員使用博主的其他(如Twitter)賬戶信息來確認其本人的人口統計學信息和減肥歷程的描述真實性,是否符合道德和方法論上的可接受原則呢?在這份研究中的策略,是堅持了機構倫理審查委員會(IRB)提供的原始參數,並且只專註於博客,但作者也承認這種方式是非常人為的,因此文章建議研究人員可能需要與IRB進行更為密切和持續的對話,以便在研究方法和網站的選擇上能夠更靈活地應對網路空間的互動性和動態性特徵。

結語

本文闡述了一些線上民族志研究可能遇到的關鍵性技術障礙和倫理挑戰,旨在藉由對減肥博客研究的數據收集和分析過程的闡述,拋磚引玉,激發學界更為廣泛的關注和討論,討論如何以更為系統性和可複製的方法收集博客及其他在線文本數據,同時做到尊重和保護內容的生產者。

文章來源:Liza C. Kurtz, Sarah Trainer, Melissa Beresford, Amber Wutich, and Alexandra Brewis(2017):Blogs as Elusive Ethnographic Texts: Methodological and Ethical Challenges in Qualitative Online Research. International Journal of Qualitative Methods:(16)1-12.

整理:雅靜

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 社論前沿 的精彩文章:

中國進城務工女性是超人,工作婚姻兩不誤?

TAG:社論前沿 |

您可能感興趣

「物」的民族志:視野與方法
楊春宇:完整和真實——民族志對於海外研究的意義
《清水裡的刀子》如油畫「民族志」
吾土吾民、世道人心與關於農民的民族志
虛擬民族志:網路社群的另一種打開方式
民族志視野中「真實性」的多種樣態
十七世紀歐洲傳教士關於滿族的民族志觀察
《清水裡的刀子》:一部迷人的「民族志」電影
【邊疆時空】張亞輝 | 民族志視野下的藏邊世界: 土地與社會
網路主播的污名化及其倫理困境:一項網路民族志研究
《中國民族志×西北篇》有感
博物館系列之—日內瓦民族志博物館
東南亞民族志研究:開啟中國與東南亞國家和諧交往的「金鑰匙」
今年古根海姆 Hugo Boss 獎得主說,她的作品就像自我民族志