當前位置:
首頁 > 最新 > NICAR大會歸來,談中美數據新聞有何不同

NICAR大會歸來,談中美數據新聞有何不同

本文字數:6516

閱讀時間:20分鐘

3月14日晚,鏑次元邀請到了解放日報·上觀新聞數據新聞中心的數據新聞記者肖書瑤,在沙龍中她與我們分享了NICAR大會的滿滿的乾貨,並對中國、美國數據新聞的差異進行了詳細地探討。

分享嘉賓

肖書瑤

《解放日報·》:上觀新聞數據新聞中心,數據新聞記者;

畢業於哥倫比亞大學新聞學院Lede Program

本期沙龍主要內容

1、NICAR大會此行的見聞

2、參與的最有意思的演講和課程是什麼?

3、關於中美數據新聞教育和從業的差異

在沙龍的開始,肖書瑤老師先為我們介紹了她在本次Nicar大會上的見聞。今年的Nicar是史上參會人數最多的一屆,共有224個分會議和334位演講者,會議歷時五天,稱得上是計算機輔助報道的盛宴。

會議日程:

https://www.ire.org/conferences/nicar18/schedule/

Nicar會議形式

肖書瑤老師就Nicar的會議形式進行了簡單的介紹。Panel即研討會,是來自高校的老師和業界的記者會就一個主題來分享他們的經驗。Hands-on為實踐性的技能小型課程,老師會手把手地教大家Excel、Python、R等工具的學習。Panel和Hands-on是Nicar會議上最多的。Nicar還提供了一些小型的圓桌對話、Demo課程以及現場招聘會。還為與會者的提供了一些social的場合,方便大家進行溝通和交流。

從內容上來看整個Nicar的會議包含了從新聞教育到新聞業界的實踐,實踐包括信息設計、動畫視頻、數據挖掘、數據分析、工具的介紹以及最新的機器學習,最重要的是新聞和數據思維的結合。

從最新的工具技術到最實用的資料庫,與會者可以從自己的經歷、身份出發去選擇適合的課程,無論是老師、學生還是數據新聞的從業者都可以在Nicar中找到感興趣的session。肖書瑤老師覺得最有價值的是數據新聞記者的思維模式和寶貴經驗,即怎麼把數據和新聞結合在一起,怎樣從數據里挖掘出新聞,怎樣面對真實世界裡千奇百怪的數據形態,怎麼樣讓設計更加人性化,怎麼樣利用機器學習的同時又對機器保持懷疑的態度。

肖書瑤老師通過案例為大家介紹了她認為最有意思的演講和課程。Year In Car是她推薦的第一個session,這個session回顧2017年在全世界的優秀數據新聞作品。數據驅動型的故事、解釋性報道、視頻和動畫,應有盡有。

Year In CAR:回顧2017年全世界各個媒體所做的優秀數據新聞作品:

https://docs.google.com/presentation/d/e/2PACX-1vSiEgEQ1-1EIB_rUUy49umYnH9SJxa1pdn3uIxa98bdzy2uZ4M58PFPRkNGnyva-TI4_6b_aYhlh35i/pub?start=false&loop=false&delayms=3000&slide=id.p

香港南華早報所做的一帶一路系列數據新聞是今年中國唯一一份入選該份榜單的作品,是把一帶一路沿線的所有經濟體的地理信息、經濟狀況、人口、環境等數據信息結合起來的五篇解釋性報道,更偏向於視覺類。

南華早報一帶一路系列數據新聞

南華早報一帶一路系列數據新聞手機適配版

結合南華早報的作品,肖書瑤老師提到「如果說前兩年美國的媒體還在更加註重 pc端的作品設計的話,那麼從今年各大媒體的作品來看,我覺得越來越多的媒體都注重於移動端的設計,有很多媒體記者還提到他們會根據社交媒體及移動端進行二次設計,而不是僅僅將PC端的功能進行簡化。」

肖書瑤老師分享的第二個session是設計類的,Humanizing Your Design是她最感興趣的一個概念,即讓圖表更加人性化。肖老師所理解的「人性化」就是把枯燥的柱狀圖、餅狀圖、線圖進行更加形象化的展示,讓人腦能夠把抽象的數據和現實當中的一些事物聯繫起來,使受眾產生更加直觀的感受。

Information design for the human brain!

https://docs.google.com/presentation/d/e/2PACX-1vROVkoZ2RNpQ6HI57ZC_zUcyIMW9a_3tO4RJsKmtjDKATg_i3E6gwi6-TUo0Z8GpjwKC8ZXBlYC3J7N/pub?start=false&loop=false&delayms=3000&slide=id.g3459a57143_0_180)

波士頓積雪深度

該圖是用了美國人非常喜歡的狗的形象來表示雪的深度,這張圖可以做成非常簡單的Bar Chart,但是如果把Bar Chart換成人們熟悉的狗的形象,更容易能夠讓大家去想像雪的深度,更加有畫面感。

國家地理交互可視化報道

這個session告訴大家如何在設計當中避免一些常見的錯誤,但更重要的是鼓勵了在設計中去進行更多有趣的嘗試,而不是為了保守、為了直接而採用最簡單的數據圖表。最簡單的數據圖表往往是最有效的,但並不是最形象的且為受眾所容易接受的。製作圖表的人、學者、老師、新聞從業人員,可能會更容易從數據圖表當中得到所要的信息,但是對於更多的受眾來說,更容易接受的還是能夠和現實產生聯繫的那些圖表。

緊接著,肖書瑤老師向我們介紹Machine Learning機器學習,這也是近幾年國內非常熱的一個概念,它通常會和Ai人工智慧、大數據、雲計算結合在一起。國內的新聞領域很少用到Machine Learning這個技術,它的門檻比較高。近幾年在美國的新聞報道中,越來越多的媒體都在使用機器學習作為輔助報道的手段,在Nicar,Machine Learning至少連續講了五年。

machine learning for reporting:

https://paldhous.github.io/NICAR/2018/machine-learning.html

肖書瑤老師舉了兩個關於機器學習的例子。第一個是Buzzfeed在2017年獲得了數據新聞金獎的文章,這篇報道就是通過訓練一台電腦去識別美國上空天空上所有的政府偵察機,並且追蹤他們的路線,然後進行可視化。第二篇具有代表性的報道是一篇對於特朗普Trump酒店大樓宴會的派對參與者進行面孔識別,訓練機器認識將其國會議員的照片並與社交網路上的宴會照片進行對比,來判斷出哪些國會議員參加了Trump的宴會,並且把競選資金捐助給對特朗普相關的利益團體進行了捐贈。

關於什麼時候需要使用機器學習,session中肖書瑤老師提到,認為大部分在新聞行業中所用到的Machine Learning還是進行分類和進行標籤。簡單來說,如果有一萬份政府文件需要知道分別是什麼類型的,那麼你可以根據分類特徵去寫一個演算法去訓練機器去識別這些文件,在根據文件內容進行分類。一定的訓練之後,機器能夠自動識別這些文件後,能夠代替人工去閱讀這一萬份政府文件,並且能夠對這一萬份文件進行有效分類。省去了很多重複性的人力勞動。

肖書瑤老師也提到,在利用Machine Learning時,要對其持有審慎並且懷疑的態度,因為所有的演算法都是由人類編寫,所以所有的演算法包含人類固有的偏見和判斷。

令肖書瑤老師影響最深刻的一個panel是如何將數據變成報道故事中的對象。(Beyond the numbers: Turn data into characters in your story.)這個panel以芝加哥先驅報的一組監督報道為例,內容為芝加哥伊利諾伊州如何隱藏被虐待的殘疾人。

Beyond the numbers:

Turn data into characters in your story:

http://www.chicagotribune.com/news/watchdog/grouphomes/ct-group-home-investigations-cila-met-20161117-htmlstory.html

芝加哥伊利諾伊州如何隱藏被虐待的殘疾人

在這個session中提到一個非常核心的概念:數據可以作為找到報道對象的指南針。,如何從資料庫中挖到適合報道的對象,這個對象既可以是人也可以是事件。這個案例從數據當中選取了三個典型的人物故事,來反應伊利諾伊州州政府的醫療輔助機構如何虐待成年殘疾人並導致他們的死亡,以及州政府對此類事件進行了隱瞞。這一系列的報道是融合了數據圖片和視頻的一個多媒體報道。

這並不是一個非常酷炫的、有著非常多海量數據與交互可視化的報道。但是其中的三個人物,無一不是來自於記者從政府的資料庫里所找到的對象,無一不代表了這一個群體所反映出的芝加哥州政府的錯誤行為。肖書瑤老師提到:「有時候更重要的並不是如何去展示它,而是如何能夠從海量的數據當中挖掘出想要的對象和能夠反映這個現象的事件。」

「建立你自己的資料庫;,找到一個最能夠代表你所反映現象的單獨的人,而不是幾個更弱的代表人組合在一起;,和那些有意願想要和你說話的人去談話。除了談話之外,還應該保存更多的紙質性的文件,。因為他們永遠是有意義的,人的記憶有可能會出錯,但是白紙黑字並不會出錯。」這是這個Panel的演講者給予大家的細節性建議。肖老師認為,在從數據當中找到採訪對象之後,跟著他觀察他的生活,聽他的傾訴,永遠都比在坐在辦公室面對一堆冷冰冰的數據有用得多。「因為找到數據永遠只是第一步,隨後你要做的就是走出辦公室敲開那扇門進行真正的採訪,這才是一個完整的數據新聞的流程。」

做完了關於Nicar內容上的分享,肖書瑤老師與我們分享了她在Nicar中遇到的有趣的事。The Only One In The Newsroom是今年Nicar其中的一個session,主要針對那些「在新聞編輯室當中孤獨的人們」,無論是在美國還是在全世界,小型的數據新聞編輯室是一個非常常見的現象,一到兩個人承擔了整個數據新聞新聞機構的全部工作流程,他們自己會編程、清理數據、做報道、做設計,而他們的工作就是和其他的記者進行合作,來做數據當中幫助在數據中挖掘出的新聞以及幫助傳統新聞進行可視化方面的探索。

肖老師也提到這樣一個現象:美國的數據新聞和可視化在大選期間有一個非常強烈的井噴,幾乎所有的媒體都在招聘能夠擁有數據分析和可視化技能的人。但是當大選結束之後這些百花齊放的狀況便不復存在了,這些新聞機構的經濟狀況也非常的不穩定。

在訪談中美國新聞從業者提到,大量依靠社交媒體流量的機構也受到了巨大的衝擊。社交媒體掌握了百分之七十的美國媒體的流量,在2016年,Facebook改變了演算法不再以推送新聞優先,而是以分享家庭成員當中的分享的心情這些推送優先。大量依靠社交媒體流量的機構受到了巨大的衝擊,例如Buzzfeed便在短時間內失去了大量的流量和廣告收入。導致不得這些機構不得不不在美國中部或者是一些更加local的地方裁撤掉他們的地方辦公室,而需要大量多技能人才的數據新聞也在向東西兩岸的大型媒體靠攏。

在肖書瑤老師看來,中美數據新聞從業最大的差異除了在人的專業上和團隊的專業上,更大的是在文化氛圍上。在美國,有無數的線上和線下的記者和學者之間自發的社群團體,他們會不斷地組織各式各樣的活動,線上的例如Nicar-list,slack,線下的meetup,進行交流探討。不管是作品評價還是技術問題或者招聘信息,都經常出現在這些活動中都會進行分享交流。即使在新聞編輯室里他們是獨自一人,但在整個大的社群中他們並不孤獨。

美國的大學也越來越意識到data的重要性,因為信息公開法案、大量的互聯網媒體、大量的政府的公開數據平台、大量互聯網企業的數據的產生,,使得數據成為了一個全新的新聞來源。基本上在所有的美國大學的新聞學院裡面都有一個共識:數據分析的技能和意識是現在的新聞學生所必須掌握的基本技能。

肖書瑤老師以她在哥倫比亞大學新聞學院的經歷為我們介紹了美國數據新聞的教育情況,哥倫比亞大學新聞學院走在全美新聞教育的最前沿,在計算機新聞領域開闢了三個不同的program,分別是Lede program, M.S. in Data Journalism和Dual Degree Programs。Lede program更側重數據分析和可視化,M.S. in Data Journalism側重新聞訓練編程能力,Dual Degree Programs是計算機和新聞學的雙學位碩士。

問:請問在美國數據新聞的閱讀情況(傳播力度、閱讀量)大概是怎麼樣的?

答:關於在美國數據新聞的閱讀情況,我在美國也和很多的媒體記者聊過這個問題,點擊量不論是在中國還是在美國還是在全世界其他各地都是一個非常重要的話題。在美國,他們認為一個酷炫的可視化項目能夠帶來更多的流量,美國人比較喜歡去看地圖,因為美國是由各個州組成的,每個州的情況不一樣,所以做地圖的話會更加直觀清楚。但很多美國媒體記者他們並不會用閱讀量來衡量數據新聞的質量,而更多的是把數據新聞和可視化報道的質量作為一個衡量美國媒體水平的標準。也就是說更多地看重能否跟上報道形式的潮流、專業能力與專業水準。大家普遍認為數據新聞是一個非常專業的領域,除了點擊量之外,更加重要的一個指標是你花在這篇文章上的時間、受眾的注意力的時間。

問:我想問一下美國的newsroom在做的一個項目的時候會進行數據新聞和普通新聞這樣區分嗎,記者和設計開發是屬於一個team還是跨部門合作比較多?數據新聞記者怎麼解決在某些特定領域因為不是長時間跑這個條線而積累不夠深入的問題?

答:其實我們一般不太會把數據新聞和普通新聞這樣區分開,因為在大家看來無論是數據還是計算機都是輔助報道的一個手段,所以說製作出來的都是新聞。對於美國一些大的News Room來說,Data Team里的記者是同時具有設計、報道、編程能力,所以他們就可以做記者也可以做開發,這個是不衝突的。但是對於一些小的News Room來說,他們更多的是和記者合作進行開發,為記者提供一些數據和設計。但是在這些小的News Room裡面他們同樣也會自己去pitch story做自己的報道。數據新聞記者在特定領域不夠深入也是一個問題,但是除了我們傳統所認為政治、經濟、文化是領域以外,同樣數據也是一個領域。在數據裡面就已經可以做出足夠多的足夠深入的故事,只要在一篇報道上下足夠的力氣,我覺得數據新聞記者並不會比任何一個條線記者要差。

問:相對於傳統記者,數據新聞記者面臨哪些職業困境呢?

答:數據新聞記者面臨的職業困境,我覺得因人而異吧。因為數據新聞記者是一個要求技能非常全面的一個職業,所以需要在編程、設計、報道、可視化、分析等技能當中選擇一項作為主攻方向,但是也要求記者在每一個方面都有所涉獵。這也是國際上比較關心的一個問題,這次Nicar上有一個Lightning Talk是說數據新聞記者應該有更多的職業發展道路,因為目前還沒有看到數據新聞記者當上了主編或者總編。在目前的News Room里還沒有足夠充分地意識和挖掘到數據新聞記者的價值,所以這不僅僅是中國數據媒體機構所需要面對的職業升遷問題,也是國際上很多媒體所共同面對的問題。

問:您覺得如何把數據新聞運用到財經新聞報道中從而使複雜的經濟問題簡單化?能舉個您之前看過的例子嗎?

答:數據和財經報道結合其實是有天生的優勢的。在我們的新聞實踐當中,也發現數據和財經新聞報道結合是最能夠直接切入的,而且財經記者也是在日常工作中數據素養最好的記者。我覺得數據新聞或者是可視化報道手段並不是把複雜的經濟問題簡單化,而是如何讓大家能夠用更容易看懂的方式去理解複雜的問題。關於將數據新聞運用到財經報道當中的案例,大家可以去關注一下華爾街日報,還有路透社專門的interactivegraphics推特賬號,裡面會發布很多和財經有關的數據新聞。

問:由於本科階段沒有很多實踐機會接觸到數據新聞的挖掘,有點恐懼去美國留學之後對Data Journalism的專業學習,不知道如何走出數據新聞學習的第一步呢?

答:Data Journalism的學習對很多人來說確實是一個非常令人恐懼的經歷。因為學習強度非常大、要求非常高,所以我覺得第一步就是戰勝恐懼,不要害怕編程。然後,在線網站上有一些很好的在線視頻可以去學習。建議你去YouTube上找,因為YouTube上會更多一些,國內的話我覺得城市數據團所做的教學視頻比較簡單易懂更容易上手。也可以看一看入門的書籍,比如說Data Journalism Handbook等等。然後另外一個建議就,是不要害怕編程。如果你想做數據新聞,你也可以不學編程,因為excel的功能也足夠強大了,只要你能夠熟悉掌握excel,你就能夠掌握足夠多的數據分析和數據清洗的技能,對於做數據新聞來說是沒有問題的。

問:想問一下在做數據新聞報道時是如何找選題的?在選題方面與普通文字報道有什麼區別嗎?

答:關於我們是如何找選題的,我想再次強調一點是數據新聞也是新聞,並不能和普通的新聞割裂開來,只是信息來源是數據而已,那麼對於普通的條線記者來說,他們的新聞來源可能是機構發布的報告,可能是他在生活中看見了一些有趣的事,可能是政府開的一個新聞發布會。但是對於數據新聞來說,我們的source是數據,我們是要從數據當中去發現你所要報道的對象,這個對象既包括人,也包括事件。當然,我們除了普通的文字之外,我們還會做一些信息圖的設計和一些交互方面的嘗試。

問:想請您分別談談中美數據新聞團隊的營利模式。

答:關於數據新聞的盈利模式,目前來說分兩種。第一個是這個機構它本身的新聞是要付費的,國外的,比如說紐約時報、華盛頓日報,國內的比如說財新,你是需要進行訂閱,才可以閱讀它的新聞。除此之外,還有一些數據新聞的衍生產品,比如說Database會公開數據新聞報道背後的數據,然後有一部分數據是需要付費下載的,有一部分是免費下載的。國內的像財新的數據+,也是依託於本身的數據分析和資料庫所產生的數據產品,也是需要額外購買的。有一句很形象的話來形容「數據新聞不賺錢,但是數據是賺錢的。」

問:老師能推薦國內數據新聞方面的一些書籍嗎?還有研究比較深入的學者專家等等。

答:國內研究數據新聞起步比較晚,所以我也不是很了解現在國內數據新聞的書籍或者是學者和專家。我會把我曾讀過的一些書對我學生的建議都是我在美國所讀的那些書,我都會推薦給大家。我所知道的國內高校像中國人民大學、中國傳媒大學、復旦大學、都還有北大深研院都有非常好的數據新聞教育。

問:您一般從什麼渠道來獲取較多相關數據呢?因為看到有一些數據是需要付費的或者提前申請的,有沒有一些渠道是成本低,權威的又可以獲得較多數據的呢?

答:用什麼渠道來獲取數據是一個非常大的問題,我們一般會從一些公開的資料庫數據平台,比如說國際機構的、各地政府的資料庫。還有一方面的數據來源是自己在網上進行爬取扒取的。另外一部分比較小的數據來源是來自於報告。需要付費的數據,我們很少用。

推薦書目

《the function art》

https://www.amazon.com/Functional-Art-introduction-information-visualization/dp/0321834739/ref=sr_1_1?ie=UTF8&qid=1521087486&sr=8-1&keywords=the+functional+art

《the truthful art》

https://www.amazon.com/Truthful-Art-Data-Charts-Communication/dp/0321934075/ref=sr_1_1?ie=UTF8&qid=1521087557&sr=8-1&keywords=the+truthful+art

《The Wall Street Journal Guide to Information Graphics: The Dos and Don"ts of Presenting Data, Facts, and Figures》

https://www.amazon.com/Street-Journal-Guide-Information-Graphics/dp/0393347281/ref=sr_1_sc_1?s=books&ie=UTF8&qid=1521087634&sr=1-1-spell&keywords=the+wallstreet+journal+guide+to+information+graphics

The Curious Journalist"s Guide to Data

https://www.gitbook.com/book/towcenter/curious-journalist-s-guide-to-data/details

The Data Journalism Handbook

http://datajournalismhandbook.org/1.0/en/

整理/王一雪 排版/李藝佳


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鏑次元數據傳媒實驗室 的精彩文章:

《歌手》2018開播 7位首發歌手竟然有這些不為人知的關係!
有人窮的戀愛都談不起了!偏偏他們就這麼有錢

TAG:鏑次元數據傳媒實驗室 |