鏑次元第55期沙龍分享《NICAR大會歸來,數據新聞乾貨知多少》
3月29日晚,鏑次元舉辦第55期線上沙龍,邀請到了第三屆數據新聞大賽特等獎的獲獎團隊,來自武漢大學新聞與傳播學院的三位學生:靳海蓮,史晨瑾,杜俊成。他們在本期沙龍中,與我們分享了在NICAR大會上滿滿的收穫,從學者的角度為我們帶來數據新聞製作的辦法、工具、技巧等諸多乾貨。本篇推送為上篇,由靳海蓮、史晨瑾兩位同學做分享,涵蓋沙龍的前四點內容。下篇則將發布杜俊成同學的分享內容。
分享嘉賓
第三屆數據新聞比賽特等獎獲獎團隊:
靳海蓮:
武漢大學新聞與傳播學院2014級新聞學本科學生
史晨瑾:
武漢大學新聞與傳播學院2014級新聞學本科學生
杜俊成:
武漢大學新聞與傳播學院2014級網路與傳播本科學生
本期沙龍主要內容
1,「谷歌不是全世界」:如何尋找深網數據?
2,在信息公開無法保障的社會語境下,非洲記者怎樣獲得數據?
3,身為記者,你的工具箱里一定不能缺這些——30個實用工具分享;
4,文字+圖片+視頻+數據,處理信息的利器推薦;
5,什麼是命令行,記者為什麼要使用命令行?
6,從用命令行創建一個文件,到用命令行處理csv表格,記者如何優雅的使用命令行。
「谷歌不是全世界」:如何尋找深網數據
靳海蓮同學首先分享了第一部分內容——如何尋找深網數據。
這一部分靳海蓮同學引用了哥倫比亞大學新聞學院數據新聞項目的主管Giannina Segnini女士的分享,她提出,谷歌不是全世界。對於搜索引擎來講,由其製造的網路爬蟲獲取並收入其搜索引擎的索引庫中的信息是十分有限的,人們經過測量,大概只有4%的信息能夠被收入進去,這一部分信息稱之為表層網路。另外90%的信息,包括學術信息,金融記錄,科學報告,法律文件,醫療記錄,訂閱信息,政府資源,房產信息,抵押信息,不含元數據的圖像,電子郵件地址,電話號碼,政府簽訂的合同,離婚記錄,海關的進出口記錄,專利信息,學術論文等被稱之為深網信息(deep web information)。剩下的6%則是被誇張了的暗網信息。
如何獲取中間90%的信息,我們依然需要藉助搜索引擎即谷歌搜索。靳海蓮同學分享了高效使用谷歌搜索的常用邏輯符號。
AND,即搜索關鍵詞疊加後的結果;
OR, 當想搜索可能只包含多個搜索字詞中某一個的網頁時使用,不加的話結果中通常只會顯示與這些字詞都匹配的網頁;
"",完全匹配搜索,搜索結果返回的頁面包含雙引號中出現的所有的詞,連順序也必須完全匹配;
-,減號代表搜索不包含減號之後的關鍵詞的頁面;
inurl: 以及 allinurl:,用於搜索關鍵詞包含在url中的頁面;
site:,站內搜索,搜索某個域名下的所有文件;
filetype:,可以是pdf、excel等等。
谷歌常用的邏輯符號
接著,靳海蓮同學分享了一些常用的資料庫
資料庫1
鏈接:https://www.enigma.com/
稱之為Enigma(恩尼格瑪)的資料庫的搜索引擎,集合了各類政府信息。實用案例:可搜索美國大選某政黨某候選人以及獲得的選舉資金支持。
資料庫2
鏈接:https://data.world/
擁有門類繁多的資料庫,記者可免費使用,操作友好,無需精通編程即可使用。
資料庫3
鏈接:https://offshoreleaks.icij.org
資料庫4
鏈接:https://api.opencorporates.com/
資料庫5
鏈接:https://comtrade.un.org/
以上三個為商業公司相關的資料庫整理收集。實例作品包括有以下鏈接所展示的:https://comtrade.un.org/monthly/Public/ReleaseInfo.aspx(國家間進出口數據)
資料庫6
資料庫7
鏈接:https://www.marinetraffic.com/
以上兩者為全球船隻動態資料庫,可以看到正在運行的船隻航線及船運安排。
資料庫8
鏈接:https://www.flightradar24.com/
航班信息的實時動態檢測。
資料庫9
鏈接:https://www.social-searcher.com/
資料庫10
鏈接:https://stalkscan.com/
一個高級的Facebook內容搜索引擎。以下鏈接即為實例:
http://fb.com/search/str/153080620724/stories-linked/2015/date/stories/intersect/(2015年以來,川普給哪些帖子點過贊)
資料庫11
鏈接:http://www.wipo.int/branddb/en/
國際品牌的資料庫。
資料庫12
鏈接:https://iris.wcoomd.org/
國家海關組織實時的資料庫,可以看到進出口商品的門類以及哪些商品得到了警告。
資料庫13
鏈接:https://www.planet.com/
Planet公司資料庫,擁有自己的衛星,拍攝實時的地球衛星照片,信息更新很快,通過攝影測量等技術手段提取圖片中的信息。對於做災難報道很有幫助。
資料庫14
鏈接:https://www.unodc.org/unodc/en/data-and-analysis/statistics/drug-trafficking.html
聯合國犯罪與毒品交易數的數據,可以用excel導出。
在尋找數據之前,Giannina Segnini教授還建議大家先問三個問題:「我需要什麼,我去哪裡找,這些數據應該是什麼樣的?」,從而使得自己對所需數據有一個完整的印象。
在信息公開無法保障的社會語境下
非洲記者怎樣獲得數據?
靳海蓮同學分享的第二部分內容是,在信息公開無法保障的社會語境下,非洲記者是怎樣獲得數據的。靳海蓮同學結合了來自剛果的記者Nana Boakye先生的分享以及目前我國信息公開法律的現狀認為:「中國和剛果一樣是並沒有信息公開這樣一個法律的。在2007年,中國有了一個信息公開條例,十年後對它進行了修訂,但並沒有以法律的形式確定下來。我自己在實習的時候,也去做過這樣的申請信息公開的嘗試,但是基本上都是杳無音信的。所以我們可以去借鑒非洲記者,看他是用怎樣的方法來獲取數據。」
總體上,Nana先生使用了五種方法來獲取數據:
第一部分是國際性的數據,有三種:大型國際組織基金會聯合國的機構部門世界銀行一類的金融機構。第二部分是政府數據。第三種則是非洲當地公民社會的公開資料庫。
在對政府數據方面,Nana先生認為政府數據實際上分為兩部分,一部分是垂直性的數據,也就是國際性的組織和基金會,另一部分為平行數據,即政府當地的不同部門的數據。同時,Nana先生也提醒道,不要對政府數據抱有太高的期望,因為他們並不會對個人、組織及公民社團有很高的開放程度。Nana先生也推薦了Opencorporates
(https://api.opencorporates.com/)這個網站,我們在上文已提到。
身為記者
你的工具箱里一定不能缺這些
——30個實用工具分享
第二位分享的是史晨瑾同學,史晨瑾同學結合了前《時代周刊》記者,現Tow-Knight新聞創業中心教育總監Jerermy Caplan在NICAR大會的分享及自己的使用體驗,為我們帶來了實用工具的介紹。Jerermy Caplan先生給聽眾推薦了30種必備軟體,從製作信息圖到處理圖片、音頻和視頻,涵蓋了諸多領域。
1.整理錄音
Otranscribe
鏈接:http://otranscribe.com/
一個可以上傳音頻和視頻的網頁,有很多快捷鍵可以使用,例如退出鍵(Esc)可以控制播放暫停,ctrl+J可以插入時間點。在聽取下一段錄音時,會自動播放一小段上一節錄音,可以更準確的定位。
訊飛語記
鏈接:http://www.iyuji.cn/iyuji/home
Otter
鏈接:https://otter.ai/login
以上兩個工具,可以藉助人工智慧提供自動轉錄的錄音機,兩者都能高效地進行錄音轉寫和智能校對。
2.播客/處理音頻
Castro
鏈接:http://supertop.co/castro/
Pocketcasts
以上兩個工具為播客平台,資源廣泛且免費。
Anchor
鏈接:https://anchor.fm/about
支持技術小白製作自己的播客,如果使用手機進行錄製,會讓用戶像打電話一樣錄製音頻,還可以利用手機內置的噪音消除功能使得音頻更清晰,另外,還可以剪輯或組合音頻,添加背景音樂,發布到社交平台。
Soundcite
鏈接:https://soundcite.knightlab.com/
可以為用戶創作的故事添加內聯音頻,如果用戶的稿件發布在網站上,想要給讀者聽一些採訪時錄製的音頻,只需要高亮用戶選中的句子,然後上傳音頻文件即可,不需要打斷讀者的思路。
Amper
鏈接:https://www.ampermusic.com/
一個由人工智慧創作音樂的平台。用戶只要在裡面輸入自己的情緒,明亮、憂鬱或者焦慮,然後指定風格和長度,Amper就能為用戶創作一曲。
3.信息圖/數據新聞製作
鏑數
鏈接:https://www.dydata.io/article
國內數一數二的在線製作數據圖平台,用戶體驗友好,小白上手極快,只需要導入數據就可以生成很漂亮的圖表;具有開源代碼,可以在H5頁面或網頁上顯示,還是可以交互的高清矢量圖。
BDP
鏈接:https://me.bdp.cn/home.html
製作熱力圖很漂亮,但交互功能只能在自家網頁顯示,無法兼容,付費下載的圖表不清晰。
Infogram
鏈接:https://infogram.com/app/#/library
畫風可愛。
Piktochart
鏈接:https://piktochart.com/
數據圖種類多。
Chartistic
鏈接:https://itunes.apple.com/cn/app/charting-app-chartistic/id1127272574?mt=8
可以在蘋果手機上製作。
Tableau
鏈接:https://www.tableau.com/zh-cn
偏經濟類,更為專業。
This by Tinrocket
鏈接: https://itunes.apple.com/us/app/this-by-tinrocket/id1067596534?mt=8
一個可以給圖片加標籤的APP,信息圖中需要指示元素信息時可使用。
Tweetroot
鏈接:http://www.rubbledev.com/app/tweetroot-for-twitter/
是製作詞雲的好工具,用它可以知道推特上人們談論最多的話題是什麼。
Flourish
鏈接:https://flourish.studio/blog/
是更專業的數據新聞網站,裡面也有很多數據新聞報道。
文字圖片視頻數據
處理信息的利器推薦
史晨瑾同學還為我們推薦了多款用於圖片、視頻等信息處理方面的工具,幫助我們的數據新聞在呈現內容的同時還有更高的顏值。
1.圖片處理工具
Waterlogue(水彩)
鏈接:http://www.tinrocket.com/apps/waterlogue/
Goart(油畫)
Teleport(改變細節)
鏈接:https://itunes.apple.com/us/app/teleport-magic-editor/id1261194294?mt=8
以上三款處理照片的軟體,可以把圖片製作成繪畫風格。
Timeline 3D
鏈接:https://www.beedocs.com/timeline3D/mac/
在立體的時間線上展示照片,適合作為家庭影集使用。
2.字體海報
Legend
鏈接:https://itunes.apple.com/us/app/legend-animate-text-in-video-gif/id945320876?mt=8
設計活潑俏皮的字體。
Typorama
鏈接:https://itunes.apple.com/us/app/typorama-text-on-photo-editor/id978659937?mt=8
更具專業感的海報。
Word Swag
鏈接:https://itunes.apple.com/us/app/word-swag-cool-fonts/id645746786?mt=8
擁有大量漂亮模板。
ADOBE SPARK POST
鏈接:https://spark.adobe.com
可製作令人驚艷的海報。
CANVA
鏈接:https://www.canva.com
好用的網站,有免費模板可以用,不論是做Banner圖、海報、各種宣傳照片,還是做PPT,都可以輕鬆駕馭,但中文只有一種字體。
Klex
鏈接:https://klex.io/
一個功能類似CANVA的網站。
3.視頻製作
QUIK
鏈接:https://quik.gopro.com/zh-hans/
ADOBE SPARK VIDEO
鏈接:https://spark.adobe.com/home/
GRAVIE
鏈接: https://itunes.apple.com/us/app/gravie-text-on-video/id722433152?mt=8
以上三個為短視頻製作軟體,它們和VUE差不多,都是通過挑選照片、視頻,嵌入到各種模板里實現的,還可以添加各種文字和圖形。
30款實用工具(a)
30款實用工具(b)
編輯:李曉陽 魏逸豐
版面:李藝佳
TAG:鏑次元數據傳媒實驗室 |