數據新聞只是新聞報道中的一種形式,彌補傳統新聞或敘事性新聞無法呈現的效果。數據新聞采用可視化的方法將單調的數據用一種直觀、便于理解和更具說服力的方法呈獻給讀者。數據,特別是大量的數據比采訪幾十個對象獲取的抽樣信息做出的結論更客觀、更容易闡明觀點。從數據新聞制作的人才需求開始介紹,闡明技術要求和制作流程。
人才需求
數據新聞團隊一般包含四種角色:記者和編輯、數據分析師、美術設計師和程序設計師。根據數據新聞項目工作量的大小,一個團隊可能有2~3個人,也可能更多。很多時候一個人需要分飾兩個或多個角色,如一個人既是數據分析師,也是程序設計師,或者一個記者,同時也是數據分析師。記者和編輯的主要工作是采訪、寫稿、編稿,以及整理相關資源,如與新聞相關的背景資料、圖片、視頻、音頻和文字等。數據分析師的主要工作是收集和分析數據。
美術設計師的主要工作是設計圖案,包括手繪圖案、3D制作、圖片設計和排版等。使用的主要工具是Photoshop和Illustrator等。程序設計師的主要工作是編寫代碼,實現數據獲取和分析、數據可視化等。常見的編程工具有HTML、Python、R、SQL和D3.js等。實際上,除了數據新聞團隊四個主要角色的工作外,還有視頻剪輯、音頻剪輯等輔助工作需要完成。
技術需要
1.數據新聞制作入門級工具
圖片、音頻和視頻編輯工具。 數據新聞中往往包含多媒體信息,對新聞圖片處理的常用操作包括裁剪照片;加光和減光,即將照片的局部加黑或增亮;修掉照片上由于洗印、掃描、打印而產生的污點;改變照片的反差;對照片的局部進行漂白、清除刮花痕跡等。圖片編輯最常用的工具是Photoshop。對新聞音頻的常用操作包括修改采樣率、增強與減弱音量、制作淡入和淡出效果、降噪、錄音、從視頻中提取音頻素材、聲音特效、聲音合成和導出等。音頻編輯最常用的工具是audacity和Audition,前者免費而且更容易上手。新聞視頻的常用操作包括素材的采集與導入、編輯素材、制作簡單特效、添加字幕、混合音頻、輸出與生成等。視頻編輯最常用的工具是Premiere和Final Cut Pro。
數據分析工具Excel。Excel是所有數據新聞工作者必須掌握的一個入門級數據分析工具。它用于對數據做簡單的清理,如使用函數、分類匯總清理重復記錄(案例參見本書3.6.1小節“查找重復記錄”) ,使用函數刪除多余空格、轉換數據類型等,使用分類匯總、排序、數據透視表等完成初步數據分析。
可視化工具Tableau。Tableau是一個數據發現、數據分析和數據敘事的數據可視化平臺,是數據新聞工作者的入門可視化工具。Tableau將數據運算與美觀的圖表完美地結合在一起。它方便地實現了數據連接,無需編程就可以創建地圖、條形圖、散點圖和其他圖形,還可以制作數據地圖等。
可視化工具Datawrapper。Datawrapper是一個在線工具,它可以幫助用戶創建交互式數據可視化。這是一個開源工具,能在幾分鐘內創建可嵌入的圖標。因為它是開源的,任何人都可以貢獻代碼,軟件會不斷改進。它還包含一個非常棒的圖表庫,可以查看其他人使用Datawrapper完成的作品。
2.數據新聞制作高級工具
爬蟲編寫工具Python。Python是一種面向對象、語法簡潔、大小寫敏感的解釋型計算機程序設計語言。它完全免費,簡單易學。如果完成同一個任務,假設用C語言要編寫1000行代碼,用Java可能只需要編寫100行,而用Python可能只需要編寫20行。讀者可以到官方網站1下載程序并安裝,有很多文檔資源也可以在官方網站上找到。制作數據新聞時經常使用Python語言編寫爬蟲程序,從其他網站抓取數據。
數據分析工具SPSS。SPSS(Statistical Product and Service Solutions)是世界上最早的統計分析軟件之一,它是一個專業級的統計分析、數據挖掘、預測分析和決策支持任務的軟件產品。數據新聞制作中經常使用SPSS實現專業級統計分析和統計圖標。有時候獲取的數據存在亂碼,導入SPSS中再導出即可完美解決該問題。例如,本書2.5.4小節“結構化信息表格化”中使用import.io下載抓取CSV的文件有亂碼,就可以用上述方法解決。
數據分析工具R語言。R語言是用于統計分析、繪圖的語言和操作環境。R語言屬于GNU系統,是完全免費而且源代碼開放的軟件,數據新聞制作時經常使用R語言進行統計計算、數據分析和統計制圖。
數據可視化工具D3.js。JavaScript是一種直譯式腳本語言,而D3.js是一個JavaScript庫,可以通過數據來操作文檔。D3.js通過使用HTML、SVG和CSS把數據鮮活、形象地展現出來。D3.js嚴格遵循Web標準,所以其開發的程序兼容主流瀏覽器。數據新聞制作時經常使用D3.js編寫代碼,實現在網絡上呈現數據的可視化效果,如使用D3.js制作動態圖表和漂亮的動態網頁地圖等。學習D3.js對非IT人士的確是個挑戰,但ECharts2完美地解決了這個問題。ECharts開源來自百度商業前端數據可視化團隊,基于HTML5 Canvas,是一個純JavaScript圖表庫,提供直觀、生動、可交互、可個性化定制的數據可視化圖表。
制作流程
傳統新聞制作中更多地體現了記者和編輯、數據分析師、美術設計師和程序設計師的上下游關系,常見的制作流程是:記者首先采訪寫稿,然后編輯編稿,美術設計師排版配圖,最后程序設計師將作品發布到網站上。整個制作過程中美術設計師和程序設計師的參與感相對較差,沒有參與開始的選題階段的工作,導致對作品的了解不是非常全面,理解不到位,從某種角度上來說,可能影響了作品的最后呈現效果。
目前各大媒體也都致力于組建自己的數字新聞團隊。每個團隊制作數據新聞的具體流程也各有不同,但基本流程是一致的。
在數據新聞制作中,記者和編輯、數據分析師、美術設計師和程序設計師從選題階段開始就組成了一個團隊, 共同從各自的專長探討一個新聞點是否適合做數據新聞、 時間或經濟成本是否可行。
記者和編輯重點考慮新聞價值。數據分析師重點考慮數據是否可以獲取;采用何種工具爬取數據,用Python還是import.io;數據分析采用何種工具;數據分析的時間成本等。美術設計師重點考慮如何手繪圖稿及如何排版等。程序設計師重點考慮如何可視化呈現。這種反復的討論,使團隊中的全體成員參與感強,有成就感。
大多數情況下,數據新聞制作時采用“項目”的方式,即一個數據新聞制作團隊包含多個項目組,并不是每位成員專屬于某一個項目組。很多時候,多個數據新聞項目同時工作,很可能一位成員既屬于A項目組,又屬于B項目組。目前,我國的數據新聞制作團隊往往不會包含太多的成員,以財新數據可視化實驗室1為例,團隊成員不足20人。數據新聞在近幾年成為行業的研究熱點,單個記者通過再學習,掌握相應的技能后,也可以成為個人數據新聞團隊,即通過個人力量收集數據、分析整理數據,可視化呈現,完成數據新聞作品。但從時間成本考慮,多人組成的團隊在數據新聞制作中更有競爭力。
數據新聞團隊中的四種角色都非常重要,缺一不可。例如,數據新聞的選題也不一定都是記者和編輯提出的,有時候數據分析師在對感興趣的數據進行分析時,也會發現值得做的新聞點。數據新聞的選題也不一定均出自團隊內部,有時候是根據其他記者和編輯提出的外包要求,通過已有的資料實現數據可視化。
數據的獲取可能來自于記者和編輯,特別是條線記者,也可能來源于程序設計師編寫的代碼,如用Python編寫的爬蟲程序,還可能來自于數據分析師的經驗(數據分析師更容易了解數據獲取的網站) ,團隊里的每個角色都可能從不同的平臺、角度獲取到合適的數據。
數據分析工作也不一定完全由數據分析師完成,程序設計師、記者和編輯也可能會幫忙。
美術設計工作需要有一定的美學基礎,其工作具有一定的特殊性,但記者和編輯更容易從受眾的角度給出中肯的設計建議。數據分析師也可以從數據量的角度提出一些設計要求,如圖片顯示大小等。
數據新聞制作團隊的合作精神是非常重要的,現在也提倡在團隊中一人分飾多個角色,降低溝通成本。
(本文節選于《數據新聞實戰》)