大數據是當下最火爆的話題之一。隨之而來的,是數據可視化技術的持續發展,它用來展現和闡釋大規模的數據。但是數據可視化技術并非千篇一律。
數據可視化是展現數據的最強大機制之一,技術上的優勢也為其創造了獨特的實現方法。隨著交互式的、獨特的數據可視化方法逐漸走向最前沿,并且觀眾也越來越明白他們自己的喜好和厭惡,那些繪制簡單餅狀圖的日子將一去不復返。
接下去我們將向你介紹數據可視化的重要性,不同的數據展現方式以及業界常用的工具。你也將會了解贏得數據可視化技巧背后的核心理念和你需要避免的錯誤。
從本文中你將會學到:1、數據可視化是什么;2、數據可視化為什么重要;3、存在哪些數據可視化方法;4、贏得數據可視化背后的關鍵理念;5、完成數據可視化時需要避免的深坑。
數據可視化是什么?
數據可視化是研究如何將數據以圖片或圖形的方式展現的科學。它主要專注于展現,以連貫和簡短的形式把大量的信息展現出來。盡管數據可視化也能處理書面信息,它的重點還是用圖片和圖像的形式向觀眾傳遞信息。
此外,數據可視化技術在數據的用法上并不狹窄。它可以可視化各種信息——你可以向其它人傳遞你的理念和假設。如今甚至可以對數據可視化添加技術和選擇交互式的可視化方法。
信息的視覺表達是一種古老的思維和經驗的分享方式。例如,圖表和地圖就是一些早期數據可視化技術的重要例證。
數據可視化為什么重要?
如上所述,人類使用數據可視化技術已經很久了。圖像和圖表已被證明是一種用于交流和學習新信息的有效方法。 研究表明,80%的人能記住他們看到的,但只有20%的人記得怎么讀!它甚至可以將思想和事件向后代延續。技術的發展進一步加強了數據可視化帶給人們的機會。
也許,數據可視化最重要的好處是它能夠幫助人們更快地掌握數據。你可以把一大堆數據濃縮到一張圖表里,人們也能更快地抓住關鍵點。如果用書面形式,可能需要幾小時來分析所有的數據和建立數據的聯系。
此外,這種能展現大量數據的能力是數據可視化的另一個巨大優勢。一張圖表可能會突出顯示多個方面,人們就能對數據形成不同的觀點。這自然能為企業開辟新的商業之路。人們或許能從數據中發現一些意想不到的東西。
數據的可視化提高了解釋信息的能力。要從大量的數據和信息中尋找關聯不容易,但是圖和圖表可以在幾秒鐘內提供信息。一眼就能辨識出所需的信息。
以上所有都能加強人們在工作和學習的溝通和有效性。數據可視化普遍被認為是一種簡單而有效的概括數據的方法,因此它可以提高人們分享信息和學習的方式。
下面的視頻是優雅地展現數據的很好的一個例子:
視頻鏈接:https://youtu.be/kv_uyUTx5Po
數據可視化的各種方法
技術的發展已導致 數據的爆炸。這反過來又增加了數據被展現的方式。通常來說,數據可視化主要分為兩種不同的類型:探索(exploration)和解釋(explanation)。探索類型可以幫助人們發現數據背后的故事,而解釋類型把數據簡單明了地解釋給觀眾。
另外,有 不同的方法可用于創建這2種類型。最常見的數據可視化方法包括:
2D area —— 這種方法使用地理空間數據可視化技術,往往與事件在某塊特定區域的位置相關。2D area 數據可視化的一個例子包括點分布圖,該圖可以顯示某個區域中的犯罪等信息。
Temporal —— 時間可視化是以線性方式展現數據。時間數據可視化的關鍵是有一個開始和一個結束的時間點。時間可視化的例子可以是一個連接的散點圖,它可以展現諸如某一區域的溫度等信息。
Multidimensional —— 您還可以通過多維方法將數據在兩個或多個維度上展現。這是最常用的方法之一。多維可視化的一個例子是餅圖,它可以展示如政府支出之類的信息。
Hierarchical —— 層次法被用于呈現多組數據。這些數據的可視化通常在大群體內嵌套小的群體。層次化數據可視化的例子可以是一個樹圖,它可以展示如語言組團等的信息。
Network —— 數據也能以相互關聯的網絡形式被展現。這是另一種展現大量數據的常見方法。網絡數據可視化方法的一個例子可以是沖積關系圖,它可以展示如醫療行業的變化等信息。
以上給出了大量的選擇,它不僅給我們提供了大量機會,同時也讓我們為選擇正確的方法感到頭疼。
另外還有 很多數據可視化的工具。它們可以很容易地收集數據,也可以流線化數據的使用方式。
一些最常用的工具包括:
Google charts —— 谷歌的產品在數據行業是眾所周知的,谷歌圖表也是一個容易上手的工具,特別是對于初次使用的用戶。
datawrapper—— 這是一個在線工具,它可以幫助你創建交互式數據可視化。
RAW —— RAW的好處包括它擁有大量現成的類型,讓你可以清晰、便捷地展現信息。該平臺是開源的,所以你可以提供自定義布局,或者使用其它的設計。
Infogram—— Infogram是另一款適合新手的工具。它允許用戶創建不同的圖表和Iinfographs,系統的使用也方便。
可用的工具遠不止這些,你還能找到大量免費和付費的軟件。最好多了解一些信息,以確保你所使用的軟件與被可視化的數據最搭配。
贏取數據可視化背后的關鍵概念
見過數據可視化的人都知道設計有好壞之分。如果信息不是以正確的、恰當的方式呈現,則數據可視化的好處就很容易被抵消 —— 具體的項目需要定制的方法。
不管你的信息是什么,在利用數據可視化時有一些概念你需要牢記。以下是贏取數據可視化技術背后的關鍵概念集合。
了解聽眾
在展現數據之前,你需要做的第一件事就是了解誰將會看這些數據。了解你的聽眾是至關重要的,以便用正確的方法來展現數據。
雖然數據可視化通常是一種簡化數據的方法,但觀眾對主題的知識層次千差萬別,需要好好做準備。如果你是針對一群專業的聽眾,那么可以使用更多的專業方法和專業術語來解釋數據。然而,對于相同的數據,普通聽眾可能需要更為通俗的方法來解釋。
同樣,知道聽眾對你的數據有何期望也非常重要。你需要知道他們想要從數據中獲得什么關鍵點,以及你展示數據的主要目的是什么。此外,還需要記住你展現數據的目的是什么。
足夠理解數據
除了掌握目標受眾外,你還需要對數據了如指掌。若是不正確地理解數據,則很有可能不能把信息有效地傳達給聽眾。
然而你也無法顧及數據所包含的所有信息,所以要能夠提取關鍵的信息,并條理清晰地展現它們。你還需要確保從數據中得到的關聯信息是正確而不是虛構的 —— 決不能用錯誤的數據做可視化!
如果你正確地理解了數據及其關聯,則可以從信息中得到獨特而有趣的數據關聯。
講述一個故事
數據可視化還應該描繪出一個故事。你一定不希望這些數據只是以一組信息的方式來展現,而是能傳遞出數據使用背后的信息。這可以是不同的描述性介紹,或是為觀眾呈現一幅特定的圖像。
編造一個故事往往意味著觀眾從數據中獲得更多的洞察力。它可以幫助觀眾了解新的關聯和更深入的信息。
事實上,數據可視化技術是一個出色的講故事工具。“一圖勝千言”這句話一點都不錯,你應該發揮它的這項優勢。通過數據來講故事并不困難,因為你可以把顏色、字體和演示文稿都作為講故事手法的一部分。
為了使數據可視化成功地融入故事,上述提到的理解數據則是至關重要的一點。
保持簡潔
近年來,數據可視化的發展很快,正如上面所示,涌現出很多工具和系統供人們使用。能接觸不同的獨特方法并不意味著都要用到它們。而且,大量的數據也不意味著所有的信息都是必不可少的。
總之,保持你的數據可視化方法簡單明了。不必刻意地使用過多的數據或使用過多的技巧。
如果從講故事的角度來看,必須明白你所展現的每一個元素都是故事必不可少的一部分。如果數據或元素,如某些事物的圖片,對故事的情節無關緊要,那么就不應該把它加入進來。
數據展示中包含太多的元素實際上會破壞最終的成品,與數據脫節。要記住數據可視化的核心之處就是能在一瞬間呈現大量的數據。如果可視化顯得很費勁,那么你就要回頭看看是否使用了錯誤的數據演示或包含了太多的信息。
合理區分展現平臺
最后,贏取數據可視化技術也要了解技術方面。人們現在通過各種不同的平臺查看和訪問信息,這一點必須牢記。就像需要知道目標受眾一樣,你也需要考慮人們查看數據可視化的方式。
你的可視化結果要能輕松適應多種平臺,如移動設備,平板電腦或計算機。如果你的用戶只通過手機瀏覽數據,那么適用于移動端的展現方法自然會對你更有幫助,而不是針對筆記本的方法。
除了考慮平臺的界面選項外,還需要考慮可訪問性(accessibility)問題。如果數據可視化允許視覺欠佳的人進行適當的放大和縮小,可以大大提高用戶體驗。你也可以考慮為色盲人群提供不同顏色選項。 可訪問性旨在提高用戶體驗,確保數據可視化可對所有人適用。
數據可視化需要避免的大錯誤
盡管以上關鍵方法能幫你生成贏取數據可視化的策略,還有一些常見誤區要時刻警惕。
錯誤的信息
如上所述,數據的錯誤是觀眾最厭惡的東西。你必須確保那些正在看你的數據的人獲取到的是正確的數據。確保人們可以直接使用你圖表里的數據,而不必再次確認數據正確性,這是你的職責。
不完整的信息
除了保證信息正確之外,還要呈現完整的數據。人們必須能在其中找到相關信息,不能使用數據可視化來欺騙或展現不完整的信息。
數據可視化能夠而且應該講述一個故事,但故事需要包含完整和正確的信息,而不是只展示你認為合適的數據。
過于簡化數據
盡管要確保數據是以簡單的方式展現,這并不意味著你應該簡化它。首先,你需要記住觀眾是誰 —— 對專業人士不要使用通俗和過于簡化的語言。而如果是普通的觀眾,就不要用專業術語來填充文字。
但除此之外,若是你未能清晰地展現數據,也就不能期望聽眾能清楚地了解它們之間的關系。不能因為對你來說鏈接似乎很明顯了,就省略部分信息 —— 記住觀眾只能看到你所展示的這部分數據,而不是你所使用的完整數據集!
不恰當的可視化
在展現數據時,你需要仔細思考數據展現的方式。如字體,顏色和圖像之類的屬性很總要。例如,如果展示由特定疾病而導致死亡的信息時,使用鮮艷的色彩和令人愉快的圖像似乎不協調。
不適當的可視化也包括使用的技術使得數據難以查看和理解。例如,你可能用泡泡來代表部門內不同的消費水平,但如果泡泡的尺寸差異不合適,會導致誤判和不準確的。
遺漏標注
過度簡化也可能導致缺乏標注。當你提供數據時,很容易假設觀眾已經知道圖像的每一個方面代表什么。但添加簡單的注釋可以提高用戶體驗,并確保觀眾明白數據中的所有數據點。
舉一個例子,你可能用一個圖表來展示企業在過去十年自行車的銷量。如果數據圖表中有一個大的起伏,用注釋解釋一下這個突變背后的原因,能確保觀眾掌握這一額外的信息。
后記
希望上文已經向你解釋了數據可視化重要性的基本內容。許多不同的方法和程序可以幫助你以一種獨特而引人注目的方式展現數據。
需要明白的是,在所有這些酷和古怪方法之下,數據可視化的根本還是立足于數據 —— 你需要找到一種能正確、清楚、簡潔地勾勒信息的方法。當你找到了正確的公式,數據可視化不僅信息豐富,而且變得賞心悅目了。