重回天人之際:反思新時期古代文論研究方式的轉換

三、數據可視化方法的簡介

字體:16+-

上文中介紹的文本分析的方法主要用於搜集和分析數據,而社會網絡分析的工具主要是運用在對關係型數據的分析中。對研究者而言,除了搜集、分析數據之外,另外一件很重要的工作就是用通俗易懂的方法將研究成果展示給讀者。除了需要給讀者展示研究成果之外,如果使用了恰當的方法將數據進行可視化的處理,還便於研究者自己對原始數據有一個感性化的認識,從而更容易發現新的現象和規律。因此,數據的可視化是大數據的工具包中很重要的一個元素。廣義來說,數據可視化的方法就是用一些便於人們接受的簡單“信號”來展示和提煉數據中關鍵信息的辦法。這裏的“信號”可以是一些具體的數字,也可以是顏色、長短、麵積大小等。

無論是人文學科還是社會科學,使用數據可視化的方法是新的發展趨勢之一。尤其是在數字人文相關的研究中,數據可視化方法可以幫助優化數據結構的展示,使得相關的信息更加直觀。恰當地使用數據可視化方法,可以使得數據和研究展示更加直觀,更容易讓受眾接受,不僅幫助了讀者,有時也能幫助研究者本身加深對現象的理解,提供更多元化的視角。“此外,大數據可視化分析與傳統統計分析的區別在於它的動態性,其數據容量、內容及更先進的處理方法都使得動態可視化分析成為可能。目前不少軟件可用於可視化分析,海杜普(Hadoop)即是一個比較成熟的可視化軟件,能夠對大量數據進行即時處理,淘寶、百度等大型商業網站就利用海杜普來完成每天數以億計的訪問量數據存儲、查詢統計以及用戶行為分析等。美國環境係統研究所(Environmental Systems Research Institute,ESRI)在開源網站基哈伯(Git Hub)上共享了‘海杜普地理信息係統工具’(GIS Tools for Hadoop),用戶可以利用其對上億條空間數據記錄進行過濾和聚合操作,在報告中嵌入大數據地圖進行發布。”[30]