研究方法

研究方法 – 資料提取

《經眼錄》內容都是以表列而且資料較零碎,因此我們只以人手方法去處理它們相關的物件:

  • 名字: 書中著錄的作者及在其欄目中所提及過的人名
  • 標題: 作者欄目中所收錄所有詩文集及其他相關作品
  • 地方: 包括作者籍貫及其他在欄目中出現的相關地方
  • 機構: 於作者欄目出現過的,包括參與過的團體如詩社,他們工作過的機構、學校等

內容頁例子:

為什麼只能利用人手處理資料?

本項目其實主要目的為希望能夠完整地把《經眼錄》的內容處理成可作研究的數據,因此我們把所有作者在欄目中的資料都抽出分類於表格內。我們有嘗試利用非人手方法 (即利用編碼或軟件):

  1. Python: 它無法把《經眼錄》的內容很細緻地表列出來,因此我們在這個步驟放棄使用
  2. CORPRO 庫博: 這是由國立臺灣大學闕河嘉教授開發作中文文本的勘探工具,詞語可抽出表列統計。試驗之後發現它雖然能把人物的名字都表列出來,但我們仍然要花時間把他們去分辨種類

我們在測試過後決定暫時以人手處理書中資料,務求把所有理資料都能夠分類表列出來;雖然這是一個痛苦的過程,但我們希望能夠做到一個完整的資料表,把所有物件及他/它們之間的關係能一一列出,然後當這個表格能夠開放使用時可以對相關研究有所幫助。

在本項目內我們把《經眼錄》的資料作關係網絡空間分佈展示