淺談道安資料分析工作

道安工作有一個系統存在,全名是道路交通安全資料整合與分析平台,原本我被賦予的任務是看看這個系統產出的報表能否進一步分析,取得報表資料時我詢問是否有完整原始資料,這才知道系統是由交通部所建置,我們只能夠透過帳號登入系統查詢報表。進入系統操作後發現,其實資料庫內容還蠻完整的,包含了 2008-2019 的交通事故資料(A1, A2),看起來已經初步去識別化,可惜並沒有開放資料。

當然,跟一般人不一樣的地方是我並不會停在這裡,所以開始寫一些程式模擬登入後的操作過程,試著下載資料;程式不難寫,只是資料量比較多,所以斷斷續續執行了很多天才把資料下載完,台南的資料有 251222 筆,這樣一來我就可以不用被原有系統設計所侷限,進行更多元的分析。

初步統計,這份資料有 234732 筆(約 93%)帶有地理座標點位,一次全部放在地圖中應該很難看出什麼,所以進一步的把這些點位資料用最小統計區進行歸納,縮小成 12774 組資料,然後進一步依據 A1, A2 與年份進行計算,把這些數字放進地圖中一併呈現,讓資料可以有一個大概的呈現輪廓。

接著我應該一樣會透過程式處理,去找出年度之間資料不連續的區域、事故數量呈現成長趨勢的區域以及結合一些其他資料去深入個別區域的交通事故成因,希望對於道安工作可以有些幫助。從道安系統看到的資料已經整理的相當詳細,比較可惜的也許是並未收錄包含 A3 類型等事故資料,但已經能夠客觀的看出需要改善的優先順序,希望經驗的累積可以持續減少交通事故的發生。

當然,作為一個公民也會希望這些能夠成為開放資料,讓在地的民眾可以關心自己生活周遭的事故情況,進一步找到更適合在地的改變方向。

評論