運用開放資料與大數據 啟動高值化新創事業
環顧全球各國,若針對政府開放資料指標之評比,台灣已被英國開放資料基金會評定為第一名,此乃不爭的事實。
細究台灣之所以擊退地主國英國而奪得冠軍,最主要的關鍵,乃是能夠在Global Open Data Index評比的13項指標中,拿下了多達9個第一,分別是「國家統計」、「地理圖資」、「立法規範」、「公司登記」、「政府預算」、「汙染物排放」、「採購招標」、「選舉結果」與「水質」;至於其他4項指標,台灣則在「天氣」名列第7,在「政府支出」排名第8,在「郵遞區號」排名49,在「土地所有權」名列第53位。
而形成前述各項評比的分數,則取決於9項開放程度權重公式;換言之,舉凡資料的存在與否、資料可否被公開取得、資料是否上網、資料格式是否支援機器讀取,乃至於資料是否有公開授權等等重要項目,都是台灣政府賴以爭取高分的關鍵。
聽聞此訊息,相信不少民眾與業者備感驚訝,因為他們過去不見得關注政府究竟開放了哪些資料,也錯失了善用開放資料、創造加值效益的良機。然而正所謂亡羊補牢、為時未晚,此刻仍是端詳與釐清政府資料開放內容的好時機。
政府資料開放平臺 公開近1.5萬筆資料集
截至2016年2月1日為止,經由「政府資料開放平臺」(data.gov.tw)顯示,迄今開放的資料集總數達到14,252,其中「原始資料」以11,404筆位居絕對大宗,接著依序是「系統介接程式」(346筆)、「行動化應用軟體」(9筆),以及「其他」(2,873筆);上述9筆行動化應用軟體,含括了「環境即時通」、「學名書寫形式校對工具」、「2016年度醫療藥品基金附屬單位預算案」、「宜蘭縣人工空氣品質監測站基本資料」、「法務部全球資訊網_組織架構-法制司」...等等項目。
依據主題分類,以「政府統計」佔2,380筆為最多,「政府支出」、「政府預算」各以千餘筆分居亞、季軍,其餘不管是「生活品質」、「觀光旅遊」、「藝文活動」、「生活地圖」或「防救災」等項目,內含資料集筆數都尚未超過300。按服務分類,目前由「公共資訊」(9,809筆)呈現遙遙領先態勢,「生活及安全品質」(1,166筆)、「投資理財」(1,156筆)則分居二、三位。
觀察這些開放資料的貢獻者,若以中央部會而論,法務部以開放1,797筆資料集居冠,其餘已經建立逾千筆開放資料實績的單位,尚包括財政部(1,472)、經濟部(1,341)與金管會(1,033);若以地方政府來看,則由台北市挾1,790筆成績領先群雄,但其餘縣市皆未突破500筆,形成頗為巨大的落差。
不動產買賣實價登錄 為最受歡迎的Open Data
如果以瀏覽次數多寡,據以排序熱門資料集,則由「不動產買賣實價登錄批次資料」以90,030次瀏覽拔得頭籌,「勞工體格及健康檢查認可醫療機構」以71,043次居次,其餘熱門項目還包括了「原鄉旅遊路線」(54,017次)、「CNS11643中文標準交換碼全字庫(簡稱全字庫)」(50,906次)、「iTaiwan中央行政機關室內公共區域免費無線上網熱點查詢服務」(44,660次)、「行政院所屬中央及地方機關代碼」(43,644次)、「中央氣象局雨量站觀測資料」(36,856次)、「鐵路時刻表」(35,643次)、「鄉鎮市區界線(TWD97經緯度)」(31,172次),以及「易發生婦幼被害犯罪地點」(30,685次)。
前述十大熱門資料集當中,被下載次數最多者,仍為「不動產買賣實價登錄批次資料」,高達27,249次,緊追在後的則是「中央氣象局雨量站觀測資料」,下載次數為26,196。值得一提的,在瀏覽次數排名未躋身前十大的若干資料集,其實也不乏被頻繁下載者,例如「空氣品質即時污染指標」達到24,412次之多,此與近一年多來細懸浮微粒(PM2.5)指標明顯飆升,多次達到「不良」的紫爆等級之現象,理當息息相關,此外「縣市鄉鎮中英對照檔」也被累積下載達26,183次。
然而就下載次數而論,還有一項資料集,比起上列4項資料集更加熱門,即是由行政院原委會提供的「全國環境輻射偵測」,下載次數為39,973,直逼4萬大關。
在政府資料開放平臺中,也提供「活化應用展示」區域,象徵經由這些開放資料所孕育而成的後續應用,其間不乏民間業者的創意巧思,頗值得其他既有企業或新創公司加以借鏡。
譬如恆鼎科技,透過蒐集各大社群網站並結合政府所公布Open Data資料,藉由自行研發的智慧評價情緒分析技術,將資料進行處理與分析,進而打造出「藥妝品大數據與社群知識全都露平臺」,好讓消費者藉此獲取所有社群媒體口碑統計分析彙總資料,亦得知藥粧品廣告是否不實、含有那些藥品成分、是否有GMP、廠商揭露資料是否屬實等重要資訊,進一步作為採購依據。
此外,由名為michael80321的創作者悉心建立的「開放資料也可以飽肚子」,則以行政院農委會公開資料平台上的美食資料為基底,再結合地理資訊,幫助使用者輕鬆吃遍台灣大大小小的農產美食。由Mark App design所創作的「台灣登革熱疫情速報」,善用衛生福利部疾病管制署近期開放的「登革熱近12個月每日確定病例統計」資料集,協助民眾快速了解各地區疫情病例數,更可透過顏色及地圖的結合,深入理解該地區疫情情況。
由亞東紀念醫院推出的「Health健康+雲端醫療服務」,係運用國民健康署健康量表及衛教文章,並結合醫院及社區之資源,成功從遠距照護概念擴大涵蓋提供健康管理服務,讓民眾可透過App獲得相關健康資訊,輕鬆進行自我健康管理。由npes87184創作的「台灣環境通」App,則結合經濟部水利署的「台灣地區主要水庫蓄水量報告系統」、行政院原子能委員會的「全國環境輻射偵測」資料集、行政院環境環保署的「空氣品質」及「紫外線即時監測資料」等資料集,幫助民眾輕鬆掌握各地區的輻射、紫外線與空氣品質等多項資訊。
妙用地理圖資 繁衍新興商業模式
反觀國外,利用開放資料、結合大數據分析,終至實現創業的例子,更可謂多不勝數,箇中相關案例,相當值得國人加以參酌仿傚。單單以GPS與地理位置資料為例,連帶衍生的成功應用案例已經不少,譬如赫赫有名的谷歌(Google),即運用GPS資料集與政府開放資料,先後產出多項應用程式,包括已為人熟知的Google Maps、Google Earth,比較有趣的是,Google也將這些應用程式轉化為開放資料來源,而迄今累計有超過100萬個應用程式與網站,都已採用Google Maps開放資料。
同樣讓消費者備感熟悉的Uber即時叫車服務,也算是開放資料應用的好例子,其透過開放資料發現犯罪率與叫車需求之間的關聯性,藉以改善行進路線規劃,增進顧客滿意度,同時研發出App叫車的全新商業模式。
以供應社交導航App聞名的Waze,早在2014年期間便決定啟動Connected Citzens計畫,旨在與多個政府機關建立合作關係,藉此獲取這些單位所擁有的道路建設、道路偵測器,以及道路封閉計畫等資訊,而Waze則以提供匿名的即時群眾交通資訊作為交換代價。
成立於2009年的Foursquare,其主要服務可讓使用者登入打卡與提供城市指南,分享附近好店家、好去處等資訊,因而廣受消費者青睞,其賴以支撐事業推展的基礎,有很大一塊,也源自於OpenStreetMap與MapBox等開放式地理圖資。