HOME 回資訊服務處首頁 Login
2018年第8期
簡訊
本院107年下半年電子郵件社交工程演練預定於8月份進行
107年資訊安全暨個資保護管理教育訓練課程公告(年度最終課程)
107年資訊處推廣訓練課程公告
資安通報
院網「影音服務」近期新增影片
本院圖書館近期開放一項資料庫,請多加使用
資訊應用
政府開放資料邁向金標章的檔案處理及csv轉檔方式介紹
 
資訊應用 >
上一篇 | 返回電子報
 
政府開放資料邁向金標章的檔案處理及csv轉檔方式介紹
 
推廣科:章美蘭

 前陣子我的上司跟我說,可能要接下Open Data的業務,那時我對什麼是Open Data完全不了解,聽都沒聽過,後來上網查詢,不小心點閱到了這部影片,讓我突然很感動(建議您也可以點閱看看),原來,Open Data對社會、對國家、對世界能有這麼多的幫助,原來我們每個人的小小付出,就可以凝聚成全世界的力量,產生更大的應用與回響,而這些資源最終還是回饋到我們民眾身上。從以前就覺得自己像一隻小螞蟻,不知道能貢獻什麼給社會,而看完影片之後,我決定全力投入Open Data,也許我懂得不多,但我願意努力去接觸看看。

 
上圖影片網址:https://youtu.be/nz5Qt5QdxsE?t=53

 下圖可以看到各國對Open Data的重視

 
註:圖片摘錄於ithome,文章連結:https://ithome.com.tw/news/111025

 政府資料開放平台上方的資料集,為了讓民眾取用後能直接應用,因此政府對於上架的資料集做了品質把關,建議所上架的資料盡量符合「金標章」。接下來的文章,就來帶大家了解,該如何讓您的資料集邁向「金標章」的指標囉。

什麼是金標章呢?
當您在政府資料開放平台前台資料集說明中,可以看到檔案格式上方會有標章顯示。

  • 金色:金標章
  • 銀色:銀標章
  • 土黃色:銅標章

 若您提供的內容為表格化資料,以PDF、ODT、WORD、TXT等都是非結構化格式,這樣是無法取得任何標章的,最後資源檢測結果會是「無」標章。資料集內的檔案格式建議使用CSV、ODS、JSON、XML。

各種標章的說明如下圖:

 

 您要如何查看您的資料資源的品質,首先請您先登入政府資料開放平台(後台),登入後台後,點選「資料集」標籤,再點選「資料提供者功能」。

 

 當資料提供者功能展開後,點選「品質檢測」。

 接著,您會看到所有您上架的資料集,點選資料集旁的「檢視」即可查看各構面的檢視結果。

 若要拿到金標章,五個構面的檢測都必須呈現「是」。

  • 連結狀態:連結網址是有效的,不會因為人員的異動而讓網址失效 。
  • 直接下載:須符合點閱後,檔案可直接下載,不會出現預覽視窗 。
  • 結構化格式:
    • 錯誤1.針對內容為表格化資料但目前以PDF、ODT、WORD、TXT等非結構化格式提供者。
    • 錯誤2.server送出時HTTP表頭寫錯型別,content-type為"text/plain",屬非結構化格式。
  • 編碼符合:須符合UTF-8的編碼格式。
  • 主要欄位說明符合:
    • 錯誤1.主要欄位說明與資料內容第一行欄位不符合。
    • 錯誤2.資料集中詮釋資料欄位的「主要欄位說明」未依照「資料集詮釋資料標準規範」之『主要欄位說明』之填寫規則填寫。
    • 錯誤3.資料集中詮釋資料欄位的「主要欄位說明」重覆或為空值。

 以上的錯誤問題該如何解決呢?在政府資料開放平台(前台)/關於平台/常見問題中,都有詳細的說明,您可以參考網址:https://data.gov.tw/faqs?tid=20601


 

 針對結構化格式的部分,若您的資料集是Excel整理而成,則必須先存為CSV檔案格式,再將編碼轉換為UTF-8。

以下為操作步驟教學:
步驟1:在Excel環境中,點選「檔案」索引標籤,再點選「另存新檔」。


存檔類型,選擇CSV(逗號分隔)(*.csv),在按下「儲存」按鈕。

出現下圖確認訊息,請按「是」。

之後,會看到在您指定的存檔位置,有CSV檔案。

步驟2:開啟記事本
在桌面按右鍵,點選「新增」,再點選「文字文件」。

開啟一空白記事本後,將您的CSV檔案拖曳進空白記事本中

 這時,您會看到CSV文字都在空白記事本內呈現,請在記事本環境中,點選「檔案」,「另存新檔」。

在另存新檔視窗下方,編碼選擇「UTF-8」,再按下「存檔」。

編碼處必須是「UTF-8」才按存檔喔!

之後出現是否取代原CSV檔案,請按下「是」即可完成編碼 。

 若您的Excel檔案內,包含簡體字、或是日文字等,只要您轉CSV就會出現?,這時再轉UTF-8也無法解決此問題,因此建議您不要轉CSV,直接在Excel另存為ODS即可。

 雖然我懂得也不算多,但還是希望以上說明能讓您在資料集上架時有些許幫助~

-End-




上一篇 | 返回電子報
 
 本電子報所有文字、圖片版權為中央研究院所有 。 電子報出版系統由中央研究院資訊服務處開發。