ニシキヘビってかわいいよね、実際みたことないけど。

無職がいよかん国でプログラミングとかの備忘録を書いてます。 一日一食たまごかけごはん。

愛媛県のオープンデータ整備状況を流し見する

どこで聞いたかは忘れたが、「愛媛県もオープンデータ化を〜」と耳が腫れ上がるくらい言っていた人がいたのを突然思い出した。 その自慢の公開データが如何なものか拝見仕り候。

まずは県レベルでのデータ

愛媛県統計情報データベース

県のホームページからもアクセスできるが、最終的にはリンク先に飛ぶこととなる。

就職に悩んでる無職っぽく、試しに労働関係からデータを頂戴致す。

ダウンロード画面にいざ参らん。

f:id:nyanmao:20171128160903p:plain

Oh......

全部Excelということに悲しみとつらみを感じる。 以前いた会社のExcel日報やExcel/Word-UMLといい、理不尽な理由で一銭も支払われなかった仕事の際頂いた馬鹿みたいな容量のExcelデータといい、 どうしてそれに使ったとしか言いようの無いExcelの乱用を目にするのは......きつい。

画面下部の時代を感じる転送速度におもわずニッコリ。 そういえば、ISDNはサービス終了しますね。なんだかんだあったみたいで後ろだおしになってますが。 IP網への総入れ替えとか関わりたくないですね。デスマが見えてます。

他の統計データもほとんどこんな感じ。 こんなデータを扱うときは、Pythonとxlrdでcsvなりjsonなり、機械に優しいフォーマットにするといいよ。

pypi.python.org

次は県庁所在地である松山のデータ。

県とは別に市町村ごとでも公開しているようで。

https://www.city.matsuyama.ehime.jp/shisei/opendata/top.html

こちらはCSVメインで、Excelと比べれば開発者に優しい。 まあ、実際に統計とかするならば、どちらの形式でも前処理するから手間が違うだけなのだが。 それでもちょっとうれしい。

ただしWordは如何なものか。資料としては便利だけど。

ユニークなものに、タウンミーティングとカテゴライズされたデータがある。 地域別の会議録文字起こしとは面白い。

もうひとつ、写真。機械学習用のデータセットかと思い、少しウキウキして開いたら

f:id:nyanmao:20171128160823p:plain

資料用ですね、はい。

最後に県内2番目の人口規模をもつ今治今治といい松山と言い、今年は愛媛で騒ぎが多かったですね。おらこんな村いやだ......

f:id:nyanmao:20171128162532p:plain

ずらっとExcel

余談ですが、福岡はオープンデータに力いれてっるぽい印象がありますね。 専用ポータルサイトやCKAN使ってるのを見ると尚更ですね。

CKANはちょっと驚き。 特にお硬いSIer(主語が大きい)だと、OSSを使うことに対して信用できないと言ったり手抜きと言ったりする上層部(主語が大きい)がいますからね...... 以前いた会社だけでしょうけど。

だらだらと見て回って「オープンデータってなんだよ」と思い、今一度定義を見なおしてみる。 総務省のページに詳しく書いてありますね。

総務省|オープンデータ戦略の推進|オープンデータとは

その中に、「「オープンデータ」と言えるための条件」という見出しで、2つ定義がありまして、それは

  1. 機械判読に適したデータ形式
  2. 二次利用が可能な利用ルール

そして、1.については下図にかかれている通り詳細な定義がある。 総務省のリンク先ページより引用 f:id:nyanmao:20171128155134j:plain

Excel形式が3段階じゃないですね。よかった。

総務省今治のオープンデータに関する概説に、 「「オープンデータ」の推進により市政の透明性・信頼性の向上、市民参加・官民協働の推進、経済の活性化・行政の効率化」 とあるように、一般に公開することが主で、RやPython等で統計処理したりする人に対する2次利用のしやすさは余り意識されてないのかなと思ったのが感想でござる。 まあ、軽く統計処理するだけならExcelで片付きますものね。