経済指標の見方・使い方


ホームページによる長期時系列データの提供について
〜富山統計アーカイブス誕生まで〜


富山県企業局経営管理課(前統計調査課所属) 桐 英一郎


はじめに


近年のパソコンやインターネットの普及には目覚しいものがあり、国の各省庁を初めとして、都道府県や市町村などの地方自治体でもインターネットのホームページによる統計情報の提供が盛んに行われるようになっている。

富山県でも、統計調査課のホームページである「とやま統計ワールド」(以下「統計ワールド」という。)で、各種調査結果を公表と同時に掲載している。

その統計ワールドの中で富山県の長期時系列データを幅広く掲載しているのが、「富山統計アーカイブス」である。

アーカイブスには、保存資料や、書庫といった意味があり、「富山統計アーカイブス」(以下、「アーカイブス」という。)では、総目次として「土地及び気象」「人口」など24の大項目があり、そこから小項目が複数掲出され、それぞれからエクセルシートをひらくことができるようになっている。

例えば、総目次の「2.人口」から「2-1人口の推移」をひらくと、明治16年から平成16年までの世帯数、人口等が掲出されている。また、農林水産や土木・建築など各種産業別の統計については、戦後間もなくからの統計が数多く掲載されている。



印刷物によるデータ提供の限界とアーカイブス作成の経緯


これまで統計資料は、主に統計年鑑や県勢要覧といった印刷物により提供されてきた。定期刊行物としての印刷物は、出版時期やページ数が決まっている以上、時点比較や趨勢分析に有用な長期の時系列データを掲載するにはどうしても限界がある。ほとんどの場合、提供される統計データは長い場合でも5年程度で区分されてきた。

しかし、統計資料を分析に役立てようとした場合、単年度の数値だけ取り出してもあまり意味はない。複数時点のデータを比較するかまたは時系列データにより傾向を見るという使われ方が普通であろう。

ところで、統計の普及啓発の仕事を担当していると、外部から「国勢調査の第一回調査からの推移がわからないか」といった問い合わせにしばしば出会うことがある。

こういった要望があるたび統計年鑑や県勢要覧のバックナンバーを引っ張り出し、該当データを必要な年数分コピーしては郵送またはファックスで送るという対応をしていた。しかし、これでは事務の負担が大きいばかりでなく、問い合わせに迅速に対応することも難しい。

そのようなときにいつも電子化された時系列データがあるといいと感じていた。そんな時、愛知県の昭和55年から平成12年までの各種長期時系列データを収録した「愛知県累年統計表」を目にし、富山県版「累年統計表」のようなものを作れないかと考えたのである。



2 長期時系列データの作成と検証


作業に取り掛かかって、まず突き当たった問題は、当然のことではあるが、膨大な量のデータをどうやって効率的に時系列の電子データにするかということだった。

データの元となる統計年鑑自体は初版から全て揃っていたが、最初から電子データがあったのは、当時統計ワールドに掲載されていた統計年鑑の平成9年版から14年版の6年分のみであった。それ以前のものについては印刷物しかなく、古いものはガリ版刷りしかなかった。

まず、統計ワールド立ち上げ時に、その収録用データとして統計年鑑をパンチ入力したエクセルデータがあるということがわかったので、数枚のMOディスクを調べてみると、平成7,8年分のデータを得ることができた。

次に、同僚から昭和56年頃に当時の統計課で作成した「富山統計100年の歩み」という本の存在を教えてもらった。これは、統計年鑑のデータを初版から昭和56年当時まで時系列データとして1冊の本にまとめたもので、幸運なことに、本だけでなく、平成12年頃に別途データをパンチ入力してエクセルに落としたMOディスクも見つけることができたのである。

この時点で、平成7年から平成14年までのデータに加えて明治17年から昭和56年までのデータが揃うこととなった。

さらに、残りの13年分(昭和57年から平成6年まで)については、厚生労働省の緊急雇用創出特別基金事業(平成16年度で終了)の予算枠を使えることになったため、データ入力を委託し、2年間かけてようやく全てのデータを揃えることができたのである。

外部に公表するデータなので読み合わせによる検証を行ったが、ここでもその分量のために時間がかかった。また、読み合わせという作業自体が非常に単調な作業であるため、精神的苦痛と疲労感も大きかった。最終的に統計ワールドにアップロードできたのは平成17年の春頃だったと思う。



3 データ作成の際の問題点、利用にあたっての留意点


長期時系列データを作成する上での問題点として、以下の点が挙げられる。利用にあたってはこのような点について注意されたい。


表頭・表側が途中で変更になる(表1参照)
統計の取り方が大きく変わることなどによりうまく接続できなくなる(表2、3参照)
県民経済計算のように毎年遡及改訂されるものは、単純に表として接続できなくなる
鉱工業生産指数などの指数ものは、ある年度を基準に計算されるため、長期のデータを接続しようとした場合、遡及計算が必要となる
データの欠損、誤り

については、スマートな方法ではなかったが、表の途中から新しい表頭・表側を挿入することとし、表頭の並びを工夫することでできるだけデータの連続性を保つよう心がけた。




表1は、法定届出伝染病及び食中毒患者数の統計表から一部抜粋したものである。この統計表は、統計年鑑のデータを担当課に照会した時に、担当者から法律が変更となり分類基準が新しくなったので、そちらに併せてほしい旨の要望があったものである。なお、この表の場合は、平成11年4月から新しい分類基準が導入されたため、年の途中から表頭を変更するといういびつな形になった。

また、 のように、どうしてもきれいに接続できない場合は、無理につなげるのはあきらめてエクセル上でワークシート単位に分割した。その際、各ワークシートのタブにはいつからいつまでのデータかすぐわかるように年度の数値をいれることにした(表2)。





表3は、結核患者届出数の統計表であるが、都合2回統計の取り方が大きく変わったケースである。この場合、ワークシート上では表2のように分けて掲載している。

については、担当者と相談したところ、無理に時系列にすると逆に利用者の混乱を招くのではないかというアドバイスを受け、県民経済計算については、毎年度公表時に遡及改訂される分のみ(平成15年度分の公表であれば、その年度に遡及改訂を行った平成2年度以降分)を掲載することにした。

についても、担当者がリンク係数(*)を乗じて作成した時系列データがあったため、それを掲載した。

については、欠損部分についてデータの提供先に問い合わせたところ、データが古いためどこにあるかわからない、既に処分済みと言われることが多く、ほとんどの場合データは入手できなかった。そのためやむを得ず「…」(該当数字不詳)とした。


* リンク係数
  基準年を改定したときに旧指数を新指数と連続させるための係数


4 最後に


苦労した甲斐があってか、アーカイブスには、開設から既に一万件を超えるアクセスがあった。

思い返せば、予算を使うことを許可してくれた上司や読み合わせに付き合ってくれた同僚には大変お世話になった。周りの協力がなければこの仕事を最後まで続けることはできなかったと思う。この場を借りて深く感謝したい。

最後になったが、アーカイブスの長期時系列データが利用者の皆さんの各種分析に役立つことを切に願っている。


※この原稿は「統計」(2006年9月号、(財)日本統計協会発行)に掲載された「ホームページによる長期時系列データの提供について」を再構成したものです。



とやま経済月報
平成18年10月号