http://www.asahi.com/politics/update/0526/TKY200805260324.htmlなんてニュースを聞くと、やっぱり国会も、自転車置き場の論議が大好きなんだなと思えたりする。まあこういうことに関わる人にとっては「どういう性能のペンキを塗るかも考えないうちから色の相談するなよ」みたいな気分になるのだけど、例え話はこのくらいにして。
この間とうとうキムタクが総理大臣になった「CHANGE」でも、阿部寛やら石黒賢に「反論するなら感覚だけでなくてデータを用意しろ」って突っ込まれてたので、やはりここはデータを用意した方がいいと思うんだ。
とりあえず結論。
- 世界193か国のうち、夏時間を採用しているのは61か国に過ぎない。
- 日本を含む低〜中緯度地域に首都を持つ137か国のうち、夏時間を採用しているのは17か国に過ぎない。
夏時間反対派に都合のいい「結論の書き方」はしていますが、調査方法、および生データはかなり中立です。以下のとおり。
いちおう、データはあった。
ファイル:DaylightSaving-World-Subdivisions.png - Wikipedia。これは夏時間こと、Daylight Saving Timeを実施している国と、実施していない国を色分けした図だ。一見すると低緯度地帯で実施していない国が多いような印象はある。ただ世界地図というのは、適切な図法を使っても比較出来たり出来なかったりするもので、特に面積とか形状とかそういうものは印象に残る割にアテにならないことも多い。
このページに記載されている参考文献からたどれるリンクの中に、http://home.tiscali.nl/~t876506/TZworld.htmlというページがあって、ここにほぼ全ての国・地域で行われているサマータイムの一覧がある。これを使えばサマータイムの行われている国・地域の数がわかるはずだ。
どこを、国として認めるか。
この一覧にはいわゆる「国」もあれば、海外領土、海外県、海外準県、植民地、信託統治領、それに南極の各基地等の「地域」も含まれる。どれを国として数えるのか、というのは意外と面倒だ。
wikipediaの事実上独立した地域一覧 - Wikipediaや、国際連合 - Wikipediaとか日本が承認していない国一覧 - Wikipediaを見ながら、以下のように決めた。
- バチカン市国とサンマリノはイタリアに含めた。これらを別カウントとするなら、イタリアと同等のデータを付け加えることになる。
- 台湾は国として扱った。
- 西サハラ、パレスチナ、クック諸島、ニウエは国として扱うことにした。
- マルタ騎士団は国として扱っていない。
- その他、海外県や植民地、信託統治領などは全て考慮から外した。
これらは、元の夏時間データに地域の記載がある、ということをまず前提としている。扱いを変えた方がいいのでは、という異論は認めるが、その際の修正作業および公開は各自でやること。
国を代表する時間帯と場所はどうするか。
さて、国の中でも、東西に長いために複数の時間帯があるところや、地域によって夏時間を採用していない国がある。*1これをどう比較するか、ということだけど、
- ロシア
- カナダ
- アメリカ合衆国
- ブラジル
- オーストラリア
あたりの国を参考にして、首都の時間帯、首都の緯度をその国の代表とすることにした。特定の首都が決められていない場合は人口の多い都市、もしくはTimezoneの名前にある都市に決めた。ちなみにこれら参考にした国、どこも首都のある地域は夏時間を採用していて、さらにロシア以外の国には夏時間を採用していない地域がそれなりにあることを付記しておく。
緯度はどうやって調べる?
この辺の作業は自動化したかったし、8割方の作業はWeb::ScraperとかLWP::Simpleと正規表現の組み合わせとかで自動化したのだけど、元の夏時間データが構造化されていなかったり表にidが振られていなかったりで、結局かなり手動作業が増えた。(この辺のデータおよびスクリプトは後ろの方に。)
具体的には、国名と時間帯データをtsv化して、http://en.wikipedia.org/wiki/(国名)として英語版wikipediaのデータを出来るだけ参照。ここにある位置データが基本的に首都のもののみであるとみなして、http://tools.wikimedia.de/~magnus/get/gethack.phpに問い合わせに行っている部分を取得、この中に入っている緯度経度を首都のものとした。
これで取れるのが全体の7割程度。国名が曖昧回避のページだったり、位置データがなかったり、というものに対して手動でwikipediaにアクセスして残りのデータも補完した。*2
そして、成形。
緯度データが度分秒形式だったり十進形式だったり統一性がないのが扱いにくいので、全て度分形式で統一した。秒は切り捨て。元データには南緯西経をマイナス表記しているものもあったのだけど、国として扱った今回のデータには幸い含まれていなかった。あとは緯度と経度を分離したり。
この「各国の首都における夏時間一覧」が、tsvで成形した夏時間データ。左から順に
- wikipediaでhttp://en.wikipedia.org/wiki/をつけたらその国の項目が出てくる表記
- 地域名。元の夏時間データの'District'にあるものとだいたい同じ。
- Timezone名(日本なら、Asia/Tokyoとかそういうやつ)
- 採用している夏時間形式。詳細は元の夏時間データを参照する。採用していない国のこの欄は、元の夏時間データでは-になっているが、こちらのデータでは(no dst)とした。
- 緯度(度_分 n|s)
- 経度(度_分 e|w)
作業用の中間データおよびスクリプト
まず、以下がデータ*3
- 元のページから抜き出したTimezone一覧(表をTab区切りにしたもの)
- 各timezoneの含まれる国を入れたTimezone一覧(all_dstなんて名前に反して、アメリカとか中南米とかが抜けてるのが後でわかった)
- all_dstを元に、Wikipediaから手に入れた首都の位置と思わしき緯度経度を追加したデータ(最初の行がwikipediaのエントリ。次の行がDiscrict,Timezone,DST,緯度経度)
- 前項のデータで取れなかったURLを改めてチェックして、手動で各データを補完したデータ(まだ地域名の抜けとか重複とかはチェックしていない)
- 国でない地域を削除し、および一国複数のTimezoneを代表1つにまとめて、抜けてた地域を今さら補完したデータ
- その、削除したデータ
- 解析しやすいように1国1行、その他データを成形した最終データ
最終データは、Excelでソートしやすいように、緯度経度のデータで1桁のところは0フィルで2桁になるよう若干修正しました。
これらデータに関するライセンスはGDFLで。*4
それから、以下がスクリプト(やっつけで作ってるのでスクリプト名称も含めて汚いんですが、再利用の予定もないのでそのまま)
- 国名と時間帯を絡めるスクリプト
- とりあえず時間帯だけもらってくるスクリプト
- wikipediaで指定した国のページから、首都の緯度経度をもらうスクリプト
- 緯度経度情報とか国名とかを1行にまとめるスクリプト
スクリプトのライセンスはとりあえず(CC3.0:BY)にしておきます。CCのなかでこれが一番緩いんだよね?
その他、これらデータからわかること。
とりあえず「日本より緯度の高い国、緯度の低い国では夏時間はどうなっているのだろうか」という結論だけ出したが、うまいことデータを使えば、
- 夏時間を使っている人口と使っていない人口はどのくらい違うのか*5。
- 10度区切りの緯度別に国の分布、および夏時間採用の分布。→これはやってみた(後述)
- あなたの住んでいる町の緯度で他国と比べるとどんな感じになるか。
- 日本人の海外渡航先別旅行者数で比べると、夏時間のある国ない国どちらに多く行っているのか*6。
なんてことは調べられると思う。
試しに、緯度ごとにデータを区切って見るとこんな感じ。
首都の緯度 | 国数 | 採用 | 非採用 | 備考 |
10度未満 | 45 | 00 | 45 | 赤道直下 |
10〜20度 | 49 | 02 | 47 | 回帰線内 |
20〜30度 | 34 | 12 | 22 | 回帰線は23度近辺 |
30〜40度 | 30 | 18 | 12 | 東京は北緯35度41分 |
40〜50度 | 24 | 20 | 04 | EU諸国の多くはこのあたりに入る |
50〜60度 | 17 | 16 | 01 | 英国、ドイツ、北欧など |
60度以上 | 02 | 01 | 01 | フィンランドとアイスランド |
日本の地域はだいたい30〜50度の間に入るので、ここをさらに5度区切りで見ると
30〜35度 | 14 | 09 | 05 | 鹿児島市が北緯31度36分 |
35〜40度 | 16 | 09 | 07 | 盛岡市が北緯39度41分 |
40〜45度 | 14 | 11 | 03 | 青森市が北緯40度49分,札幌市が北緯43度4分 |
45〜50度 | 10 | 09 | 01 | 稚内市が北緯45度25分 |
といった感じになる。
どちらが多いか、といわれるとサマータイム採用国の方が多いのだけど「だいたいどこの国もやっている」とまでは言えないような感じ。
*1:逆に中国やインドなんかはあれだけ大きいのに時間帯は1つだったりするんだけど。
*2:さらに、この後国として扱わない地域、および首都以外の夏時間データを削除、この時点でアメリカやら中南米の国の一部が、データが非構造化なせいで取れていなかったことが判明して、その辺の対応をしている
*3:中間データで不備なものもあるので取り扱いには注意
*4:というか、本当に著作権が主張出来るものかどうかは怪しいですが、怪しいと思うかたはその旨主張した上で自己責任でどうぞ
*5:インドと中国が夏時間を使っていない以上、圧倒的に使っていない方が多いはずだけど
*6:北アメリカとヨーロッパを合わせた人数がアジアと同程度、かつハワイとかグアムサイパンとか考慮するとかなり拮抗しているんじゃないかと思う