“鼻血が出た”あの日から早3年、大きく進歩した「日本の住所の正規化」

Geolonia代表の宮内が語る「日本の住所」問題(その2)

SNSで話題になった「日本の住所」問題について、Geolonia代表の宮内が語る第2回は、正しい住所のデータベースである「住所マスタ-」を作るための苦労や、過去から比べて進歩した住所を取り巻く現状について語りました。

第1回:日本の住所は“うまく整備されているほう”!? 大事なのは「地域の多様性」
第2回:“鼻血が出た”あの日から早3年、大きく進歩した「日本の住所の正規化」
第3回:生成AIは「住所の正規化」の救世主になりうるか

自治体や部署ごとバラバラの住所データは突合するのも大変

Geoloniaでは昨年、デジタル庁からの委託で、アドレス・ベース・レジストリのマッチングツールの調査実証業務を行いました。これは自治体が持つ住所マスターを“正”として、デジタル庁が持つアドレス・ベース・レジストリの住所マスターを突合させるという作業なんですが、これは実際にやってみると想像以上に大変でしんどい作業です。

Geolonia代表の宮内隆行

各自治体の住基システムがベンダーによってまったくフォーマットが異なるという問題もあるし、そもそも「住所マスターをどの部署が持っているか」というのは、自治体によって事情が異なります。だから「住所マスターをください」と頼んでも、「どの部署が持っている住所マスターですか?」と逆に質問されてしまうこともあるんです。

住所の区分け方も自治体によってバラバラです。たとえば“小字(こあざ)”ひとつ取っても、政府が考える小字と、自治体が考える小字は実は違っていて、認識が合わないことがあります。このような認識のズレがあるため、国レベルで住所マスターを完全にきちんと整備しようと思うと、まだ先はだいぶ長いと思います。

鼻血が出たあの日から早3年、住所の正規化は大きく進歩

ただし、私が“鼻血が出るほど”大変だった頃に比べると、前進した部分もあります。実はあのブログを公開した頃に、Geoloniaでも全国の住所マスターデータを公開しました。そのときに公開した住所マスターのデータ件数は12万件でしたが、今ではオープンデータの住所マスターは、デジタル庁が公開しているのが2000万件以上、法務省が公開しているのが2億4千万件以上あります。

Geoloniaが公開した住所データ

ほんの数年前まではオープンな住所マスターのデータというのは10万件そこそこしかなかったものが、今はトータルで2億6~7千万件にも増えたのです。とくに、今年1月に法務省が、大量の住所情報を含む「登記所備付地図データ」を公開したのは大きく、「たったこの年数でここまで来たか」という感慨はありますね。もちろん様々な面で課題はあるものの、思ったよりも早く進んでいるという気がしています。

なにしろ2億6~7千万件という数字は、日本の全人口よりも多いわけで、これだけの数が揃ったことによって住所マスターデータの精度は格段に上がりました。ここまで来たら、例えば東京とか政令指定都市などである程度カバーされていれば、実用上はほとんど問題ないレベルになりつつあります。

ただし、住所の整備が進むと、みなさん個人個人が、実際に自分の住所を入れて確かめたがるものなんですね。そこで「うちの住所はカバーできていない、だからダメだ」と言う人は必ず出てくると思います。

99%の完成度から残りの1%を仕上げるというのは、どんなものでもコストはかかります。残っている不具合については、あとはマンパワーで“力業(ちからわざ)”で解決するということになると思います。

URL

アドレス・ベース・レジストリ|デジタル庁
https://www.digital.go.jp/policies/base_registry_address/

Geolonia 住所データ | japanese-addresses
https://geolonia.github.io/japanese-addresses/

関連記事RELATED ARTICLE