日本の住所の課題を識者が語る「うわっ…日本の住所表記、ヤバすぎ?解決策をダラダラ語る会」イベントレポート

河野大臣の発言をきっかけに、ネット上で話題になった「日本の住所」問題は、Twitterを中心に「#日本の住所のヤバさ」「#住所の正規化」というフレーズがトレンド入りするほどの盛り上がりを見せました。

この盛り上がりを受けて、6月9日にオンライン開催された「うわっ…日本の住所表記、ヤバすぎ?解決策をダラダラ語る会」では、住所に関する識者たちが集い、この問題の深層を探り、可能な解決策について語り合いました。

左上からCode for Japan/Georepublicの関治之さん、OSGeo日本支部代表理事の岩崎亘典さん、青山学院大学 地球社会共生学部 教授の古橋大地さん、古橋研究室卒業生の松山蘭さん、データ戦略専門家の平本健二さん、駒澤大学文学部地理学科准教授の瀬戸寿一さん

イベントの冒頭では、関さんが「日本の住所」が話題となった経緯を紹介。河野大臣がテレビ番組出演時に「将来的にAIの技術を使って住所の表記揺れを判断することがあるかもしれない」とした発言に対し、インターネット上では「なぜ表記揺れがそんなに難しいのか」という発言が多数寄せられました。

これに対して、日本の住所の表記揺れがどれほど難しいのかを説明する「とにかく日本の住所のヤバさをもっと知るべきだと思います」というnoteの記事が大きな話題となり、これをきっかけとして日本の住所に関わる人々もその難しさを次々に発言。その流れは登壇者の1人である古橋さんがまとめています。

古橋さんのまとめから抽出したネットの代表的な意見

とにかく日本の住所のヤバさをもっと知るべきだと思います|inuro
https://note.com/inuro/n/n7ec7cf15cf9c

住所の正規化は沼である。 – Togetter
https://togetter.com/li/2161880

石垣のように積み重ねてきた日本の住所情報の動き

この流れを受けて、平本さんは「どのような解決策があるのかを話していきたい」と前置きしながら、日本の住所情報についての10年間の取り組みを説明しました。

2013年に始まった「共通語彙基盤」という住所データの標準化プロジェクトは、2016年まで様々なバージョンを経て改良を重ねてきました。

2016年には、日本のIT戦略の中に「住所の構造化」が重要と認識され、その後には法人番号の制度によって企業名と住所の一致を確認する必要が生じ、住所クレンジング(データクリーニング)が必要となりました。

2017年には「行政データ連携標準α」という新たなガイドラインが発表され、住所の表現方法が、2019年にはこの正式版が発表され、漢字と読み仮名、ローマ字での住所表現方法を含むガイドラインが定められました。また、各市町村が公開するオープンデータを利用して住所のデータベースを作成することが提案され、この方針が採用されました。

2022年には不動産IDの仕様ができ、さらに同年4月には「アドレス・ベース・レジストリ」が作られ、町字レベルの住所一覧を作成しました。

このように石垣を一つ一つ積んできて、各省庁を説得しながらここまで持ってきたのが

この10年間の日本の住所情報についての動きです。

日本の住所情報の取り組み

「アドレス・ベース・レジストリ」というのは、住所・所在地のマスターデータ及びその運用システム全体を指します。

アドレス・ベース・レジストリの概要

何故「住所」ではなく「アドレス」という言葉を用いるのかというと、「住所」の語には具体的な住居を指す意味合いが強く、汎用性に欠けるとの意見があるため「アドレス」を用いたそうです。現在は、地名の読みやローマ字表記をデータベースに登録できるようにするなど、住所データの更なる標準化が進められています。

特異性から国内外からも注目を浴びている日本の住所

瀬戸さんは、住所や地名などの文字情報を緯度・経度のような地理座標に変換する「ジオコーディング」」について説明。住所という概念はその地域や国の文化や歴史によって大きく影響を受けており、特に日本の住所システムは他の多くの国々とは異なるため「その特異性が国内外から注目を浴びている」と語りました。

ジオコーディングにおける名寄せの重要性

さらに住所は、近代の発展とともに具体的な場所を特定するためのツールとして使われるようになったこと、また、その定義や存在意義が変化し続けている、と瀬戸さんは指摘。未来に向けてWhat3WordsやGoogle Plus CodesのようなピンポイントでIDを割り当てる方向性がある一方で、そのオープン性やアルゴリズムが問い直されている、との課題感を示しました。

また、住所をデジタル化することで便利さは増すかもしれないが、それが必ずしも豊かさをもたらすわけではないという視点も重要だとも指摘しました。

正しい住所の重要性が自治体に理解されていないという現状

松山さんは2021年に調査した日本全国の市町村における住居表示住所デジタル化の進捗状況というの卒業論文を紹介しました。

この調査によると、合計1917つの市町村のウェブサイトから情報を集め、全域で住居表示が行われている市区町村は707件、そして全く行われていない件数が1210件であることが確認されたほか、住居表示が行われているにもかかわらず、そのデータが国土地理院の電子国土基本図に掲載されていない自治体が14件あったそうです。

各県の実施率は、大阪が最も高く、福島が最も低く、さらに、岐阜県はデータ提供率が最も低い、との調査結果が得られました。

県ごとの住所デジタル化の進捗情報

その後、松山さんは電話で各市町村に問い合わせ、データが掲載されていない理由を確認しました。その結果、多くの自治体は国土地理院の存在を知らない、または既に受けた住居表示が変更されていないため、特に新しいデータを提供する必要がないと考えていたそうです。

今後の課題として松山さんは、全ての住居表示データをデジタル化する方法を見つける必要があると指摘。また、ウェブサイト上で住居表示情報を全く提供していない自治体が存在するため、これらの自治体に対しては電話での確認も必要となると語りました。

松山さんの考察

「住所の正規化は需要あるの?」視聴者から寄せられたさまざまな質問に登壇者が回答

イベントの後半は、視聴者からの質問に対して登壇者が回答するQ&A実施され、住所に関する素朴な疑問から技術的な話まで、さまざまな質問が寄せられました。ここではその質問の一部をご紹介します。

視聴者からslidoを使って質問を募集

京都はなぜあんなに住所が複雑なんですか?

瀬戸さん:長い歴史と特有の町割が京都の住所の複雑さに大いに寄与していて、具体的には、「上る・下る」「西入ル・東入ル」など通り名を組み合わせた表現や一般的な郵便住所、これらのミックスといった、大きく3つのパターンが存在します。

さらに明治時代以降の町村合併で既存の町名や通り名をそのまま使用した結果、住所の範囲が広がり、複雑性が増し中心部では歴史的に積み重ねられた要素が多様で複雑な一方、郊外へ行くと町名だけや番地だけといった単純な表記も存在します。

住所コードが業者ごとに異なるのはなぜでしょうか

平本さん:業者ごとに異なる理由は著作権問題です。全国版の統一された住所コードが存在しましたが、著作権の問題からそれが一般に使用されなかったため、各業者が独自にコードを設定する必要が生じました。これらの問題を解決するために、新たなアドレス・ベース・レジストリーが作られ、その中でコードの統一が提案され、実施されています。

なぜ住所の正規化がこんなに後回しにされてきたんでしょう?

平本さん:手書きと人間の目視判断が大きく関わっています。以前は手書きで住所を記録し、人間がそれを解釈していたので、文字の違い(例:「ケ」が大きいか小さいか)などは問題となりませんでした。

しかし現在コンピューターが一般的になり、名寄せや照合などのデジタル処理が増えると、表記の一貫性が重要となりました。例えば、「漢字のニ丁目」と「数字の2丁目」のような違いはコンピューター処理に問題を引き起こす可能性があります。

他にもオープンデータとしての利用やデータベース化が進むにつれて、正規化された住所の必要性が増してきました。各部門で異なる表記法を持つことは、業務を困難にします。これらの理由から、デジタル化が進む現代において、住所の正規化がより重要になってきたと考えられます。

海外ではどのような解決をされているのでしょう?

古橋さん:海外の住所正規化については、主にストリートとアベニューの名前を組み合わせたパターンが一般的で、道路の反対側ごとに奇数・偶数のハウスナンバーが割り振られますが、すべての場所がこのシステムに従っているわけではありません。

例えば、ブラジルの首都ブラジリアは60-70年前に計画的に作られた街で、その町の形状は飛行機の形になっています。住所は道路名からではなくエリアやブロックに基づいており、町は北側と南側に分けられ、各エリアはさらに幹線道路によって分割、その後ブロックごとに番号が付けられ、これらが組み合わせられて住所が形成されます。

このシステムは、二次元座標軸のようなポジショニングによって、ブロック番号を決定していて、具体的には、”sqs102″という住所は、南側の2番目のブロックを示します。この形式に従って番号が割り振られると、それぞれの住所が一意に決まり、タクシーやナビゲーションが容易になります。

その一方で、韓国のように、元々はブロック型の住所を使用していたが、後にストリートアベニュー方式に変更した国もあります。全体的にはストリートアベニューが主流ですが、それがすべてではなく、各地域の都市計画に基づいて合理的な住所の付け方が提案されています。

何故こんなに自由な地名表記ができてしまうのでしょうか?

瀬戸さん:主に地域ごとの異なる成り立ちや、日本が歴史的に標準化を避けてきた背景によると思います。また、諸説はあるものの紙での管理が主流だった時代に間違った表記がそのまま続けられてきたという経緯もあるようです。

さらに、明治時代に地租改正などで地名や番地が定義づけられましたが、それ以前から存在していた地名を引き続き使用するという事例も多く見られており、地名の歴史的な流れや範囲の広がりなど、多様な要素が影響しているようです。

そもそもな質問なんですが、住所の正規化はどこに需要がありますか?

平本さん:住所の正規化が必要な理由は、頻繁に行われる住所のマッチングをより効率的に行うためです。特に、法人名の表記や住所の一致率によって、いままで法人番号がついていない書類にも名寄せにより後から法人番号を付与したい、といった需要があります。

集合住宅の建物名とか部屋番号って公式なアドレスの一部なんですか。

平本さん:集合住宅の建物名や部屋番号は、公式なアドレスの一部とは必ずしも言えません。共通語彙基盤などでは集合住宅の建物名と号数を別々に分ける試みがありますが、実際には難しいという話があります。

一部の自治体では、マンションの部屋番号を住所の後に付けるようにルール化している場所もあるため、それらが半分公式のように扱われていることもありますが、本来、住所とは地番や号までで一旦切れるべきとされています。不動産IDの議論などからも、これらについてまとめて整理する必要性が高まってきています。

活発な質疑応答の後、関さんは「日本の住所の問題は引き続きみんなで考えて実際に手を動かしていきたい」と語り、会を締めくくりました。