同じ文字でも全然違う、地名でよく見る「ケ」の難しさ

「六ヶ所村」「関ケ原」「六ケ敷」など、住所や地名でよく見かける「ケ」という文字。大きさこそ違えど同じに見えるこの文字が、実はまったく別の使われ方をしていることをご存じでしょうか。

3つの意味で使われる「ケ」

1つ目の「六ヶ所村」は、数を数える「箇」を省略した「助数詞」としての「ケ」で、八百屋さんなどで見かける「1ケ100円」の「ケ」と同じ意味です。読み方は「か」で、「六ヶ所村」は「ろっかしょむら」と読みます。

一方、「関ケ原」の場合は、名詞や代名詞などの体言をつなげて1つの言葉にするために用いられる連体助詞としての「ケ」です。読み方は「が」で、「君が代」の「が」と同じ使われ方です。

最後の「六ケ敷」は、助数詞でも連体助詞でもない当て字としての「ケ」。当て字なので「か」と読むこともあれば「が」と読むこともあり、「六ケ敷」は「むつかしき」と読みます。

大きさにも違いがある「ケ」と「ヶ」

こうした意味や読み方の違いに加え、この文字は「ケ」「ヶ」という大きさの違いもあります。大きさ自体に決まりはないのですが、地名の場合は固有名詞のため、どちらの文字を使うかが決まっている場合がほとんどです。

しかし、同じ場所であってもこの文字の表記が異なることもあります。

代表的な例が「市ケ谷」で、JR東日本と東京メトロは「市ケ谷」と大きい「ケ」なのに対して、都営地下鉄は「市ヶ谷」と小さい「ヶ」です。また、東京都千代田区の地名である「霞が関」はひらがなの連体助詞ですが、東京メトロの駅名は「霞ケ関」。さらに埼玉県にある東武東上本線の同名駅は「霞ヶ関」と、同じ駅名に見えて表記は微妙に異なっています。使い分けにルールはないため、正しい表記にこだわるなら1つ1つ覚えるしかありません。

住所をデータとして扱う場合、このように表記が揺れていると同じ場所のはずなのに同じ住所として扱うことができません。「市ケ谷」と「市ヶ谷」は人間の目で見れば同じ地名ですが、コンピュータにとってはまるで異なる住所なのです。

省庁によっても違う「ケ」と「ヶ」

「ケ」と「ヶ」の問題については、興味深いことに省庁間でもどちらを使うかで揺れがあります。

以下は、国土交通省が公開している位置参照情報と、総務省による国勢調査のデータの比較です。パッと見ると、国土交通省は大きい方の「ケ」、総務省は小さい方の「ヶ」かなと思いきや、必ずしもそうではなく「青森県外ケ浜町」は逆になっていて、「ケ」を見るだけでも問題の複雑さを垣間見ることができます。

位置参照情報(国土交通省) 国勢調査(総務省)
青森県外ケ浜町 青森県外ヶ浜町
茨城県龍ヶ崎市 茨城県龍ケ崎市
千葉県鎌ヶ谷市 千葉県鎌ケ谷市
千葉県袖ヶ浦市 千葉県袖ケ浦市

住所の表記揺れを正規化するための「住所ID」

こうした住所の表記揺れを1つにまとめて正規化するために、Geoloniaが取り組んでいるのが「住所ID」です。見た目や表記が違っても同じ住所の場合、コンピュータも同じ住所として扱えるデータとすることで、住所を活用したビジネスやサービスが展開しやすくなるのです。

今回の場合は「ケ」「ヶ」や「か」「が」などを同じ文字として扱えばいいため比較的楽なのですが、日本の地名にはまだまだ正規化が難しい住所が山ほどあります。こうした面白い地名については、今後またgraphiaで紹介する予定です。