郵便番号 CSV データ(非辞書 CSV データ)作成手順
【概要】この記事では、日本郵便株式会社が公開している郵便番号データ(住所の郵便番号と事業所の個別郵便番号)をダウンロードし、郵便番号CSVデータ作成プログラムを使用して非辞書CSVデータに変換し、最終的に文字コードをUTF-8に変換する手順を説明する。
【目次】
【手順概要】
- 住所の郵便番号(CSV形式)(ken_all.csv)
- 事業所の個別郵便番号(CSV形式)(JIGYOSYO.CSV)
上記2つのファイルを、「郵便番号CSVデータ作成プログラム」を使って自動編集する。
- 「郵便番号CSVデータ作成プログラム」は、町域名における不要な文字の除去や、途中で分割された町域名の結合などを行うソフトである。ただし、配布元サイトは閉鎖されており、現在はダウンロードできない可能性がある。
最後に、文字コードを UTF-8 に変換する。
郵便番号データのダウンロード
日本郵便株式会社「郵便番号データダウンロード」で公開されている2つの郵便番号データのCSV(カンマ区切り値)形式ファイルをダウンロードする。
- 住所の郵便番号(CSV形式)(ken_all.csv)
- 事業所の個別郵便番号(CSV形式)(JIGYOSYO.CSV)
なお、日本郵便では2023年6月更新分より「住所の郵便番号(1レコード1行、UTF-8形式)」も提供している。UTF-8形式のデータが直接必要な場合は、こちらの利用も検討できる。
ダウンロードの手順は次の通りである。
- 郵便番号データダウンロードの Web ページを開く。
- 「読み仮名データの促音・拗音を小書きで表記するもの」をクリックする。
- 「全国一括」をクリックして、住所の郵便番号(CSV形式ファイルの圧縮ファイル)(ken_all.zip) をダウンロードする。
- Web ブラウザで「戻る」を実行する。
- 「事業所の個別郵便番号」をクリックする。
- 「最新データのダウンロード」をクリックして、事業所の個別郵便番号(CSV形式ファイルの圧縮ファイル)(jigyosyo.zip) をダウンロードする。
- ダウンロードしたファイルは ZIP 形式なので、解凍しておく。
2つの郵便番号データのCSV形式ファイルを、非辞書CSVデータ(ZIPDATA.CSV)へ変換
「郵便番号CSVデータ作成プログラム」を使い、「非辞書CSVデータ(ZIPDATA.CSV)」に変換する。ただし、配布元サイト(http://www7b.biglobe.ne.jp/~kenken_y/)は閉鎖されているため、プログラムの入手ができない場合がある。
- 「郵便番号CSVデータ作成プログラム」の Web ページを開く。
- 「郵便番号CSVデータ作成プログラム(郵便番号CSV/MDB作成) と MS-IME辞書登録」のところから、プログラムと使用説明書をダウンロードする。
- ダウンロードしたプログラムを解凍する。
解凍の結果、ファイルができる。
- 使用条件や免責事項などを確認する。
- CSV_IN ディレクトリに、住所の郵便番号(CSV形式)(ken_all.csv) と、事業所の個別郵便番号(CSV形式)(JIGYOSYO.CSV) の2つのファイルをコピーする。
- 「郵便番号CSV作成.exe」を実行する。
- 使用条件や免責事項などを再度確認し、「次へ」をクリックする。
- 「CSV 形式 zipdata.csv(非辞書用)」をチェックし、「作成開始」をクリックする。
- ポップアップウインドウを確認する。
- CSV_OUT ディレクトリの下に、非辞書CSVデータのファイル ZIPDATA.CSV ができる。
非辞書CSVデータ(ZIPDATA.CSV)の文字コードの変換
上記の手順で作成されたファイルは SHIFT-JIS 形式である。CharsetConverter(漢字コード変換ソフトウェア)などを使って、文字コードを UTF-8 に変換しておく。