Indian Pines 高スペクトルデータセットの入手手順

Indian Pines 高スペクトルデータセットの入手手順

本記事では、リモートセンシングや機械学習の分野で広く利用される Indian Pines データセットの入手方法について解説します。このデータセットは、AVIRISセンサーによって取得された高スペクトル画像とそのグラウンドトゥルース情報(土地被覆の正解ラベルなど)を含んでおり、土地被覆分類アルゴリズムの開発や評価などに活用されます。

1. AVIRIS 高スペクトル画像データの入手

まず、Purdue University Research Repository (PURR) から AVIRIS (Airborne Visible/Infrared Imaging Spectrometer) センサーによって取得された高スペクトル画像データを入手します。

1.1 データ配布ページへのアクセス

AVIRISデータを入手するために、以下の PURR の Web ページにアクセスします。

https://purr.purdue.edu/publications/1947/1

1.2 データのダウンロード

ページ内の説明を確認し、「Download Bundle」 ボタンをクリックして、10_4231_R7RX991C.zip というファイルをダウンロードします。このファイルには、インディアナ州のIndian Pineテストサイト上空で取得されたAVIRIS高スペクトル画像データが含まれています。

1.3 ファイルの展開と確認

ダウンロードした 10_4231_R7RX991C.zip を、任意の分かりやすい場所に展開します。

(補足: Windows 環境で .zip ファイルを展開するには、OS標準機能の他に 7-Zip などのツールも利用できます)

以下の説明では、例としてファイルを E:\Downloads\10_4231_R7RX991C\ ディレクトリに展開したものとして進めます。ご自身の環境に合わせて、ファイルパスを適宜読み替えてください。

展開後のbundle/ディレクトリ(または展開されたディレクトリ直下)には、以下のような複数のファイルが含まれていることを確認してください。(注: ファイル構成は配布元で変更される可能性があります)

2. グラウンドトゥルース(正解ラベル)データの入手

次に、AVIRISデータに対応するグラウンドトゥルース(土地被覆の正解ラベル)などが含まれた MATLAB データファイルを入手します。

2.1 データ配布ページへのアクセス

これらのMATLABデータファイルを入手するために、以下の Hyperspectral Remote Sensing Scenes の Web ページにアクセスします。

https://www.ehu.eus/ccwintco/index.php/Hyperspectral_Remote_Sensing_Scenes

2.2 MATLABデータファイルのダウンロードと確認

ページ内の "Indian Pines" セクションから、以下の2つのMATLABデータファイル(.mat)へのリンクをクリックしてダウンロードします。

ダウンロード後、Indian_pines.matIndian_pines_gt.mat の2つのファイルが保存されていることを確認してください。これらのファイルには以下の情報が含まれています。

3. データセットの特徴

Indian Pinesデータセットには以下の特徴があります。

# クラス サンプル数
1 アルファルファ 46
2 トウモロコシ(不耕起) 1428
3 トウモロコシ(最小耕起) 830
4 トウモロコシ 237
5 牧草地 483
6 草地・木 730
7 刈り取られた牧草地 28
8 干し草 478
9 オート麦 20
10 大豆(不耕起) 972
11 大豆(最小耕起) 2455
12 大豆(クリーン) 593
13 小麦 205
14 森林 1265
15 建物・草・木・道路 386
16 石・鉄・塔 93

4. データセット利用例

このデータセットは主に以下の用途で利用されています。

5. その他の入手方法

上記の方法以外にも、以下のプラットフォームからも入手可能です(リンク先は各プラットフォームで検索してください)。

参考文献

参考記事

以上の手順に従うことで、リモートセンシングや機械学習の研究に広く利用されているIndian Pines高スペクトルデータセットを入手することができます。