Indian Pines 高スペクトルデータセットの入手手順
Indian Pines 高スペクトルデータセットの入手手順
本記事では、リモートセンシングや機械学習の分野で広く利用される Indian Pines データセットの入手方法について解説します。このデータセットは、AVIRISセンサーによって取得された高スペクトル画像とそのグラウンドトゥルース情報(土地被覆の正解ラベルなど)を含んでおり、土地被覆分類アルゴリズムの開発や評価などに活用されます。
1. AVIRIS 高スペクトル画像データの入手
まず、Purdue University Research Repository (PURR) から AVIRIS (Airborne Visible/Infrared Imaging Spectrometer) センサーによって取得された高スペクトル画像データを入手します。
1.1 データ配布ページへのアクセス
AVIRISデータを入手するために、以下の PURR の Web ページにアクセスします。
https://purr.purdue.edu/publications/1947/1
1.2 データのダウンロード
ページ内の説明を確認し、「Download Bundle」 ボタンをクリックして、10_4231_R7RX991C.zip
というファイルをダウンロードします。このファイルには、インディアナ州のIndian Pineテストサイト上空で取得されたAVIRIS高スペクトル画像データが含まれています。
1.3 ファイルの展開と確認
ダウンロードした 10_4231_R7RX991C.zip
を、任意の分かりやすい場所に展開します。
以下の説明では、例としてファイルを E:\Downloads\10_4231_R7RX991C\
ディレクトリに展開したものとして進めます。ご自身の環境に合わせて、ファイルパスを適宜読み替えてください。
展開後のbundle/
ディレクトリ(または展開されたディレクトリ直下)には、以下のような複数のファイルが含まれていることを確認してください。(注: ファイル構成は配布元で変更される可能性があります)
19920612_AVIRIS_IndianPine_Site3_REFLECTANCE.tif
:AVIRIS高スペクトル画像データ(220バンド)Calibration_Information_for_220_Channel_Data_Band_Set.txt
:波長情報- その他の参照データ(フィールドメモ、写真など)
2. グラウンドトゥルース(正解ラベル)データの入手
次に、AVIRISデータに対応するグラウンドトゥルース(土地被覆の正解ラベル)などが含まれた MATLAB データファイルを入手します。
2.1 データ配布ページへのアクセス
これらのMATLABデータファイルを入手するために、以下の Hyperspectral Remote Sensing Scenes の Web ページにアクセスします。
https://www.ehu.eus/ccwintco/index.php/Hyperspectral_Remote_Sensing_Scenes
2.2 MATLABデータファイルのダウンロードと確認
ページ内の "Indian Pines" セクションから、以下の2つのMATLABデータファイル(.mat)へのリンクをクリックしてダウンロードします。
- Indian_pines.mat (6.0 MB)
- Indian_pines_gt.mat (1.1 KB)
ダウンロード後、Indian_pines.mat
と Indian_pines_gt.mat
の2つのファイルが保存されていることを確認してください。これらのファイルには以下の情報が含まれています。
Indian_pines.mat
:145×145ピクセル、200スペクトルバンドの高スペクトル画像データ(MATLABフォーマット)Indian_pines_gt.mat
:16クラスに分類された土地被覆の正解ラベル
3. データセットの特徴
Indian Pinesデータセットには以下の特徴があります。
- 撮影地域:インディアナ州北西部のIndian Pineテストサイト
- 画像サイズ:145×145ピクセル
- スペクトルバンド数:224バンド(水吸収バンドを除いた後は200バンド)
- 波長範囲:0.4~2.5μm
- 空間解像度:20メートル/ピクセル
- 土地被覆:農地(約2/3)、森林や自然植生(約1/3)
- 撮影時期:1992年6月12日
- グラウンドトゥルースクラス情報(16クラス):
# | クラス | サンプル数 |
---|---|---|
1 | アルファルファ | 46 |
2 | トウモロコシ(不耕起) | 1428 |
3 | トウモロコシ(最小耕起) | 830 |
4 | トウモロコシ | 237 |
5 | 牧草地 | 483 |
6 | 草地・木 | 730 |
7 | 刈り取られた牧草地 | 28 |
8 | 干し草 | 478 |
9 | オート麦 | 20 |
10 | 大豆(不耕起) | 972 |
11 | 大豆(最小耕起) | 2455 |
12 | 大豆(クリーン) | 593 |
13 | 小麦 | 205 |
14 | 森林 | 1265 |
15 | 建物・草・木・道路 | 386 |
16 | 石・鉄・塔 | 93 |
4. データセット利用例
このデータセットは主に以下の用途で利用されています。
- 高スペクトル画像の分類アルゴリズムの開発と評価
- 特徴抽出手法の研究
- 次元削減アルゴリズムのテスト
- 土地被覆分類の研究
- リモートセンシングデータ解析の教育
5. その他の入手方法
上記の方法以外にも、以下のプラットフォームからも入手可能です(リンク先は各プラットフォームで検索してください)。
- Kaggle: Indian Pines Hyperspectral Dataset
- Hugging Face: danaroth/indian_pines
- GitHub: helmenov/IndianPines
参考文献
- Baumgardner, M. F., Biehl, L. L., Landgrebe, D. A. (2015). 220 Band AVIRIS Hyperspectral Image Data Set: June 12, 1992 Indian Pine Test Site 3. Purdue University Research Repository. doi:10.4231/R7RX991C Purdue University
- Grupo de Inteligencia Computacional (GIC). Hyperspectral Remote Sensing Scenes. Retrieved from https://www.ehu.eus/ccwintco/index.php/Hyperspectral_Remote_Sensing_Scenes
参考記事
- (参考記事) Yuki_Nakahora: http://qiita.com/Yuki_Nakahora/items/ef093700f42e37c54330
- (参考記事) wayama_ryousuke: http://qiita.com/wayama_ryousuke/items/ca43cabffde90a66434b
- (参考記事) wayama_ryousuke: http://qiita.com/wayama_ryousuke/items/8e6c2b091603a30d294f
以上の手順に従うことで、リモートセンシングや機械学習の研究に広く利用されているIndian Pines高スペクトルデータセットを入手することができます。