共同通信PRワイヤー KYODO NEWS PR WIRE
人工衛星「だいち2号」の観測データを活用して国土に特化したSAR基盤モデルを構築
国立研究開発法人産業技術総合研究所
ポイント
・ 産総研の大規模AIクラウド計算システム「ABCI」を活用し、JAXAが運用する人工衛星「だいち2号」のSAR観測データの大規模学習を実現
・ 土地利用・土地被覆の偏りを均等化して構築した学習データセットを用いて日本の国土に特化したSAR基盤モデルを構築
・ 基盤モデル活用により専門的な知識を必要とするSAR画像判読の敷居を下げることで、SAR利用の拡大に期待
【画像:https://kyodonewsprwire.jp/img/202506029849-O1-Q016ae2O】
概 要
国立研究開発法人 産業技術総合研究所(以下「産総研」という)インテリジェントプラットフォーム研究部門 Nevrez Imamoglu 主任研究員、Ali Caglayan 主任研究員、神山 徹 研究グループ長、堤 千明 総括研究主幹は、国立研究開発法人 宇宙航空研究開発機構(以下「JAXA」という)と共同で、「だいち2号」(ALOS-2)搭載の合成開口レーダー(Synthetic Aperture Radar: SAR)、PALSAR-2により、日本国土を対象に定常的に取得されている高解像度観測モードのSARデータを用いて、国土に特化したSAR基盤モデルを構築しました。
今回、70%が森林であるなどの日本の国土の特徴を考慮し、特定の土地利用・土地被覆種別への学習の偏りを避け、学習データに含まれる土地利用・土地被覆の割合を均等化する目的で、あらかじめ学習に用いる地点を選択しました。PALSAR-2による観測データは国土全域を網羅していますが、その中から選択地点を含む範囲を画像パッチとして抽出することでさまざまな土地利用・土地被覆を反映する学習データセットを整備しました。このデータセットを用いて大規模な教師無し学習を行うことで、国土に特化したSARデータ用の基盤モデルを構築しました。転移学習により土地利用・土地被覆推定作業を実施したところ、無作為に作成した学習データセットによる基盤モデルを利用した結果や、そもそも基盤モデルを用いず推定した結果に比べ、顕著に高い精度の推定結果が得られ、均等化したデータセットを利用した基盤モデルは高い性能を示すことが確認できました。当初はJAXA、産総研を含む研究者による基盤モデル・高次付加価値プロダクトの利用を想定していますが、この基盤モデルの活用により、専門的な知識を必要とするSAR画像判読の敷居を下げることで、より広い方々によるSAR利用の拡大が期待できます。
本成果は産総研とJAXAによる「衛星データのAI解析手法の研究開発に関する協定」に基づき実施されました。なお、この研究成果の詳細は2025年6月4日~6月5日に開催される「日本リモートセンシング学会第78回(令和7年度春季)学術講演会」において発表されます。
下線部は【用語解説】参照
開発の社会的背景
SARは、マイクロ波を利用したリモートセンシング技術の一つで、人工衛星や航空機による合成開口技術を用いることで、昼夜を問わず高解像度の画像を観測データとして得ることができます。中でもLバンドと呼ばれる1 GHz~2 GHzの周波数帯のマイクロ波は空気中の水蒸気や植生などに対して透過性が高いため、森林の多い我が国などの地形変化や災害時の状況把握などでの活用が進められています。JAXAの人工衛星「だいち2号」(ALOS-2)はLバンドのSARであるPALSAR-2を搭載しており、天候や昼夜に影響されず日本を含め世界中の観測を続けています。
一方で、SARのより広い分野への利用拡大には課題もあります。SARデータの判読には専門知識が必要なためAI技術の導入が進んでいますが、大規模計算や大量のデータ取得にはコストもかかります。この問題を解決するために基盤モデルの導入が考えられます。基盤モデルは、その構築には大量のデータと大規模な計算が必要となりますが、構築してしまった後は、それをベースにして、わずかな学習でさまざまなタスクをこなすAIモデルを構築することができます。
研究の経緯
JAXAの人工衛星「だいち2号」搭載のPALSAR-2によるSARデータ、特に日本国土を高解像度観測して得られた豊富なSARデータについてはこれまで基盤モデルは存在しませんでした。産総研とJAXAは「衛星データのAI解析手法の研究開発に関する協定」を締結し、産総研が所有する大規模AIクラウド計算システム「ABCI」を使用してPALSAR-2のデータの大規模計算を行いました。
なお、本成果は産総研政策予算プロジェクト「フィジカル領域の生成AI基盤モデルに関する研究開発」に基づき実施されました。また本成果は産総研及びAIST Solutionsが提供するABCI 3.0を、「ABCI 3.0開発加速利用」の支援を受けて利用し実施されました。
研究の内容
「だいち2号」搭載のPALSAR-2は日本の国土全体を3 mなどの高解像度モードでくまなく観測しています。また、この観測は地震などによる地殻変動を捉えるために定常的に実施されており、「だいち2号」の周回軌道に合わせ年4回程度の割合で国土のほぼ全体のデータが更新されます。今回の成果は画像用に開発された教師無し学習手法の一つ、Masked Auto Encoder(MAE)から派生したMixMAEにより大規模事前学習を実施し、国土を観測した豊富なSARデータから基盤モデルを構築しました。
SARによる観測ではセンサーから電波を地球へ向けて照射し、地表や水面から反射されセンサーに返ってきた電波の強さを計測することで地表や水面の様子を観測します。人間の目で見る波長とは異なるため、SAR画像は気象衛星の画像などで馴染みのあるものと大きく異なり、画像の判読には専門的な知識が必要とされます。この判読を助けるためSAR画像へのAI応用が広がっていますが、目的に応じてAIの構築をゼロから行うことはデータの準備、AIの学習に必要な計算などコストの面で課題があります。基盤モデルでは事前に基本となる学習を完了しておくことでわずかな追加学習(転移学習という)でさまざまな問題へ適応できます。
基盤モデルの性能には、データの量はもちろん、データに含まれる情報の多様性も大きく影響します。例えば日本の国土は70%が森林に覆われており、無作為にデータを学習させると森林に知識が偏ることが予想されます。実際には森林以外にも市街地や河川、耕作地帯など国土の土地種別はさまざまです。そこで、すでに得られている国内の土地利用・土地被覆データを参照し、森林、市街地、水域(河川や湖など)、耕作地帯を均等に指定しました。学習に用いるデータとするため、指定地点を中心とした256 x 256画素の小画像(画像パッチ)に切り分け、30万枚以上の学習データを準備しました。また、SAR特有のスペックルノイズや反射条件による極端に強い信号の影響を低減するため、極端に反射電波強度の強い領域の影響を無視するような損失関数を考案しました。基盤モデルは、作成した学習データセットと考案した損失関数による教師無し学習を実施して構築しました。
【画像:https://kyodonewsprwire.jp/img/202506029849-O2-ti6pwOtO】
基盤モデルはそのままでは特定の目的をこなすことはできませんが、目的に合わせた少数のデータセットによる転移学習を実行することによりさまざまな用途に活用することができます。本成果では基盤モデルの性能を評価することも目的として、土地利用・土地被覆推定を行えるよう転移学習を行いました(図2)。
【画像:https://kyodonewsprwire.jp/img/202506029849-O3-UL82ho0I】
基盤モデルを利用した場合は、事前に大規模にSARデータを学習し、SARデータを理解するのに役立つ情報の抽出が完了していることもあり、基盤モデルを利用せずに土地利用・土地被覆推定を行ったモデルより10%以上の精度の向上があることが分かりました。
今後の予定
今後は構築した基盤モデルを軸に、災害検知や都市の変化検知などさまざまな応用を行い、SARデータの実用例の積み上げと基盤モデルの性能評価を行っていきます。また、これまでは画像からAIが得た情報を人間が理解しやすい言語説明に変換することは困難でしたが、基盤モデルにより言語と画像、言語と音響など異なる種別の情報と統合することが容易になるため、SARデータの判読結果の説明を言語により行うことも可能になります。さらに言語表現された説明を別の言語モデルが理解し、観測を再度行うべきかなどのタスキングに役立てる応用も期待できます。これらにより、これまで専門知識を必要としたSARデータの理解をより直観的・かつ迅速にし、将来的にはさらなるSARの利用拡大を目指します。
発表情報
会議名:日本リモートセンシング学会第78回(令和7年度春季)学術講演会
タイトル:Self-Supervised Pre-Training and Image Segmentation Task on ALOS2 Single-Channel SAR Images
著者:Nevrez Imamoglu , Ali Caglayan, Toru Kouyama
用語解説
だいち2号(ALOS-2)
JAXAが2014年に打ち上げ、現在も運用している衛星ALOS-2の通称です。センサーとして、合成開口レーダー(SAR)であるPALSAR-2を搭載しており、国内外の10年以上におよぶマイクロ波衛星画像を提供しています。PALSAR-2が採用するLバンドの波長は約24 cmとマイクロ波の波長帯の中でも長く、空気中の水蒸気や植生などに対して透過性が高いため、森林が多い我が国などの地形変化や災害時の状況把握などに活用されています。
合成開口レーダー(Synthetic Aperture Radar: SAR)
センサーから電波(マイクロ波)を発射し、地表で反射されて返ってくる電波を捉えその強度を計測する観測機器で、合成開口という技術によって画像解像度を高めています。マイクロ波は雲を透過するため、天候や昼夜によらず画像を取得することが可能です。
基盤モデル
教師無しや半教師無し学習などを用いて膨大な入力データで学習を行った大規模な人工知能モデルです。その構築には大量のデータと大規模な計算が必要となりますが、一度構築してしまえば、それをベースにした転移学習によりさまざまなタスクをこなすAIモデルを構築することができます。また基盤モデルを構築するために行われる学習は事前学習と呼ばれます。
教師あり学習/教師無し学習
入力する情報とは別に正解を用意し、学習モデルが入力データから可能な限り正確に正解を推定できる(再現できる)ことを目標とする学習を教師あり学習と呼び、正解を用意せず入力する情報のみで学習を行う手法を教師無し学習と呼びます。教師無し学習では正解を準備する必要はなく、一般に学習データを準備する手間やコストは低いとされています。
Masked Auto Encoder(MAE)
大量の画像から基盤モデルを構築するために提案された教師無し学習手法の一つで、画像一部をわざと欠損させ、欠損部分を含め画像全体を再現するタスクを通じてAIモデルの学習を進める技法です。画像全体の情報や意味を推定できるような高い表現能力が獲得できることが知られています。
MixMAE
MAEでは画像を一部欠損させ画像全体の再現をさせていましたが、MixMAEでは画像を欠損させる代わりに2枚の異なる画像をパッチワークのように貼り合わせ、AIモデルにもとの2枚の画像をそれぞれ再現させることを通じて学習を進める教師無し学習手法です。MAEに比べ効率的に高い表現能力が得られると報告されています。
スペックルノイズ
さまざまな地表面状態があることが影響して、信号を合成する際、衛星が移動することにより信号強度がランダムに変動してしまい、斑点状の模様として画像上に現れるノイズを指します。肉眼による判読性を低減させる影響があるほか、AIによる分析にも影響があることが確認されています。
プレスリリースURL
https://www.aist.go.jp/aist_j/press_release/pr2025/pr20250603/pr20250603.html
プレスリリースURL
https://kyodonewsprwire.jp/release/202506029849
本プレスリリースは発表元が入力した原稿をそのまま掲載しております。詳細は上記URLを参照下さい。また、プレスリリースへのお問い合わせは発表元に直接お願いいたします。