๐ Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention
| Title | Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention |
|---|---|
| Authors | |
| Affiliation | |
| Conference | IEEE Transactions on Geoscience and Remote Sensing (1735657200000) |
| DOI | 10.1109/TGRS.2025.3585489 |
| Keywords |
์ฐ๊ตฌ ๋ฐฐ๊ฒฝ
- Semantic Segmentation for Remote Sensing Images
- ์ฌ๋ ๋์, ํ ์ง ์ด์ฉ ๋ถ์, ํ๊ฒฝ ๋ชจ๋ํฐ๋ง ๋ฑ ๋ค์ํ ์์ฉ ๋ถ์ผ์์ ํต์ฌ์ ์ญํ
- ์ง๊ตฌ ๊ด์ธก ์์ฑ์ ์ฆ๊ฐ
- ๋๊ท๋ชจ ์๊ฒฉ ํ์ฌ ์์์ด ์ง์์ ์ผ๋ก ์์ง๋จ
- ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ๋ถ์ ์ ์ฉ ๊ฐ๋ฅ์ฑ ํ๋
- ์๊ฒฉ ํ์ฌ ์์ ๋ฐ์ดํฐ ํน์ฑ
- ํฝ์ ๋จ์ ๋ผ๋ฒจ๋ง์ด ํ์์ ์
- ํด๋์ค ์๊ฐ ๋ง๊ณ ๋ผ๋ฒจ๋ง ๊ท์น์ด ๋ณต์กํจ
- ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ๋ํ ์์ ์ง๋ ํ์ต ์ ์ฉ์ด ์ด๋ ค์
- ์ด์ ๋ฐ๋ผ ์ค์ง๋ ํ์ต์ด ํจ๊ณผ์ ์ธ ๋์์ผ๋ก ์ฃผ๋ชฉ๋ฐ์
- ์ง๊ตฌ ๊ด์ธก ์์ฑ์ ์ฆ๊ฐ
- ์์ฐ ์ด๋ฏธ์ง ๋ถ์ผ์ ๊ธฐ์กด Semi-supervised Semantic Segmentation ๋ฐฉ๋ฒ๊ณผ ํ๊ณ
- Pseudo-label ๊ธฐ๋ฐ Self-training
- pros:
๋ชจ๋ธ ์์ธก์ pseudo-label๋ก ํ์ฉํ์ฌ unlabeled data๋ฅผ ํ์ต์ ์ฌ์ฉ - cons:
ํ์ต ์ด๊ธฐ์ ์๋ชป๋ pseudo-label๋ก ์ธํด ์ค๋ฅ๊ฐ ๋์ ๋จ
- pros:
- Feature perturbation ๊ธฐ๋ฐ ์ผ๊ด์ฑ ํ์ต
- pros:
์ ๋ ฅ ๋๋ ํน์ง ๊ณต๊ฐ์์์ ๊ต๋(perturbation)์ ๋ํ ์์ธก ์ผ๊ด์ฑ ๊ฐ์ - cons:
๊ต๋ ์ค๊ณ์ ๋ผ๋ฒจ ๋ถํฌ์ ๋ฏผ๊ฐํจ
- pros:
- TeacherโStudent ์ผ๊ด์ฑ ํ๋ ์์ํฌ
- pros:
Teacher ๋ชจ๋ธ์ ์์ธก์ Student ๋ชจ๋ธ์ ํ์ต ์ ํธ๋ก ์ฌ์ฉ
์ต์ข ์ถ๋ ฅ(prediction) ์์ค์ ์ผ๊ด์ฑ์ ์ค์ฌ์ผ๋ก ์ค๊ณ๋จ - cons:
์ถ๋ ฅ ์์ค์ ์ผ๊ด์ฑ๋ง ๊ณ ๋ คํ์ฌ ๋ด๋ถ ํํ์ด๋ ์ค์ผ์ผ ์ฐจ์ด๋ฅผ ์ถฉ๋ถํ ๋ฐ์ํ์ง ๋ชปํจ
- pros:
- Pseudo-label ๊ธฐ๋ฐ Self-training
- Remote Sensing ์ด๋ฏธ์ง์ ์์ฐ ์ด๋ฏธ์ง ๊ฐ ๋๋ฉ์ธ ํน์ฑ ์ฐจ์ด
- ์๋ก ๋ค๋ฅธ ํฌ๊ธฐ์ ๊ฐ์ฒด๋ค์ด ๋์์ ์กด์ฌ
- ์: ๋ํ ๊ฑด๋ฌผ, ์ํ ์๋์ฐจ, ๊ธธ๊ฒ ์ด์ด์ง ๋๋ก
- ๋์ ํด๋์ค ๊ฐ ์๊ฐ์ ์ ์ฌ์ฑ
- ์: ๋๋ก vs ์ฃผ์ฐจ์ฅ, ๊ฑด๋ฌผ ์ฅ์ vs ์ฝํฌ๋ฆฌํธ ์ง๋ฉด
- ๊ฒฐ๊ณผ์ ์ผ๋ก
- ํฝ์ ๊ฒฝ๊ณ ๋ชจํธยท์ํ ๊ฐ์ฒด ๋๋ฝยทํด๋์ค ํผ๋ ๋ฐ์
- ๊ธฐ์กด Semi-supervised Semantic Segmentation ๋ฐฉ๋ฒ๋ค์
์์ฐ ์ด๋ฏธ์ง ๋๋ฉ์ธ ๊ฐ์ ์ ๊ธฐ๋ฐํ์ฌ ์ค๊ณ๋์์ผ๋ฉฐ - ์๊ฒฉ ํ์ฌ ์์์ ๋ค์ค ์ค์ผ์ผ ํน์ฑ๊ณผ ๋์ ํด๋์ค ์ ์ฌ์ฑ์ ์ถฉ๋ถํ ๊ณ ๋ คํ์ง ๋ชปํจ
- ํต์ฌ ํ๊ณ ์์ธ: ์์ฐ ์ด๋ฏธ์ง์ ์๊ฒฉ ํ์ฌ ์์ ๊ฐ์ ๋๋ฉ์ธ ์ฐจ์ด๊ฐ
์ฑ๋ฅ์ ์ ํํ๋ ์ฃผ์ ์์ธ์ผ๋ก ์์ฉํจ
- ์๋ก ๋ค๋ฅธ ํฌ๊ธฐ์ ๊ฐ์ฒด๋ค์ด ๋์์ ์กด์ฌ
์ฃผ์ ์์ด๋์ด
- Multi-scale Uncertainty Consistency (MSUC) ๋ชจ๋
- ๊ธฐ์กด ์ค์ง๋ ํ์ต์ ํ๊ณ
- TeacherโStudent ๊ฐ ์ถ๋ ฅ ์ผ๊ด์ฑ๋ง์ ์ ๊ทํ
- ์ค๊ฐ ๊ณ์ธต์ ํ๋ถํ ํํ ์ ๋ณด ํ์ฉ ๋ถ์กฑ
- ์ ์ ๋ฐฉ์
- ๋คํธ์ํฌ์ ์๋ก ๋ค๋ฅธ ๊ณ์ธต(feature maps) ๊ฐ ์ผ๊ด์ฑ์ ๋ถํ์ค์ฑ(uncertainty) ๊ธฐ๋ฐ์ผ๋ก ์ ์ฝ
- ๋ผ๋ฒจ์ด ์๋ ๋ฐ์ดํฐ์์ ๋ค์ค ์ค์ผ์ผ ํํ ํ์ต ๋ฅ๋ ฅ ๊ฐํ
- ๊ธฐ๋ ํจ๊ณผ
- ์ค์ผ์ผ๋ณ ํํ ๋ถ์์ ์ฑ ์ํ
- ํ๋ถํ๊ณ ์์ ์ ์ธ ๋ค์ค ์ค์ผ์ผ ํน์ง ํ์ต ๊ฐ๋ฅ
- ๊ธฐ์กด ์ค์ง๋ ํ์ต์ ํ๊ณ
- Cross-Teacher-Student Attention Mechanism
- Remote Sensing ์ด๋ฏธ์ง์ ๋ฌธ์
- ์๊ฒฉํ์ฌ ์์์ ๋์ ํด๋์ค ๊ฐ ์๊ฐ์ ์ ์ฌ์ฑ์ผ๋ก ์ธํ ๊ตฌ๋ถ ์ด๋ ค์
- ์ ์ ๋ฐฉ์
- Student ์ธ์ฝ๋ ์ถ๋ ฅ โ Query, Teacher ์ธ์ฝ๋ ์ถ๋ ฅ โ KeyยทValue๋ก ์ฌ์ฉ
- ๊ต์ฐจ ๋คํธ์ํฌ Attention์ ํตํด Teacher์ ๋ณด์์ ํน์ง์ Student์ ์ ๋ฌ
- ๊ตฌ์กฐ์ ํน์ง
- ๊ธฐ์กด์ ์ถ๋ ฅ ์์ค ๋จ๋ฐฉํฅ ์ง๋ ๋ฐฉ์์ ํน์ง ์์ค ์ํธ ํ์ต(feature-level mutual learning) ์ผ๋ก ํ์ฅ
- ๊ธฐ๋ ํจ๊ณผ
- TeacherโStudent ๊ฐ ์ํธ ๋ณด์์ ํํ ํ์ต ๊ฐํ
- ์๊ฐ์ ์ผ๋ก ์ ์ฌํ ํด๋์ค ๊ฐ ํ๋ณ๋ ฅ ํฅ์
- Remote Sensing ์ด๋ฏธ์ง์ ๋ฌธ์
๋ฐฉ๋ฒ๋ก (์ด๋ป๊ฒ ๊ตฌํํ๋๊ฐ?)
- ๋ฐ์ดํฐ์ / ์คํ ํ๊ฒฝ
- ๋ชจ๋ธ ๊ตฌ์กฐ, ํ์ต ์ค์ , ํ์ดํผํ๋ผ๋ฏธํฐ
- ๋น๊ต ๋์ (Baseline) Section III-A. Main Optimization Objectives
describes the main optimization objectives,
Section III-B. Multi-Scale Uncertainty Consistency Module
- Uncertainty Estimation
- Consistency Loss Functions for Multiscale Uncertainty
introduces the principles of the multi-scale uncertainty consistency module
Section III-C. Cross-Teacher-Student Attention
presents the basic principles of the crossteacher-student attention module.
The overall structure of our approach is shown in Fig. 2

์คํ ๊ฒฐ๊ณผ ๋ฐ ๋ถ์
- ์ฃผ์ ์ฑ๋ฅ ์งํ ์์ฝ (ํ๋ ๊ทธ๋ํ๋ก)
- ๋น๊ต ๊ฒฐ๊ณผ ์์ฝ (ํฅ์๋ ๋ถ๋ถ / ํ๊ณ์ )
- ์ ์์ ํด์๊ณผ ๋ด ์๊ฐ ๋น๊ต
๊ฒฐ๋ก ๋ฐ ์์ฌ์
- ๋ ผ๋ฌธ์ด ์ ์ํ ํต์ฌ ๊ฒฐ๋ก
- ๋ด ํ์ตยทํ๋ก์ ํธ์ ์ ์ฉ ๊ฐ๋ฅํ ๋ถ๋ถ
- ๋จ์ ์๋ฌธ์ ๋๋ ํ์ ์ฐ๊ตฌ ์์ด๋์ด
๊ฐ์ธ ์ฝ๋ฉํธ
- ์ดํด๊ฐ ์ด๋ ค์ ๋ ๋ถ๋ถ
- ๋ค์ ์ฐพ์๋ณผ ๊ฐ๋ (๋ ผ๋ฌธ ๋ด ์ฉ์ดยท์ฐธ๊ณ ๋ฌธํ ๋ฑ)
- ์ถ๊ฐ ์ฐธ๊ณ ํ ๋ ผ๋ฌธ
temp note
์ฒซ์งธ, ์ฐ๋ฆฌ๋ ์ต์ด๋ก ๋ค์ค ์ค์ผ์ผ ๋ถํ์ค์ฑ ์ผ๊ด์ฑ ๋ชจ๋(MSUC)์ ์ ์ํ๋ค. ์ด ๋ชจ๋์ ๋คํธ์ํฌ ๋ชจ๋ธ์ ์๋ก ๋ค๋ฅธ ๊ณ์ธต์ ์๋ ํน์ง ๋งต ๊ฐ์ ์ผ๊ด์ฑ์ ์ ์ฝํจ์ผ๋ก์จ, ๋ผ๋ฒจ์ด ์๋ ๋ฐ์ดํฐ์ ๋ํ ๋ฐ๊ฐ๋ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ๋ค์ค ์ค์ผ์ผ ํ์ต ๋ฅ๋ ฅ์ ํฅ์์ํจ๋ค. ๊ธฐ์กด ์ค์ง๋ ํ์ต ์๊ณ ๋ฆฌ์ฆ์ ๋ง์ง๋ง ๊ณ์ธต์์๋ง ๊ต์ฌ-ํ์ ๊ฐ ์ผ๊ด์ฑ ์ ๊ทํ๋ฅผ ์ํํ์ฌ, ์ค๊ฐ ๊ณ์ธต์์ ๋๋์ ๋ผ๋ฒจ๋ง๋์ง ์์ ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ต๋ ํ๋ถํ ์ ๋ณด๋ฅผ ๋ฌด์ํฉ๋๋ค. ๋ฐ๋ฉด, ์ ์๋ ์ค์ง๋ ํ์ต ๋ฐฉ๋ฒ์ MSUC ๋ชจ๋์ ํตํด ๋ผ๋ฒจ๋ง๋์ง ์์ RS ์ด๋ฏธ์ง๋ก๋ถํฐ ํจ์จ์ ์ด๊ณ ํ๋ถํ ๋ค์ค ์ค์ผ์ผ ์ ๋ณด๋ฅผ ํ์ตํ ์ ์์ต๋๋ค.
๋์งธ, ๋์ ํด๋์ค ๊ฐ ์ ์ฌ์ฑ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ํต์ฌ์ ๋ชจ๋ธ์ ํน์ง ์ถ์ถ ๋ฅ๋ ฅ์ ํฅ์์ํค๋ ๊ฒ์ด๋ค. ๋ฐ๋ผ์ ์ฐ๋ฆฌ๋ ๊ต์ฌ ๋คํธ์ํฌ๊ฐ ํ์ ๋คํธ์ํฌ๊ฐ ์ธ์ฝ๋์ ์ถ๋ ฅ์ ์ฌ๊ตฌ์ฑํ๋๋ก ๋๋ ๊ต์ฐจ ๊ต์ฌ-ํ์ ์ดํ ์ ๋ชจ๋(CTSA)์ ์ ์ํ๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, ํ์์ ์ธ์ฝ๋ ๊ฒฐ๊ณผ๋ฅผ ์ฟผ๋ฆฌ๋ก, ๊ต์ฌ์ ๊ฒฐ๊ณผ๋ฅผ ํค์ ๊ฐ์ผ๋ก ์ฌ์ฉํ๋ค. ์ด๋ฌํ ๊ต์ฐจ ๋คํธ์ํฌ ์ดํ ์ ์ ์ฅ์ ์ ํ์๊ณผ ๊ต์ฌ ๋ชจ๋ธ ๋ชจ๋๋ก๋ถํฐ ์ฌ์ธต ํน์ง์ ํ์ตํ ์ ์๋ค๋ ์ ์ ๋๋ค. ์ด๋ RS ์ด๋ฏธ์ง์์ ๊ตฌ๋ถ์ด ์ด๋ ค์ด ๋ฒ์ฃผ๋ฅผ ๋ถํ ํ๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค. ์๋ฅผ ๋ค์ด, ๊ทธ๋ฆผ 1์์ ๋ณผ ์ ์๋ฏ์ด, ์ฐ๋ฆฌ์ ๋ฐ๊ฐ๋ ํ์ต ๋ชจ๋ธ(๊ทธ๋ฆผ 1(h))์ RS ์ด๋ฏธ์ง์์ SOTA Unimatch ๋ฐฉ๋ฒ(๊ทธ๋ฆผ 1(g))๋ณด๋ค ๋ ์ ํํ ๋ถํ ๊ฒฐ๊ณผ๋ฅผ ๋ฌ์ฑํ ์ ์์ต๋๋ค.
-
ํ๋ถํ ๋ค์ค ์ค์ผ์ผ ์ ๋ณด๋ฅผ ํ์ตํ๊ธฐ ์ํด MUCA๋ ๋คํธ์ํฌ์ ์๋ก ๋ค๋ฅธ ๊ณ์ธต์์ ํน์ง ๋งต ๊ฐ์ ์ผ๊ด์ฑ์ ์ ์ฝํ๋ ๋ค์ค ์ค์ผ์ผ ๋ถํ์ค์ฑ ์ผ๊ด์ฑ ์ ๊ทํ๋ฅผ ๋์ ํฉ๋๋ค.
-
๋์ ํด๋์ค ๊ฐ ์ ์ฌ์ฑ์ ๊ตฌ๋ณํ๊ธฐ ์ํด MUCA๋ ์๋ก์ด ๊ต์ฐจ ๊ต์ฌ-ํ์ ์ดํ ์ ์ ํ์ฉํ์ฌ ํ์ ๋คํธ์ํฌ๊ฐ ๊ต์ฌ์ ์ํด ์๋ณ ๊ฐ๋ฅํ ์ธ์ฝ๋ฉ์ ์ฌ๊ตฌ์ฑํ๋๋ก ์๋ดํฉ๋๋ค.