1. 서론 - AI 품질 시스템의 성능은 ‘데이터셋’이 결정한다.
전고체 배터리(All-Solid-State Battery, ASSB)는 고체 전해질 기반의 고안전성, 고전압 대응 전지를 구현할 수 있는 차세대 에너지 저장 장치이다. 하지만 ASSB는 계면 반응 민감도, 복합재료의 미세 분산 편차, 성형 공정의 응력 집중 등으로 인해 품질 편차가 심화되기 쉬운 구조를 갖고 있다.
기존의 샘플링 품질 검사 방식으로는 생산 전극 전체의 품질을 모니터링하기 어려우며, 이를 극복하기 위해 AI 기반 실시간 품질 판별 시스템이 도입되고 있다. 하지만 AI 품질 예측 모델의 성능을 좌우하는 핵심은 고품질의 라벨링된 학습 데이터셋이다.
본 가이드는 전고체 셀 전극 제조 공정에서 AI 품질 모니터링 시스템 구축에 필요한 데이터셋 정의, 수집, 라벨링, 전처리, 학습 구조화 전략을 정리한 실무 지침서로, 실제 산업 적용을 염두에 둔 데이터셋 구축 방법론을 제시한다.
2. 전고체 셀 전극 품질 요소 정의
전고체 셀 전극의 품질은 전극 내부 구조, 재료 분산 균일성, 계면 접착도 등 복합적이고 다차원적인 지표에 따라 정의된다. AI 시스템은 이들 물리적 특성을 실측 또는 간접 센서 정보로 학습하게 된다.
표 1. 전극 품질 요소별 주요 데이터 항목
전극 두께 균일도 | 도포 두께 분포 | 연속 수치형 | 비접촉식 두께 측정 센서 |
Shell 입자 분포도 | D90/D10, 분산 균일성 | 통계형 | SEM + 영상 처리 |
전해질 농도 균형도 | wt% 편차 | 연속 수치형 | 적외선 흡광 + AI 분석 |
Void 발생률 | 내부 공극률 | 정성+정량 | CT 스캔, 압축 후 X-ray |
응력 분포 특성 | FEM 기반 예측 응력값 | 수치 시뮬레이션값 | CAD + 시뮬레이션 연동 |
계면 저항 예측값 | 전극/전해질 계면 전기저항 | 수치 예측형 | AI 추론 기반 (비접촉) |
온도/점도 기록 | 공정 시점별 온도 및 점도 변화 | 시간 시계열형 | IoT 센서 + 로깅 |
✅ 데이터는 수치형 + 이미지형 + 시계열형이 혼합된 복합 형태로 구성됨
3. AI 학습용 데이터셋 구조 설계
표 2. AI 학습용 전극 데이터셋 구조
Timestamp | 측정 시각 (UTC 기준) | 시간값 |
Electrode_ID | 전극 고유번호 | 문자형 (A001 등) |
Thickness_mean (μm) | 평균 도포 두께 | Float |
Thickness_std (μm) | 표준편차 (두께) | Float |
Shell_dispersion | Shell 입자 D90/D10 | Float |
Void_ratio (%) | CT 기반 공극률 | Float |
Electrolyte_std (wt%) | 고체 전해질 농도 편차 | Float |
Stress_peak (MPa) | FEM 응력 피크값 | Float |
Process_temp (°C) | 공정 시 온도 | Float |
Viscosity (cP) | 점도 값 | Float |
Label_quality | 품질 등급 (Good/Warning/Bad) | 클래스형 |
☑️ 정량 데이터 + 시뮬레이션 결과 + 품질 등급 라벨이 모두 포함되어야 함
4. 라벨링 기준 설정
AI 품질 예측 정확도를 높이기 위해서는 신뢰 가능한 라벨 정의가 필수이며, 싸이클 수명, 계면 저항, 수율 등과 연동한 복합 품질 기준으로 라벨을 지정해야 한다.
표 3. 전극 품질 라벨 정의 기준
우수(Good) | ≥ 80 | ≤ 220 | ≤ 2.5 | ≤ 3.0 | Good |
경계(Warning) | 65~79 | 221~270 | 2.6~4.5 | 3.1~5.0 | Warning |
불량(Bad) | < 65 | > 270 | > 4.5 | > 5.0 | Bad |
✅ 실제 셀 성능과 연계된 품질 기준이 AI 라벨의 신뢰도를 결정
5. 이미지 기반 라벨링 및 처리 전략
영상 데이터 (SEM, CT, 공정 카메라 등)는 CNN 기반 분류/검출에 사용되며, 모든 이미지에 수동 라벨링을 하지 않고 AI-assisted Labelling이 효과적이다.
표 4. 전극 이미지 데이터 전처리 전략
해상도 정규화 | 512x512 픽셀 통일 | 모델 학습 일관성 확보 |
노이즈 제거 | Median Filter 적용 | 입자 분포 명확화 |
대비 증폭 | Histogram Equalization | 미세 결함 탐지 향상 |
AI 라벨링 보조 | 초기 CNN 예측 + 수동 검토 | 라벨링 비용 절감 및 정확도 향상 |
증강 기법 적용 | 회전, 스케일링, 노이즈 삽입 | 데이터 다양성 확보 (오버피팅 방지) |
☑️ 1차 자동 예측 → 2차 수동 검토 체계를 통해 대규모 라벨링 비용 최소화 가능
6. 시계열 데이터 구성 및 활용 예시
IoT 기반 센서로부터 수집되는 점도, 온도, 유량 등 공정 변수는 LSTM 또는 Transformer 기반 품질 예측 모델에 사용된다.
표 5. 점도 및 온도 시계열 데이터 예시
2025-07-07 10:00:00 | A001 | 1485 | 37.8 |
2025-07-07 10:01:00 | A001 | 1492 | 38.0 |
2025-07-07 10:02:00 | A001 | 1510 | 38.2 |
… | … | … | … |
📈 시계열 데이터는 품질 추세 예측 및 이상 탐지에 매우 유용
7. 학습 데이터셋 구축 로드맵
표 6. 단계별 데이터셋 구축 가이드
1단계 | 핵심 품질 변수 정의 및 수집 범위 확정 | 품질팀 + 데이터엔지니어 |
2단계 | 센서 연동 및 수치/이미지 데이터 자동 저장 구조 구축 | 설비팀 + IT 개발자 |
3단계 | 라벨 기준 수립 및 품질 등급 기준 정의 | 공정엔지니어 + QC 팀 |
4단계 | 시계열·이미지·수치 데이터 정규화 및 표준 포맷 구성 | AI팀 + DB 엔지니어 |
5단계 | 모델 학습용 샘플 구성 (Train/Validation/Test 분리) | AI팀 |
6단계 | AI 예측 정확도 검증 및 품질 시스템 연동 | 공정자동화팀 + AI팀 |
☑️ 전공정 참여 협업체계를 통한 데이터 품질 확보가 필수
8. 결론 - 데이터가 AI 시스템의 정확도를 결정한다.
본 가이드를 통해 전고체 셀 전극 품질 예측을 위한 AI 학습용 데이터셋의 구축 전략을 다음과 같이 정리할 수 있다:
- 두께, Shell, Void, 전해질 농도 등 주요 물리 변수를 센서 기반으로 수집
- 라벨은 싸이클 수명, 계면 저항 등과 연동된 실제 성능 기준으로 설정해야 함
- 영상 데이터는 CNN 기반 분류, 수치 및 시계열 데이터는 LSTM 기반 예측에 활용
- 데이터 정규화, 전처리, 증강 전략이 학습 효율과 정확도에 직접 영향을 미침
- 라벨링 효율을 위해 AI 보조 라벨링 시스템을 병행하는 것이 효과적임
- 데이터셋 구축은 설비–IT–AI–QC 전 부서 협업체계로 진행되어야 하며,
이후에는 실시간 공정 연동형 학습 모델로 발전시켜야 한다.