NightShift · 24×7 공장 운영 자동 인계 (Hanwha 화성공장 · Line 4)

TRACK 3 · APAC · PAGER-MEAN-FREE

야간조 → 주간조 자동 작성 인계서 (06:00 KST)

야간 23:00 - 06:00 요약

23:14 Line 4 #3-press 진동 0.42mm 알람 (임계 0.35mm). WatchAgent 진단 → 베어링 마모 75%, 7일 내 교체 권고.
01:42 Conveyor #2 모터 온도 72°C (정상 ≤65°C). RemediationAgent 자동 RPM 12% 감속 → 정상 회복. 알람 없음.
03:28 PLC tag 'oven_temp_z3' NaN 15초. SignalAgent 모드버스 reconnect 1회 → 복구. 데이터 갭 8s, 품질 영향 없음.
05:11 생산량 17,420 unit (목표 17,800 −2.1%). RootCauseAgent → conveyor 감속(01:42 사건) 영향, 단발성.

주간조가 해야 할 일 3건

  1. 09:00 #3-press 베어링 발주 (재고 0, 한화기계 ASIA-PR-007, 납기 5일)
  2. 11:00 Conveyor #2 정기점검 일정 앞당기기 (5/18 → 5/14)
  3. 14:00 PLC 모드버스 재시도 회수 카운터 리셋 (월간 23회 → 권장 ≤10회)

이번 주 한 줄

지금 매우 안정. 베어링 1건만 발주하면 7일 무중단. 콜 안 받아도 됨.

Agent topology

WatchAgent · Vertex AI Search · MES/SCADA 시계열 (Cloud Pub/Sub)
SignalAgent · MCP → modbus/opc-ua/PLC
RemediationAgent · A2A → PLC 제어 partner (안전 가드)
RootCauseAgent · Gemini Pro · 인과 그래프
HandoffAgent · 24h 요약 + Slack/카카오톡 push

On-call 비용 절감

야간 호출 (before)6.4/night
야간 호출 (NightShift)0.7/night
오탐률3.1% → 0.4%
인계서 작성42min → 0.2min
MTTR (단순 알람)14m → 0m (자동)
공장 1개 (300인) 연간 절감 ₩2.14B 야간 인력 4→2 · 오탐 출동비 · 베어링 사전감지

왜 ops-veteran이 좋아하는가

• 모든 자동조치는 dry-run + 2-step approval
• 알람은 항상 "왜 깨웠는지" 1줄 + runbook 링크
• Agent 자체 SLO 99.5% — 다운돼도 기존 SCADA가 fallback