KS 거울 — 두 시대의 분포 충돌기
두 시대의 같은 지표를 골라, 각 시대의 누적분포(CDF) 계단선을 시대색으로 겹쳐 봅니다. 두 곡선이 가장 크게 벌어진 간격이 콜모고로프–스미르노프 거리 D예요. D는 두 과거 표본이 얼마나 다른 모양인지를 한 숫자로 잰 거리입니다. 같은 크기의 무작위 두 표본도 우연히 D가 벌어지므로, 임계값 Dcrit와 무작위 baseline을 나란히 적어 관측 D가 우연의 흔들림 범위인지 보여 줍니다.
지표
거울 A
거울 B
거울 A 표본
—
—
거울 B 표본
—
—
관측 D / Dcrit
—
1 미만이면 우연 범위 안
읽는 법
가로축은 고른 지표값(왼쪽이 작고 오른쪽이 큰 값), 세로축은 그 값 이하가 차지하는 누적 비율(0→1)이에요. 두 시대 각각의 계단선을 시대색으로 겹쳐 그렸습니다. 두 곡선이 세로로 가장 멀리 벌어진 간격이 D이고, 그 자리에 음영 막대를 세워 짚어 두었어요. D 옆의 Dcrit = 1.36·√((nA+nB)/(nA·nB))는 표본 크기만으로 정해지는 우연의 흔들림 잣대(약 5% 기준)입니다. 또 같은 두 표본 크기로 완전 무작위 두 표본을 뽑아 잰 baseline D도 함께 적었어요 — 무작위끼리도 D는 0이 아니랍니다. 관측 D가 Dcrit보다 작으면, 두 시대의 차이는 같은 크기 표본의 우연한 출렁임과 구분하기 어려운 정도예요. 커도 그건 두 과거 기록의 분포 모양 차이를 가리키는 거리입니다 — 어느 시대가 더 잘 나왔거나 좋았다는 뜻은 담지 않습니다. 시대색은 시대를 알아보기 위한 표시이며, 우열을 나타내지 않습니다.