

상관계수는 두 변수 사이에 선형적인 관계가 얼마나 강하고 어떤 방향인지 수치로 보여주는 통계 지표입니다. 실생활에서 키와 몸무게처럼 서로 관련된 데이터를 비교할 때 상관계수를 사용하면 관계의 정도를 쉽게 알 수 있습니다. 직장에서는 경험에 의존하던 의사결정을 이제는 상관계수와 같은 수치로 객관적으로 설명할 수 있습니다. 산점도와 같은 그래프를 활용하면 두 변수의 관계를 눈으로 확인할 수 있습니다. FineBI 같은 셀프 서비스 BI 도구는 다양한 데이터 소스의 상관계수를 빠르게 계산하고 시각화하여, 누구나 쉽게 데이터의 숨은 관계를 찾아낼 수 있도록 돕습니다. 공분산, 표준편차와 같은 용어는 각각 데이터의 흩어짐과 변동성을 의미하며, 상관계수는 이 두 값을 이용해 계산합니다.
| 상관계수 종류 | 정의 | 범위 | 특징 및 적용 예시 |
|---|---|---|---|
| 피어슨 상관계수 | 두 연속형 변수 간 선형 관계 측정 | -1 ~ 1 | 정규분포 가정, 이상치에 민감, 주식 가격·소득 분석 등 |
| 스피어만 상관계수 | 변수 간 순위 기반 비선형 관계 측정 | -1 ~ 1 | 비선형 관계 탐지, 이상치 덜 민감, 설문 순위 분석 등 |
| 켄달의 타우 | 순위 일치와 불일치 기반 상관계수 | -1 ~ 1 | 작은 표본에 유리, 노이즈에 덜 민감, 학교 등급 등 |
| 점-이계 상관계수 | 이진 변수와 연속형 변수 간 상관 측정 | -1 ~ 1 | 예/아니오와 점수 등 이진-연속형 데이터 분석 |
| 크래머의 V | 범주형 변수 간 상관 측정 | 0 ~ 1 | 범주형 데이터(예: 지역별 선호도) 분석 |
다양한 상관계수는 데이터의 특성과 분석 목적에 따라 선택한다. 피어슨은 연속형 데이터에, 스피어만과 켄달은 순위 데이터나 비선형 관계에 적합합니다.
상관계수는 데이터 분석에서 변수 간 관계를 수치로 보여줍니다.
이 지표를 사용하면 데이터의 패턴을 빠르게 파악할 수 있습니다.
예를 들어, 마케팅 담당자는 광고비와 매출의 상관계수를 분석해 광고 효과를 평가합니다.
학교에서는 학생의 공부 시간과 성적 사이의 상관계수를 통해 학습 습관의 중요성을 설명할 수 있습니다.
FineBI 같은 셀프 서비스 BI 도구는 여러 데이터 소스의 상관계수를 쉽게 계산하고 시각화합니다.
이렇게 하면 누구나 데이터의 숨은 관계를 발견하고, 더 나은 의사결정을 내릴 수 있습니다.
피어슨 상관계수는 두 연속형 변수 사이의 선형 관계를 수치로 나타냅니다. 이 값은 -1에서 1 사이에 위치합니다. 1에 가까우면 두 변수는 함께 증가하거나 감소합니다. -1에 가까우면 한 변수가 증가할 때 다른 변수는 감소합니다. 0에 가까우면 두 변수 사이에 선형 관계가 거의 없습니다.
피어슨 상관계수는 각 변수의 값을 평균에서 얼마나 떨어져 있는지(편차)를 곱한 값을 모두 더한 뒤, 각 변수의 표준편차로 나누어 계산합니다. 이 과정에서 변수의 분포가 정규분포를 따르고, 두 변수 사이에 선형성이 있어야 합니다.
결정계수(R²)는 피어슨 상관계수를 제곱한 값입니다. 예를 들어, R²가 0.6이면 한 변수의 변화가 다른 변수의 60%를 설명할 수 있음을 의미합니다. 피어슨 상관계수는 관계의 강도만 보여주며, 인과관계를 증명하지는 않습니다.
피어슨 상관계수 외에도 다양한 상관계수가 존재합니다.
아래 표는 대표적인 상관계수의 계산 방식과 특징, 적용 예시를 정리한 것입니다.
| 상관계수 종류 | 계산 방식 | 특징 | 적용 예시 |
|---|---|---|---|
| 스피어만 상관계수 | 두 변수의 순위 값 간 피어슨 상관계수 계산, 순위 차이 이용 | 순위 기반, 이상치에 덜 민감, 비선형 관계 측정 가능 | 시험 순위와 과제 점수 간 관계 분석 |
| 켄달의 타우 | 순서가 일치하는 쌍과 불일치하는 쌍의 수로 순서 일치도 측정 | 작은 데이터셋에 적합, 해석이 직관적 | 논문 인용 관계의 순위 비교 |
스피어만 상관계수는 두 변수의 순위를 기준으로 피어슨 상관계수를 계산합니다. 이상치에 덜 민감하며, 비선형 관계도 측정할 수 있습니다. 켄달의 타우는 두 변수의 순서가 얼마나 일치하는지 평가합니다. 작은 데이터셋이나 순위 데이터에 적합합니다.
상관계수 계산 과정을 예시 데이터와 함께 단계별로 살펴봅시다.
예시 데이터
- 변수 X: 2, 4, 6, 8
- 변수 Y: 3, 6, 7, 10
이 예시에서 상관계수는 약 0.98로, 두 변수 사이에 매우 강한 양의 선형 관계가 있음을 알 수 있습니다.
FineBI를 사용하면 복잡한 계산 과정을 손쉽게 처리할 수 있습니다. 사용자는 데이터셋을 업로드하고, 분석 메뉴에서 상관계수 분석을 선택하면 자동으로 결과를 확인할 수 있습니다. FineBI는 다양한 데이터 소스를 통합하고, 실시간으로 상관계수를 계산해 시각화까지 지원합니다. 데이터 분석 경험이 부족한 사람도 쉽게 상관관계를 파악할 수 있습니다.
상관계수는 두 변수 사이의 관계가 얼마나 강하고 어떤 방향인지를 수치로 보여줍니다. 값이 1에 가까우면 두 변수는 완전히 같은 방향으로 움직입니다. 값이 -1에 가까우면 두 변수는 완전히 반대 방향으로 움직입니다. 값이 0에 가까우면 두 변수 사이에 선형적인 관계가 거의 없습니다.
아래 표는 상관계수 값에 따른 해석 기준을 정리한 것입니다.
| 상관계수 값 범위 | 해석 |
|---|---|
| 0.9 ~ 1.0 / -0.9 ~ -1.0 | 매우 강한 양(음)의 상관관계 |
| 0.7 ~ 0.9 / -0.7 ~ -0.9 | 강한 상관관계 |
| 0.4 ~ 0.7 / -0.4 ~ -0.7 | 중간 정도 상관관계 |
| 0.1 ~ 0.4 / -0.1 ~ -0.4 | 약한 상관관계 |
| 0 ~ ±0.1 | 거의 상관관계 없음 |
상관계수의 부호는 관계의 방향을, 절댓값은 관계의 강도를 나타냅니다.
값이 1 또는 -1에 가까울수록 두 변수는 더 밀접하게 연결되어 있습니다.

상관계수의 부호는 두 변수의 관계 방향을 알려줍니다.
양의 상관관계에서는 한 변수가 증가할 때 다른 변수도 함께 증가하는 경향이 있습니다. 예를 들어, 온도가 높아질수록 아이스크림 판매량이 증가합니다. 이 경우 상관계수는 0보다 큽니다.
음의 상관관계에서는 한 변수가 증가할 때 다른 변수는 감소하는 경향이 있다. 예를 들어, 하위 계층 비율이 높아질수록 주택 가격이 낮아집니다. 이 경우 상관계수는 0보다 작습니다.
| 변수 1 | 변수 2 | 상관계수 | 상관관계 유형 |
|---|---|---|---|
| 아이스크림 판매량 | 온도 | 0.80 | 강한 양의 상관관계 |
| 아이스크림 판매량 | 담배 판매량 | -0.65 | 뚜렷한 음의 상관관계 |
| 아이스크림 판매량 | 술 판매량 | -0.06 | 독립적인 관계 |
산점도 그래프를 활용하면 양의 상관관계와 음의 상관관계를 시각적으로 쉽게 구분할 수 있습니다.
상관계수 해석에는 몇 가지 주의할 점이 있습다.
상관계수는 인과관계를 증명하지 않습다. 관계의 원인을 파악하려면 추가적인 분석과 검증이 필요합니다. 산점도와 같은 시각화 자료를 함께 활용하면 해석의 정확도를 높일 수 있습니다.

산점도는 두 변수의 관계를 한눈에 보여주는 대표적인 그래프입니다. 각 데이터 쌍을 평면 위에 점으로 표시하면, 점들이 어떤 방향으로 모여 있는지 쉽게 알 수 있습니다. 점들이 오른쪽 위로 올라가는 모양을 보이면 두 변수는 함께 증가하는 양의 관계를 가진다. 반대로, 점들이 오른쪽 아래로 내려가는 모양이면 한 변수가 증가할 때 다른 변수는 감소하는 음의 관계가 나타난다. 점들이 아무런 패턴 없이 흩어져 있으면 두 변수 사이에 뚜렷한 관계가 없다는 뜻입니다.
산점도에 추세선을 추가하면 관계의 방향과 강도를 더 명확하게 볼 수 있습니다. 예를 들어, 키와 몸무게 데이터를 산점도로 나타내면 키가 클수록 몸무게도 늘어나는 경향이 보입니다. 이처럼 산점도는 데이터의 패턴을 직관적으로 파악하는 데 매우 유용합니다. 점의 색상이나 크기를 바꾸면 추가적인 정보를 함께 표현할 수 있습니다. 예를 들어, 학생의 성별이나 학년을 색상으로 구분하면 그룹별 차이도 쉽게 확인할 수 있습니다.
산점도는 데이터 분석에서 변수 간 관계를 빠르게 파악하고, 예측 모델을 설계할 때 중요한 단서를 제공합니다.
FineBI는 사용자가 복잡한 데이터도 쉽게 시각화할 수 있도록 다양한 차트와 도구를 제공합니다. 산점도뿐만 아니라 막대 차트, 선 그래프, 박스 플롯 등 60가지 이상의 차트 유형을 지원합니다. 사용자는 드래그 앤 드롭 방식으로 원하는 데이터를 선택하고, 몇 번의 클릭만으로 산점도를 만들 수 있습니다. FineBI의 산점도에서는 점의 색상, 크기, 스타일을 자유롭게 조정할 수 있어, 여러 변수의 영향을 동시에 시각화할 수 있습니다.
FineBI는 실시간 데이터 분석 기능을 갖추고 있다. 데이터가 바뀌면 차트도 즉시 업데이트다. 여러 데이터 소스를 통합해 한 번에 비교 분석할 수 있으며, 대시보드에 다양한 시각화 자료를 배치해 전체적인 흐름을 쉽게 파악할 수 있습니다. 팀원들과 대시보드를 공유하거나, 협업 기능을 활용해 함께 분석을 진행할 수도 있다.
FineBI의 시각화 기능을 활용하면 데이터의 숨은 패턴과 변수 간 관계를 빠르게 발견할 수 있습니다. 누구나 복잡한 수식 없이도 데이터의 의미를 쉽게 이해하고, 더 나은 의사결정을 내릴 수 있습니다.

상관계수는 일상과 다양한 분야에서 변수 간 관계를 분석하는 데 사용됩니다.
2014년, 국민건강보험공단은 담배회사와의 손해배상 소송에서 흡연과 폐암 사이의 관계를 분석했습니다. 법원은 두 변수 사이에 상관관계가 있음을 인정했지만, 인과관계가 명확하지 않다는 이유로 손해배상 청구를 받아들이지 않았습니다. 이 사례는 통계적 관계 분석이 법적 판단에도 중요한 역할을 한다는 점을 보여줍니다.
경제학에서는 소비자 지출과 경제 성장률 사이의 관계를 분석해 미래 경제를 예측합니다.
일상에서는 아이스크림 판매량과 기온, 습도와의 관계를 수치로 확인할 수 있습니다.
아래는 대표적인 상관관계 예시입니다.
FineBI는 기업과 조직에서 데이터 분석을 쉽게 할 수 있도록 돕습니다.
사용자는 다양한 데이터 소스를 연결해 여러 변수의 관계를 빠르게 분석할 수 있습니다.
FineBI의 분석 메뉴에서 상관관계 분석을 선택하면, 복잡한 계산 없이 결과를 바로 확인할 수 있습니다.
FineBI는 실시간 데이터 분석 기능을 제공합니다. 데이터가 변경되면 대시보드와 차트가 즉시 업데이트됩니다.
팀원들은 대시보드를 공유하며, 협업 기능을 통해 함께 분석을 진행할 수 있습니다.
예를 들어, 마케팅 부서는 광고비와 매출의 관계를 실시간으로 분석해 광고 전략을 조정합니다.
생산 부서는 온도와 불량률의 관계를 파악해 품질 관리에 활용합니다.
아래 표는 FineBI를 활용한 상관관계 분석의 장점을 정리한 것입니다.
| 기능 | 설명 | 활용 예시 |
|---|---|---|
| 데이터 통합 | 여러 데이터 소스를 한 번에 연결 | ERP, CRM, 엑셀 데이터 분석 |
| 실시간 분석 | 데이터 변경 시 즉시 결과 반영 | 실시간 매출·재고 분석 |
| 협업 지원 | 대시보드 공유 및 공동 편집 | 팀별 프로젝트 분석 |
| 시각화 | 다양한 차트로 관계를 직관적으로 표현 | 산점도, 박스 플롯 활용 |
FineBI를 활용하면 누구나 쉽게 변수 간 관계를 분석하고, 빠른 의사결정을 내릴 수 있습니다.
상관계수는 두 변수 사이에 일정한 관계가 있는지, 그리고 그 관계가 얼마나 강한지 수치로 보여줍니다. 하지만 두 변수 사이에 상관관계가 있다고 해서 한 변수가 다른 변수의 원인이 된다고 단정할 수 없습니다. 인과관계는 한 변수가 변할 때 다른 변수에 직접적인 영향을 주는 관계를 의미합니다.
예를 들어, 모짜렐라 치즈 소비량과 토목공학 박사학위 취득자 수 사이에는 높은 상관계수가 나타난 적이 있다. 두 변수 모두 시간이 흐르면서 함께 증가했기 때문입니다. 하지만 치즈를 많이 먹는다고 박사학위를 더 많이 받는 것은 아닙니다. 이처럼 두 변수 모두에 영향을 주는 제3의 요인(혼동요인)이 존재할 수 있습니다.
상관관계는 인과관계와 다르다. 두 변수 사이에 관계가 있다고 해도, 한 변수가 다른 변수의 원인이라는 증거는 아닙니다.
상관관계와 인과관계를 혼동하면 잘못된 결론에 이를 수 있습니다. 1949년 미국의사 벤자민 샌들러는 아이스크림 소비량과 소아마비 발병률이 함께 증가하는 현상을 관찰했습니다. 하지만 두 변수 모두 여름이라는 계절적 요인에 영향을 받았을 뿐, 아이스크림이 소아마비를 유발한 것은 아니었습니다.
이처럼 제3의 변수(잠복 변수, 혼동요인)가 두 변수 모두에 영향을 줄 수 있습니다. 사회경제적 지위와 뇌종양 진단 확률, 예방접종과 자폐증 진단 등에서도 상관관계가 인과관계로 오해되는 사례가 있습니다.
연구자들은 인과관계를 명확히 밝히기 위해 무작위 통제 시험(RCT)과 같은 엄격한 실험 설계를 사용합니다. 실험을 통해 변수 간의 직접적인 영향 관계를 확인할 수 있습니다.
상관관계가 높다고 해서 반드시 인과관계가 있는 것은 아닙니다. 항상 다양한 가능성을 고려해야 합니다.
이상치는 데이터에서 다른 값들과 크게 다른 값을 의미합니다. 이상치가 있으면 분석 결과가 크게 달라질 수 있습니다. 예를 들어, 한 반의 학생 키를 조사할 때 대부분이 150~170cm인데 한 명이 210cm라면, 이 값이 전체 평균과 관계 분석에 큰 영향을 줍니다. 피어슨 상관계수는 이상치에 매우 민감합니다. 이상치가 포함되면 실제보다 관계가 강하거나 약하게 나타날 수 있습니다.
분석을 시작하기 전에 산점도와 같은 그래프로 데이터를 시각화하면 이상치를 쉽게 찾을 수 있습니다. 이상치가 발견되면, 그 원인을 확인하고 필요에 따라 데이터를 정제해야합니다. 스피어만 상관계수는 순위 기반이기 때문에 이상치의 영향을 덜 받습니다.
데이터에 이상치가 많으면 분석 결과를 신뢰하기 어렵다. 항상 데이터를 먼저 살펴보고, 이상치가 있는지 확인하는 습관이 필요합니다.
상관계수는 두 변수 사이의 선형 관계를 측정합니다. 하지만 실제 데이터에서는 곡선 형태의 비선형 관계가 자주 나타난다. 예를 들어, 공부 시간이 너무 적거나 너무 많으면 시험 점수가 낮고, 적당할 때 가장 높을 수 있습니다. 이런 경우 산점도를 보면 곡선 모양이 나타납니다.
이때 피어슨 상관계수는 0에 가까운 값을 보일 수 있습니다. 하지만 실제로는 두 변수 사이에 뚜렷한 관계가 존재합니다. 산점도를 먼저 확인하면 비선형 관계를 쉽게 파악할 수 있습니다.
스피어만 상관계수는 순위 정보를 사용해 비선형 관계도 어느 정도 측정할 수 있습니다. 피어슨 상관계수로 관계가 약하게 나타나더라도, 스피어만 상관계수를 활용하면 숨겨진 패턴을 찾을 수 있습니다.
산점도와 스피어만 상관계수를 함께 사용하면 비선형 관계도 놓치지 않고 분석할 수 있습니다.
상관분석을 할 때는 데이터의 특성을 잘 이해해야합니다. 두 변수 모두 등간 척도나 비율 척도로 측정되어야합니다. 예를 들어, 온도(섭씨)나 키(센티미터)는 비율 척도에 해당합니다.
피어슨 상관계수는 두 변수가 연속형이고 정규분포를 따른다는 가정이 필요합니다. 데이터가 정규분포를 따르지 않거나, 순위형 변수일 때는 스피어만 상관계수를 사용하는 것이 더 적합합니다.
샘플 크기가 너무 작으면 분석 결과가 불안정해질 수 있습니다. 이상치가 많거나 데이터가 정규성을 충족하지 않으면 해석에 주의해야 합니다.
분석 전에는 데이터의 분포, 척도, 이상치, 샘플 크기를 꼼꼼히 확인해야 합니다. 적절한 상관계수 방법을 선택하면 분석의 신뢰도를 높일 수 있습니다.
데이터의 특성을 이해하고, 상황에 맞는 분석 방법을 선택하는 것이 올바른 해석의 첫걸음입니다.
상관계수는 두 변수 사이의 관계를 수치로 보여주며, 데이터 분석과 실생활에서 중요한 판단 기준이 다. FineBI와 같은 BI 도구는 누구나 손쉽게 변수 간 관계를 분석하고, 실무에 바로 적용할 수 있도록 돕습니다.
해석할 때는 다음과 같은 점에 주의해야 합니다.
- 결과의 재현 가능성을 확인합니다.
- 등분산성, 이상점, 자료절단, 선형성 가정 위반 여부를 점검합니다.
아이스크림 판매량과 수영장 사고 증가처럼, 상관관계가 인과관계를 의미하지 않는 사례도 많다. 인과관계를 확인하려면 추가적인 연구와 검증이 필요합니다. 데이터의 숨은 의미를 찾고 싶다면, 직접 상관계수 분석에 도전해봅시다.
FanRuan
https://www.fanruan.com/ko-kr/blogFanRuan은 FineReport의 유연한 리포팅, FineBI의 셀프서비스 분석, FineDataLink의 데이터 통합 기능을 바탕으로 전 산업 분야에 걸쳐 강력한 BI 솔루션을 제공합니다. FanRuan의 올인원 플랫폼은 조직이 원시 데이터를 실행 가능한 인사이트로 전환하여 비즈니스 성장을 실현할 수 있도록 강력하게 지원합니다.
상관계수는 두 변수 사이의 관계가 얼마나 강하고 어떤 방향인지 숫자로 보여줍니다. 값이 1에 가까우면 함께 증가하거나 감소합니다. 0에 가까우면 관계가 거의 없습니다.
상관계수 분석은 두 변수의 연관성을 알고 싶을 때 사용합니다. 예를 들어, 공부 시간과 성적, 광고비와 매출처럼 서로 영향을 주는지 확인할 때 쓴다.
FineBI에서는 데이터셋을 불러온 뒤, 분석 메뉴에서 상관계수 분석을 선택합니다. 결과는 표와 차트로 바로 확인할 수 있습니다. 복잡한 수식 없이도 쉽게 분석이 가능합니다.
상관계수 값이 0이면 두 변수 사이에 선형적인 관계가 없다는 뜻입니다. 한 변수가 변해도 다른 변수는 일정한 패턴 없이 움직입니다.
상관계수는 두 변수의 관계만 보여줍니. 한 변수가 다른 변수의 원인이라는 뜻은 아닙니다. 인과관계를 확인하려면 추가 실험이나 분석이 필요합니다.
이상치는 상관계수 값을 크게 바꿀 수 있습니다. 한두 개의 특이한 값이 전체 결과를 왜곡할 수 있습니다. 분석 전에 이상치를 확인하고 처리해야 합니다.
상관계수 분석 결과는 예측, 문제 해결, 의사결정에 쓸 수 있습니다. 예를 들어, 마케팅 전략, 건강 관리, 학습 방법 개선 등 다양한 분야에서 활용합니다.
궁금한 점이 더 있다면 FineBI 공식 홈페이지에서 자료를 확인할 수 있습니다.