초급 투자기초

상관관계와 인과관계 기초: 투자 분석에서의 통계적 관계 이해

InvestHub

InvestHub 편집팀이 교육 목적과 금융소비자 보호 원칙에 맞춰 검수한 콘텐츠입니다. 투자 권유가 아닌 일반 정보이며, 최종 판단은 본인 책임입니다.

투자 유의사항

본 콘텐츠는 투자 정보 제공을 목적으로 하며, 특정 주식이나 금융상품의 매매를 권유하지 않습니다. 모든 투자에는 위험이 따르며, 투자 결정은 본인의 판단과 책임으로 이루어져야 합니다.

**상관관계(Correlation)**는 두 변수가 함께 변하는 정도를 측정하는 통계적 지표이며, **인과관계(Causation)**는 한 변수가 다른 변수의 변화를 일으키는 원인-결과 관계입니다. 투자 분석에서 **"상관관계가 인과관계를 의미하지 않는다"**는 원칙은 매우 중요합니다. 데이터 기반 투자 판단 시 이 둘을 구분하는 능력이 투자 성과에 결정적인 영향을 미칩니다.

상관관계와 인과관계의 차이

핵심 개념 비교

[상관관계 vs 인과관계]

상관관계 (Correlation):
- 두 변수가 함께 변하는 경향
- 방향성: 양(+) 또는 음(-)
- 강도: -1 ~ +1
- "A와 B는 함께 움직인다"

인과관계 (Causation):
- 한 변수가 다른 변수를 변화시킴
- 원인 → 결과의 방향성
- 시간적 선후 관계 존재
- "A가 변하면 B가 변한다"

비교표

구분상관관계인과관계
의미동시 변화의 정도원인-결과 관계
방향성대칭적 (A↔B)비대칭적 (A→B)
확인 방법통계 분석실험 또는 엄밀한 추론
실수 가능성거짓 양성 흔함확인이 어려움
투자 활용포트폴리오 분산투자 전략 수립

상관관계의 이해

상관계수(Pearson Correlation Coefficient)

[상관계수 해석 기준]

상관계수(r)    | 강도          | 의미
--------------|--------------|----------------
+0.7 ~ +1.0   | 강한 양의 상관 | 같은 방향으로 강하게 움직임
+0.3 ~ +0.7   | 뚜렷한 양의 상관 | 같은 방향으로 움직임
+0.1 ~ +0.3   | 약한 양의 상관  | 약하게 같은 방향
-0.1 ~ +0.1   | 거의 무상관    | 관계 없음
-0.3 ~ -0.1   | 약한 음의 상관  | 약하게 반대 방향
-0.7 ~ -0.3   | 뚜렷한 음의 상관 | 반대 방향으로 움직임
-1.0 ~ -0.7   | 강한 음의 상관  | 반대 방향으로 강하게 움직임

투자 자산 간 상관관계 예시

자산 조합예상 상관관계의미
삼성전자 vs SK하이닉스+0.7 ~ +0.9같은 산업, 강한 양의 상관
KOSPI vs S&P500+0.3 ~ +0.6글로벌 연관성
주식 vs 채권-0.3 ~ +0.2전통적 분산 효과
금 vs 주식-0.2 ~ +0.1안전자산 대 위험자산
원/달러 vs 수출주-0.5 ~ -0.7환율 상승→수출주 유리

인과관계 추론의 어려움

인과관계를 성립하는 조건

[인과관계 성립 조건 (Bradford Hill 기준)]

1. 시간적 선후성: 원인이 결과보다 먼저 발생
2. 강도: 원인과 결과의 관계가 강함
3. 일관성: 여러 연구에서 동일한 결과
4. 생물학적 개연성: 메커니즘이 설명 가능
5. 실험적 증거: 통제된 조건에서 재현
→ 모든 조건을 만족해야 인과관계로 인정

교란변수(Confounding Variable)

[교란변수 사례]

관찰: 아이스크림 판매량 ↑ ↔ 익사 사고 ↑
오해: 아이스크림이 익사를 유발한다?

실제: 기온(교란변수)이 두 변수 모두에 영향
  기온 ↑ → 아이스크림 판매량 ↑
  기온 ↑ → 야외 물놀이 ↑ → 익사 사고 ↑

투자 사례:
관찰: 주가 ↑ ↔ 맑은 날씨 빈도 ↑
오해: 날씨가 주가를 결정한다?
실제: 경제 호황(교란변수)이 소비 심리와 주가에 동시 영향

투자에서의 흔한 오해

허위상관의 투자 사례

[투자 분석에서의 허위상관 주의사항]

사례 1: "이 지표가 하락하면 항상 주가가 하락했다"
→ 과거 데이터에서의 우연한 일치일 수 있음
→ 샘플 기간을 변경하면 관계가 사라질 수 있음

사례 2: "이 기업 실적이 좋으면 경쟁사 실적도 좋다"
→ 산업 전체의 호황이라는 공통 원인
→ 한 기업이 다른 기업의 실적을 결정하는 것은 아님

사례 3: "금리 인상 후 항상 주가가 하락했다"
→ 다른 거시 요인의 동시 영향
→ 금리가 주가 하락의 유일한 원인이 아닐 수 있음

데이터 마이닝의 함정

함정설명대응 방안
과적합(Overfitting)과거 데이터에만 맞는 모델샘플 외 검증
데이터 스누핑여러 지표를 시도하여 우연한 관계 발견사전 가설 설정
생존 편향성공한 사례만 분석전체 데이터 포함
기간 의존성특정 기간에만 성립다양한 기간 검증

올바른 분석 접근법

상관→인과 추론 단계

[투자 분석에서 권장하는 접근법]

Step 1: 상관관계 확인
  - 통계적으로 유의미한 상관관계인가?
  - 충분한 데이터 기반인가?

Step 2: 시간적 선후 관계 확인
  - 원인 변수가 결과 변수보다 선행하는가?

Step 3. 교란변수 통제
  - 제3의 변수가 동시에 영향을 미치지 않는가?
  - 다변량 분석으로 통제 가능한가?

Step 4: 경제적 개연성 확인
  - 왜 그런 관계가 존재하는지 논리적 설명 가능한가?

Step 5: 외부 검증
  - 다른 시장이나 기간에서도 동일한 관계가 성립하는가?

핵심 정리

면책 조항: 본 내용은 투자 교육 목적으로 작성되었으며, 특정 투자 상품의 추천이나 매수·매도를 권유하는 것이 아닙니다. 투자에는 위험이 따르며, 원금 손실의 가능성이 있습니다. 투자 결정은 본인의 판단과 책임으로 이루어져야 합니다.

자주 묻는 질문

두 변수가 상관관계가 높으면 한 변수가 다른 변수의 원인인가요?
아닙니다. 상관관계가 높다는 것은 두 변수가 함께 변하는 경향이 있다는 의미일 뿐, 한 변수가 다른 변수의 원인이라는 의미가 아닙니다. 두 변수 모두에 영향을 미치는 제3의 변수(교란변수)가 있을 수 있으며, 우연의 일치일 수도 있습니다. 인과관계를 확인하려면 통제된 실험이나 엄밀한 인과 추론 방법이 필요합니다.
투자에서 상관관계 분석은 어떻게 활용되나요?
포트폴리오 구성에서 가장 널리 활용됩니다. 상관관계가 낮거나 음의 상관관계를 가진 자산을 조합하면 분산 투자 효과로 포트폴리오의 변동성을 줄일 수 있습니다. 또한 특정 지표와 주가 간의 상관관계를 분석하여 투자 아이디어를 검증하거나, 경제 지표 간의 관계를 파악하는 데 사용됩니다.
허위상관(Spurious Correlation)이란 무엇인가요?
허위상관은 두 변수 사이에 통계적으로 유의미한 상관관계가 나타나지만, 실제로는 직접적인 관계가 없는 현상입니다. 제3의 변수(교란변수)가 두 변수에 동시에 영향을 미치거나, 데이터의 우연한 패턴으로 발생합니다. 예를 들어 아이스크림 판매량과 익사 사고의 상관관계가 높지만, 이는 여름 날씨라는 제3의 변수가 원인입니다.

참고 자료

  1. 한국은행 경제통계 - 한국은행
  2. 금융감독원 금융교육원 - 금융감독원
#상관관계 #인과관계 #통계 #투자분석

※ 본 콘텐츠는 투자 정보 제공을 목적으로 하며, 특정 주식이나 금융상품의 매매를 권유하지 않습니다. 모든 투자에는 위험이 따르며, 투자 결정은 본인의 판단과 책임으로 이루어져야 합니다.