인과관계

인과관계란 두 개 혹은 그 이상의 변수 간의 원인과 결과의 관계를 의미한다. 이때 변수란 대상이 될 수도 있고 사건이 될 수도 있다.(단어가 변수가 될 수도 있고, 문장이 변수가 될 수도 있다)
 
변수들이 형성하는 다양한 관계 중 인과관계는 비즈니스면이던 과학면이던 가장 중요한 관계로 다루어진다.
 
인과관계를 이야기할 때 因이 되는 부분을 근거, 원인, 이유 등으로 부르기도 하는데, 근거, 이유란 행동이나 언행이 결론에 이르게 된 까닭, 원인이란 ‘어떤 사물이나 상태를 변화시키거나 일으키게 하는 근본이 된 일이나 사건’을 의미한다.
 
이처럼 ‘원인’은 일이나 사건을 가리킨다는 점에서 객관적인 사실을 묻는 데 반해 ‘근거, 이유’는 다소 주관적인 사실을 묻는다는 데에 차이가 있다고 할 수 있다.

가설과 인과관계

가설이란 둘 이상의 변인들 간의 관계에 관한 일종의 추측이다. 이때, 관계란 인과관계, 상관관계, 대등관계, 포함관계, 양의관계, 음의관계 등 다양한 관계를 포괄한다.
 
따라서, 쉬운 말로 하면 인과관계가 아직 검증되지 않았다면 인과관계 자체가 가설이다. 증명되지 않은 인과관계는 가설에 포함되고, 증명된 인과관계는 참인 명제, 사실이 된다.
 
가설을 통해서 두 변수 간의 관계를 효과적으로 증명할 수 있다.

위의 그림에서 R이라는 결과에 기인한 모든 원인을 찾아내는 것은 매우 비효율적고 힘든 일이다. 결과에서 원인을 찾아내는 방향이 아니라 원인에 대해 추측하고 이러한 원인 때문에 그러한 결과가 도출된 것은 아닐까라고 역발상하는 것이 가설의 힘이다. 가설에 대한 구체적 내용은 다음의 링크에서 확인할 수 있다.

인과관계의 타당성 검증

인과관계가 타당성을 갖기 위해서는 아래의 3가지 조건이 만족되어야 한다.

시간적 우선순위(time order)

원인이 되는 변수가 먼저 변화된 후에 종속변수의 변화가 이루어져야 한다는 것이다. 독립변수가 종속변수에 영향을 미치는 것이므로 독립변수의 강도(수준) 변화가 먼저 일어나야 하는 것은 당연한 이치이다. 많은 사람들은 흡연(독립변수)이 폐암(종속변수)의 주된 원인으로 생각하고 있다. 시간적인 우선순위의 가정은 장래의 사건이 과거나 현재의 사건을 결정할 수 없다는 사고에서 비롯되었다고 할 수 있다. 예컨대 음주행위는 취하게 되는 원인으로 시간적으로 취한 결과에 대하여 우선하는 것을 누구나 쉽게 알 수 있다.
 
시간적 우선순위가 성립하지 않는 가설의 예로, 일이 없어서 일을 하지 않는다 라는 가설이 있다. 이는 일이 없다라는 변수와 일을 하지 않는다라는 변수 사이에 시간적 우선순위가 성립하지 않는다. 일을 하지 않아서 일이 없는것인지, 일이 없어서 일을 하지 않는 것인지 판단할 수 없다.

동시발생조건(concomitant variance)

병발발생조건은 원인변수(독립변수)와 결과변수(종속변수)의 값이 둘 다 변화해야 한다는 것이다. 독립변수나 종속변수 중의 어느 하나가 변하지 않고 고정되어 있으면 두 변수간의 인과관계는 성립될 수 없다. 이를 통계적으로 검증하기 위해서는 얻어진 자료의 변화가 서로 공분산 정도 또는
상관관계가 존재해야 하는데 이 때 상관도가 통계적으로 유의성이 있어야 하는 동시에 그 강도가 일정한 수준 이상으로 크게 나타나야 한다. 예를 들어, 지능지수(IQ)가 높은 학생의 성적이 우수하다면 지능지수는 성적의 원인이 될 수 있다.
 
다만 동시발생 조건에서 주의해야 할점은 인과관계가 존재하면 상관관계도 존재하지만, 상관관계가 존재한다고 인과관계가 반드시 존재하지는 않는다는 것이다.예를 들어, 목사의 수와 주정뱅이의 수가 양의 상관관계가 있다는 것을 발견한 통계학자가, 「주정뱅이가 늘었기 때문에 목사의 수가 늘었다」라는 인과관계를 주장했다. 이는 상관관계를 인과관계로 판단한 대표적인 오류로, 단순히 인구가 증가하여 주정뱅이도, 목사의 수도 늘어난 현상을 인과관계로써 옳지 않게 해석한 대표적인 예다.

외생변수의 통제(control extraneous variables)

인과관계는 원인변수인 독립변수 이외의 결과변수인 종속변수에 영향을 미칠 수 있는 제 3의 변수의 영향을 제거한 상태에서 독립변수와 종속변수간의 관계가 검증되어야 한다. 제 3의 변수를 통제한 후 독립변수와 종속변수 간의 관련성을 비허위성 이라고 한다. 일반적으로 실험연구에서 외생변수가 독립변수와 종속변수에 미치는 영향을 제거해야 독립변수와 종속변수 사이의 인과관계를 정밀하게 파악할 수 있다. 인과관계가 성립하기 위해서는 제 3의 변수로 설명할 수 있는 허위적인 관계가 존재해서는 안된다.

[예1]
가설1: 20~40대 중 한 달에 한 번 이상 택시를 타는 비율은 30%이다.(두 변인간의 관계를 나타냄)
가설2: 내 주변 친구들 10명중 3명정도는 한 달에 한 번 이상 택시타기 때문에, 20~40대 중 한 달에 한 번 이상 택시를 타는 비율은 30%이다.
(가설2는 가설1을 결론으로 하는 인과관계에 대한 가설)

가설2에 대해 위의 3가지로 타당성을 검증
- 시간적 우선순위: 나의 감각치가 형성된 이후 가설이 존재하므로 타당하다.
- 동시발생조건: 내 주변 친구들이 택시를 타는 횟수가 늘어나면 20-40대 전체의 택시 타는 횟수가 증가하는가?
   ➡거짓. 
- 외생변수 통제: 경제력, 성향등의 외생변수를 모두 통제할 경우에도 위의  가설2가 성립하는가?
   ➡거짓. 경제력은 가설2의 인관관계에 영향을 미치는 주요 변수중 하나. 따라서, 20-40대를 유효한 축으로 나눌 필요있음. 경제정도라던가.

이때 주의할 점은, 가설2에 대한 타당성을 검증하더라도 어디까지나 가설2에 대한 증명이지, 가설1이 참인지 거짓인지는 증명되지 않는다.
가설2는 가설1이 참임을 전제로 하고 만들어진 가설이다. 가설1을 증명하기 위해서는 별도의 과학적 방법을 통한 조사와 연구가 필요할 것이다.

따라서, 나의 감각치라는 근거는 타당하지 않다.

(Appendix)명제의 타당성 검증

인과관계와 직접적인 연관은 없지만, 실전에서 인과관계의 타당성을 검증할 시 유용하게 사용되는 방법이다. 인과관계란 두 명제 간의 관계인데, 애초에 어느 한 쪽의 명제가 사실이 아니라면 인과관계도 성립되지 못한다. 따라서, 명제의 사실여부가 인과관계의 타당성 검증보다 우선되어야 하는 검증이다.
 
최근 프로젝트에서 상대측 변호사가 아래와 같은 주장을 해왔다.
순자산가치로 자산 매각 -> 공정가치와 순자산가치와의 차액 발생 -> 배임과 같은 형사상 리스크 발생
 
언뜻 보면 순자산가치로 자산 매각 -> 공정가치와 순자산가치와의 차액 발생의 인과도 공정가치와 순자산가치와의 차액 발생 -> 배임과 같은 형사상 리스크 발생인과도 꽤나 높은 확률의 인과처럼 보이기 때문에, 설득력있는 주장인 것 같지만, 각 명제의 타당성을 검증해보면 옳지 않은 주장이라는 것을 알 수 있다.
 
문제가 되는 명제는 공정가치와 순자산가치와의 차액 발생 인데, 기업의 공정가치란 경우에 따라서 여러가지 벨류에이션에 의존할 수 있는 가치이기에 옳은 명제일 수도 있고, 틀린 명제일 수도 있다. 예를 들어, DCF와 같은 벨류에이션을 공정가치로 인정하게 되면 해당 명제는 사실이 되지만, 보충적 평가방법과 같은 벨류에이션을 공정가치로 인정하게 되면 해당 명제는 거짓이 된다.
 
우리 측에서는 해당 명제의 거짓을 규명하는 로직을 통해 상대의 로직을 격파할 수 있었다.

인과관계 분석의 3가지 시점: 구조화構造化 심화深化 세분화細分化

인과관계의 구조화

인과관계의 구조화란, 果의 원인이 되는 因을 MESE로 구조화하여 누설없이 파악하는 것이다. 인과관계의 심화와 인과관계의 세분화가 잘되어도 인과관계의 누설이 존재하면 인과관계 분석에 치명적인 허점이 생긴다. 구조화의 방법은 다음의 링크에서 확인할 수 있다.

유럽 지역의 사입코스트가 높은 원인 분석
사입코스트 = 원재료코스트 + 중간 수수료 코스트 + 운송코스트

사입코스트-----┌원재료코스트─ 안전기준이 높아 원재료 가격 자체가 높다.
상승요인       |
               |
               ├중간 수수료 코스트─ 중간 수수료 가격 : null
               |                           └ 중간 수수료 횟수 : 안전기준이 높아 프로세스가 복잡하다.
               |
               └운송코스트─ 중국과의 거리가 멀어 운송코스트가 비싸다.
                          └ 땅덩어리가 넓어 운송코스트가 비싸다.

인과관계의 심화

인과관계의 심화란 원인에 대해 why so?의 질문을 반복해가며 가장 깊은 곳에 존재하는 핵심적인 원인을 파악해내는 것이다.

위의 Why 트리에서 제품배송 문의 증가가 콜센터 VOC의 증가로 이어졌다 라는 가설은 반은 맞고 반은 틀렸다. 제품배송 문의 증가는 핵심적인 원인이 아니기 때문이다. 피상적인 원인은 문제해결에 아무런 도움이 되지 않는다. 그에 대한 원인을 더 깊게 파고들어가면, 배송기사 부족문제가 있고 이를 더욱 파고 들어가면 배송기사 낮은 지원률과 높은 이탈률배송기사에 대한 낮은 처우와 같은 핵심적인 문제의 원인에 다다를 수 있다. 이처럼 문제의 원인을 더욱 깊게 파고 드는 것을 인과관계의 심화라고 한다.
 
앞서 보여준, Why트리에서 세로축이 구조화의 양이라면, 인과관계의 심화는 가로축을 넓혀가는 것을 의미한다.

인과관계의 세분화(프로세스 사고)

인과관계의 세분화란 이미 설정된 인과 사이를 더욱 잘게 쪼개보는 것이다. 인과관계를 더욱 촘촘히 분해해 분해된 인과의 가능성을 평가하는 것이다. 이때 촘촘히 분해된 인과사이에 가설적 확률을 부여함으로써, 인과의 타당성을 수치화할 수도 있다.

인과관계의 세분화의 장점

  1. 불분명한 인과관계에 대한 납득이 가능해진다. 이는 특히 인과관계에 관한 가설에 대해 대략적인 근거(실제 검증 前)를 제시할 때 유용하게 활용된다.
1. 가설: 금리가 상승했기 때문에, 부동산 가격이 하락할 것이다.

금리가 상승했다.
(100%) -> 대출 금리가 상승했다.
(80%)  -> 돈을 빌리면 갚아야 되는 돈이 많아진다.
(100%) -> 대출이 감소한다.
(80%)  -> 부동산 구매력이 하락한다.
(100%) -> 부동산 수요가 감소한다.
(100%) -> 부동산 가격이 하락한다.

1 * 0.8 * 1 * 0.8 * 1 * 1 = 0.64 = 약 64%

2. 가설: 원유값이 하락하여, 베스킨라벤스의 드라이아이스 제공량을 줄일 것이다.

원유값 하락
(90%)  -> 원유제조 공장의 가동률 하락
(100%) -> 원유제조 공정에서 획득되는 이산화탄소량 하락
(90%)  -> 인산화탄소를 원료로하는 드라이아이스의 생산 하락
(90%)  -> 드라이아이스 구매가 어려움
(90%)  -> 베스킨라벤스의 드라이아이스 제공량 하락

0.9* 1 * 0.9 * 0.9 * 0.9 = 0.64 = 약 65%

3. 가설: 인기없는 소프트드링크의 종류를 줄이면, 매출이 상승할 것이다.

인기없는 소프트드링크의 종류를 컷
(100%) -> 인기있는 소프트드링크의 진열 스페이스 증가
 └(70%) -> 고객이 소프트드링크를 선택하기 쉬워짐
   (80%) -> 소프트드링크의 매출증가    
 └(100%) -> 상품이 소진될 가능성이 줄어듬
   (70%) -> 소프트드링크의 매출증가 
  1. 인과관계의 타당성을 따지기 쉬워진다.
가설: 해변에 놓여진 출입 금지 팬스를 제거 했기 때문에, 2명의 익사자가 발생했다.

해변에 놓여진 출입 금지 팬스 제거
(80%) -> 해변에 입장
(3%) -> 바다에 입장(안개가 자욱하고 파도가 거셀시)
(10%) -> 익사

0.8*0.03*0.1 = 0.0024 = 약0.24%

「해변에 놓여진 출입금지 팬스 제거」➡「익사」라는 인과관계의 타당성을 검증하는 것보다
「해변에 놓여진 출입금지 팬스 제거」➡「해변에 입장」이라는 인과관계의 타당성을 검증하는 것이 쉽다.

인과관계와 상관관계

한 변수가 변할 때 다른 변수도 변한다면 두 변수 사이엔 상관관계가 있다고 볼 수 있다. 그러나 상관관계에서의 두 변수 사이엔 인과적 선후관계가 없다.
 
상관관계를 인과관계로 오해하기 쉽다. 인관관계의 타당성 검증을 통해 이러한 논리적 결함을 방지할 수 있다.

[예1]
어떤 제품이 가격이 낮고 시장점유율이 높은 경우를 생각해보자. 이 결우 가격이 낮아서 시장 점유율이 높아졌는지, 혹은 높은 시장점유율로 인해 규모의 경제가 나타나 가격이 낮아졌는지 명확하게 알수 없다.

[예2]
모기를 많은 해에는 아이스 크립 매출이 많아진다?
2007년에는 모기가 유달리 많았다. 그래서 한 단체에서 통계치를 내던중 놀라운 사실이 발견되었다
2002년 2003년 2004년 2005년 2006년 2007년 아이스크림과 모기의 수의 관계는 정확히 양의 상관 관계를 띠고 있었다.

인과루프 사고

인과루프 사고는 논리적 사고의 확장된 형태이다. 논리적 사고는 원인-결과의 관계를 명확히 하는 것을 의미한다. 인과루프 사고는 논리적 사고를 기반으로 나아가서 Reason-Result Web을 전체적으로 파악하는 사고이다.

인과관계를 생각할 때는, 보통 단편적인 인과관계만을 고려하기 쉽다. 이것이 속히 말하는 머리 좋다는 사람과 범인의 차이이다. 전체적인 인과관계는 복수개의 단편적 인과관계의 연결로 이루어져 있다. 어떠한 인과간계든지 간에 전체적인 인과관계의 망을 머리 속에 그려놓고 단편적인 인과관계는 전체적인 인과관계 망 속에서 겨우 한 부분에 속하지 않음을 인지할 필요가 있다.

예를 들어, A빌딩이 붕괴되는 사건이 발생했다. 이에 대한 원인 중 하나로 관리감독에 허점이 있었다는 가능성에 대한 가설을 제시할 수 있다. 또한 A빌딩 붕괴로 인한 결과로 대통령 탄핵이라는 가설을 제시할 수도 있다. 각 가설의 가능성은 실제 검증전 아래와 같은 인과관계의 세분화로 추측이 가능하다.

가설: 관리감독의 허점 -> A빌딩이 붕괴
관리감독의 허점
(70%) -> 건축규정 위반(낮은 질의 자재사용, 부실설계)
(100%) -> 예측 보다 빠른 노후화
(100%) -> 건물 붕괴

가설: A빌딩이 붕괴 -> 대통령 탄핵
A빌딩이 붕괴
(100%) -> A빌딩의 시공사와 정치인B 간의 정경유착 발견
(100%)-> 정치인B와 대통령 친인척 간의 유착 발견
(100%)-> 현 대통령이 친인척에게 유착 지시 포착
(40%)-> 국민들의 탄핵운동
(70%)-> 대통령 탄핵

출처

+ Recent posts