Role of Causal Inference - 책 Civil Action을 읽고난 느낌

Role of Causal Inference : Civil Action을 읽고 나서


  코로나로 인해 좋은점 중 하나는 책을 읽을 시간이 더 많아졌다는 것이 있다. 이번에 읽은 책은 Jonathan Harr 가 쓴 Civil Action 이었다. 이 책은 항상 읽고싶었는데, 왜냐하면 이 책에는 하버드 생물통계학과장이었던 Dr. Marvin Zelen 교수님의 연구가 배경에 있기 때문이다. (그래서 하버드 생물통계학과에서는 같이 모여 존 트라볼타가 주연한 영화를 같이 보기도 했다. )



 책의 간단한 줄거리를 이야기해보자면 1980년대 Woburn이라는 도시에 살던 어린 아이들이 갑자기 백혈병에 집단으로 걸리기 시작하는데, 이러한 원인이 "W.R.Grace 라는 회사와 Beatrice 회사가 Woburn이라는 도시에 Trichloroethylene (TCE) 라는 화학물질을 강에 무단 방류했기 때문이다"라는 주장을 둘러싼 법정 공방 이야기이다. 

  이 민사 소송(Civil action)은 1980년대에 가장 많은 이목이 집중 된 법정 공방이었으며 이에 관련한 수많은 연구가 진행되었다. 그리고 하버드 생물통계학과에서는 이와 관련한 아주 중요한 논문을 발표한다. Journal of American Statistical Association 에서 발간된 An Analysis of Contaminated Well Water and Health Effects in Woburn, Massachusetts 논문은 Woburn에서 발생한 백혈병은 비이상적으로 그 발병률이 높으며, TCE로 오염된 발원지와 백혈병 사이에는 인과관계가 있다는 것을 결론내렸다.

 하지만, "통계적"으로 증명된 인과관계는 이 민사소송에서는 사용되지 않았다.
-------------------
<소설 속>

 Judge Skinner: "It occurred to me that you may intend to use a statistical analysis to prove causation by showing us the unlikelihood of so many instances of disease in a particular area. The question is whether evidence which would not be the proper basis for a verdict becomes proper because an expert blesses it and says, 'I, as an expert, would be willing to take this bet.' If that's going to be the case, I'd like to have some advance briefing on exactly how it's going to work. Is that going to be part of your case?"

Jan Schlichtmann: "Obviously- our case will be proven on clinical grounds, Your Honor. I will not use statistics to prove causation."
---------------------------------------------------------------
 Judge Skinner는 놀랍게도 통계학에서 사용하는 Causal Inference를 잘 이해하고 있다. "prove causation by showing us the unlikelihood of so many instances of disease"가 바로 그것이다. 연구자라면 많이 들어보았을 P-value는 "인과관계가 없다는 가정 하에서, 관찰된 사건들이 얼마나 unlikely한 가"를 측정하는 값이고, 통계학에서는 p-value가 일정 값 아래임을 통해 causation이 있음을 증명한다. 그리고 이에 대해 Judge Skinner는 만약에 통계학적으로 증명된 causal inference를 법정에서 사용할 것인가에 대해 변호사 Jan Schlichtmann에게 질문하고 있다. 하지만 Jan Schlichmann 변호사는 우리는 통계학저으로 증명된 인과관계에 관한 증거를 사용하지 않을 것이라고 한다. 그리고 그 이유는 뒤에 나오지만 clinical한 방법으로도 충분히 인과관계를 증명할 수 있다고 믿었기 때문이다.


 통계학을 공부하는 사람으로서, 이 부분은 참 실망스러웠다. 그 당시 생물통계학의 최고 권위자가 'causation'이 있다고 말했음에도 불구하고, Jan 변호사는 이를 사용하지 않았기 때문이다. 대체 왜???

 나의 개인적인 생각으로는 통계학에서 사용하는 Causal Inference는 항상 한계점이 있다. 임상실험을 하지 않는 한 모든 인과추론 연구는 Observational data를 통해 진행될 수 밖에 없고, 이 경우 다양한 bias에 노출될 수 있기 때문이다. 그렇기 때문에 항상 causal inference by statistics는 limitation이 있을 수 밖에 없고, 그렇기 때문에 Jan이라는 변호사는 통계학을 사용하지 않은 듯 하다. 

 이러한 통계학의 한계, 그리고 좌절은 나만 느낀 건 아니었나보다. Professor Paul Rosenbaum의 책 Observation and Experiment 서문에서 이런 글이 나온다.
---------------------------------
It is often said, "You cannot prove causality with statistics." One of my professors, Frederick Mosteller, liked to counter, "You can only prove causality with statistics."
---------------------------------
 맞는 말이다. 수십년의 논쟁 끝에서 받아들여진 진실 "흡연은 폐암을 일으킨다."라는 인과관계도 결국 통계학을 통해 증명되었던 것 처럼 말이다. 자연법칙을 통해 증명할 수 없는 복잡한 사건들은 오직 통계학을 통해서만 인과관계를 밝혀낼 수 있다. 

 물론 한계도 있다. 예를 들면 "흡연은 폐암을 일으킨다."라는 주장에 대해서 "특정 유전자 X를 가진 사람은 흡연을 할 확률, 폐암이 생길 확률 모두가 높아진다. 따라서 흡연과 폐암은 연관관계는 있을 수 있어도 인과관계는 없다."라고 할 수 있으며, 이는 타당한 반론이 될 수 있다. 이 경우 통계학에서는 sensitivity analysis 등 다양한 이론을 발전시켜왔으며, 현재도 어떻게 solid하고 robust한 causal inference를 할 수 있을까에 대한 논의가 진행되고 있다. 이에 대해 현대 통계학의 아버지 Fisher는 이런 말을 했다. "Make your theories elaborate." 반론의 가능성은 항상 있다. 그러나 깊고 두텁게 정립된 이론을 refute하기는 쉽지 않다.

 
 책 내용으로 돌아와서, 이 책은 인과관계에 대한 깊은 통찰을 할 수 있게 도와준다. 항간에서는 로스쿨 입학하기 전에 꼭 읽어야 할 책이라고도 불린다고 하는데, 법과 인과관계, 그리고 환경문제에 관심이 있는 사람들이라면 읽는 것을 추천한다.

--


<Anecdotes>
 - Answer only what they ask, and don't say, 'I don't know' all the time. It'll make you look evasive.
 - Tell them the truth, because if you lie and they find out, it'll be a lot worse when they get you on the witness stand
 - The biggest victories are won by the slimmest margins
 - "The truth? the truth is at the bottom of a bottomless pit."
 - Harvard Club: It's an unspoken rule that no business is ever transacted here
 - "Rich and famous and doing good, rich isn't so difficult. Famous isn't so difficult. rich and famous together aren't so difficult. Rich, famous, and doing good-now, that's very difficult."
  - "Pride, greed, ambition. Getting rich by doing good."
 - 

----------------------------------
<Vocabulary>

 - beseeched: 간청하다
 - arrears: 체납금
 - anemic: 빈혈증의
 - terse: 간결한
 - preamble: 서문, 서두
 - sanctimonious: 독실한 체하는
 - ebullience: 감정 등의 격발, 격정의 발로
 - carcinogens: 발암 물질
 - astute: 약삭빠른, 영악한
 - picked up the tab : 계산을 하다
 - indolence: 게으름, 나태
 - pro bono: 무료의
 - fledgling: 어린 새, 신출내기
 - raconteur: 이야기를 재미있게 하는 사람
 - affidavits: 선서 진술서
 - plight: 역경, 곤경
 - modus operandi: (작업) 방식
 - acerbic: 가혹한
 - rectitude: 정직, 청렴, 강직
 - decorum: 점잖음, 예의
 - impound: 압수하다
 - begets (success begets success): 부르다, 야기하다
 - imprimatur: 허가
 - apoplectic: (화가 나서) 졸도한 지경의, 뇌졸중성의
 - earnest: 성실한, 진심 어린
 - Good-bye and good riddance: 안녕 그리고 보기 싫은 것이 없어서 속이 시원하다
 - flamboyant: 이색적인, 대담한
 - subpoenas: (증인에 대한 법원의) 소환장
 - martyr: 순교자
 - contentious: 논쟁을 초래할 (듯한)
 - lousy: 안 좋은, 엉망의
 - umbrage: 분하게 여김, 불쾌
 - charlatan: 지식, 기술이 있는 척 하는 사기꾼
 - voir dire: 예비 심문 선서
 - seriatim: 순차로
 - extortion: 강요, 강탈
 - petulant: 심술을 부리는
 - pensive: 깊은 생각에 잠긴, 수심어린
 - coveted: 탐내는
 - contrition: 죄를 뉘우침, 회개
 - preponderance: (수적으로) 우세함
 - vindicated: 정당성을 입증하다
 - hemorrhaging: 출혈
 - brusque: 무뚝뚝한, 퉁명스러운
 - foreboding: 불길한 예감
 - portents: (사람의 심신에 미치는 영향이) 강한
 - horoscope: 점성술
 - propitious: (일을 하기에) 좋은
 - placate: (화를) 달래다
 - Self - immolation: 스스로를 제물로 바치다
 - capitulate: (오랫동안 거부하던 것에) 굴복하다
 - scurrilous: 천박한, 악의적인
 - nefarious: 범죄의, 비도덕적인

댓글