하버드의 STAT210 and STAT211

 하버드의 STAT210: Probability 1 과 STAT211: Statistical Inference 1은 하버드 박사과정생이 첫 학기에 듣게 되는 필수 과목이다. 하버드의 학수번호는 '전공' + '대상' + '레벨' +'순서' 로 구성되어 있는데 '전공' = {STAT, ECON, CS, BST, ...}, '수업' = {1: 학부, 2: 대학원, 3: 세미나} 등이다. 그래서 STAT210은 통계학 전공의, 대학원 수업의, 첫번째 레벨(주로 대학원 1학년이 듣는)의 수업의 첫번째인 것이다. 이와 비슷하게 Jun Liu 교수님이 가르키시는 STAT220 베이지안 통계학 수업이 있었는데 이 수업은 통계학 전공의, 대학원 수업의, 두번째 레벨(주로 대학원 2학년이 듣는)의 수업의 첫번째 수업이었다.

 그래서 하버드의 석사/박사 통계학과 학생들은 첫 학기에는 STAT210과 STAT211을 필수로 듣고 나머지 선택과목을 듣는다. 내가 몸담았던 생물통계학과에서도 이와 비슷한 BST230, BST232가 있었는데, 나의 학기 스케줄과 맞지 않아 나는 통계학과의 STAT210과 STAT211을 들었다.

----------------------------------------------
STAT210: Probability 1

 하버드의 STAT210은 하버드의 통계학과가 만들어 진 50년 전 부터 지금까지 쭉 이어져 온, 하버드 통계학과와 역사를 함께하는 수업이다. 이 수업은 Joeseph 교수님이 현재 가르키고 계시고 그 전에는 Carl Morris 교수님이 이 수업을 담당하셨다. 역사가 깊어서 그런지, lecture note또한 큰 틀의 변화 없이 내려오고 있으며 과거의 STAT210이 STAT210과 STAT212로 나누어짐에 따라 lecture note의 구성이 약간 바뀌었을 뿐 크게 달라진 것은 없다고 한다.

STAT 210 의 cover, 수십년간 draft 였다..

 Chapter의 구성은 axiom, measure부터 시작해서 Martingale에서 끝난다. Casella berger의 Statistical Inference 책의 구성과 비슷한 것 같은데, 아마 그 구성이 맞기 때문이다. 전문 용어로 하면 graduate level stat의 구성 순서는 하나로 수렴했다?

 STAT210수업이 기억에 남는 이유는 크게 세 가지가 있는데, 하나는 Measure에 대한 이해였다. Joe 교수님이 천재라서 그런가, 아니면 천재이면서 남들에게 설명도 할 수 있는 another level이어서 그랬는지는 모르겠지만, 정말 쉽게 measure에 대해 설명해 주셨다. 특히 pie-system 과 lambda-system을 통해 나중에 Borel-Cantelli Theorem을 증명하는 것은 가히 클라이막스였다. (또한 중간고사 시험 문제로도 pie-lambda system을 제대로 이해했는지 확인하셨다... 나는 설마 이게 나올까 하다가... ㅠ) 두번째는 Reasoning by representation이라고 모든 Distribution을 이야기처럼 설명하는(왜 이 분포를 사용하게 되었는가) 부분은 너무나 감동이었다. 모든 Distribution을 동전 던지기에서부터 설명할 수 있다는 그 말은 얼마나 감동인가! 그리고 마지막은 Central limit theorem 이 있었다. 단순하게, 쉽게 증명하는 CLT가 아닌, CLT가 성립하기 위한 다양한 조건을 하나 하나 분석해보며 하나의 조건을 relax한 후 CLT를 증명해보기 등 다양한 방법을 동원하여 CLT 를 증명했다. 이런 과정 속에서 Complex analysis가 나오기도 하는 등... 수학과 통계학의 향연을 제대로 즐길 수 있었다. 그 밖에도 Lebesgue integration, Adam's law, Eve's law, 등 감동 포인트가 많았다. 다만 너무 감동을 많이 해서 성적은 좋지 못했다ㅠ

 아무래도 MIT에는 통계학과가 없고, Harvard STAT110 과목은 좀 쉬워서 STAT210 과목은 정말 내로라 하는 MIT, Harvard 천재들의 경연장(?)처럼 되어버렸다. 그래서 어떤 어려운/ 혹은 풀리지 못한 문제에 대해서 즉문즉답(?)이 이루어 지기도 했고, 나는 그것들을 다 받아적는 모범생이었다... 그리고 시험은 기존에 배웠던 내용을 '기반'으로 새로운 '문제'를 푸는 것이었다. 아무리 기출문제를 많이 풀어도 새로운 '문제'는 정말 머리를 써서 해결해야 하는 것이었고, 나는 이걸 잘 못하기 때문에... 하... 예전 학부생 때 망했던 정수론 느낌이었다. 

 그래도 너무나 명쾌하고 훌륭한 수업이었다. 

----------------------------------------------------------------
STAT211: Statistical Inference 1

 하버드의 STAT211 과목은 STAT210 과목보다는 관심이 조금 덜(?)한 과목이다. 본격적으로 통계학과 연관이 되어서일까? STAT210은 수학과에서 개설되어도 아무 문제가 없을 것이라면, STAT211은 오직 통계학과에서만 열 수 있다. 이 수업은 하버드 통계학과의 얼굴!! Lucas 교수님이 가르치고 계시고 그 전에는 Carl Morris 교수님과 Joe 교수님이 가르치셨다. 수업 내용은 여느 Statistical Inference 과목에서 가르칠 것들을 가르친다. 다만 레벨은 Casella Berger 의 것 보다 조금 더 어려웠다.

 수업은 likelihood 개념에서부터 시작해서 Stein paradox까지 했다. 교수님이 high dimensional에 조예가 깊으셔서 그런지 그쪽 부분을 정말 집중해서 가르쳐주셨다...
칠판역시 classic하다
 STAT211과목은 과거에 악몽이 높았던 것이, 랜덤으로 학생을 지정해서 문제를 풀어보라고 시키는 악습(?)이 있었기 때문이다. 내가 수업들었을 때는 그런 것은 없었는데, 대신 문제를 칠판에 적어두고 "이 문제는 어떻게 접근하면 좋을지 옆 사람과 1~2분 상의해보도록 합시다."라고 했다. 옆 사람에게 부끄럽지 않게 위해서라도 정말 그 시간만큼은 바짝 집중을 해서 좋은 효과가 있었다고 생각한다. 그리고 어려운 문제는 이렇게 대화로 풀어갈 수도 있겠구나... 라는 생각도 들었다. 

------------------------------------------------------------------
 사실 STAT210 과목과 STAT211 과목은 다른 학교의 통계학 과목과 비교해서 특별히 다를 것은 없다. 그냥 박사레벨의 수업일 뿐... 다만 하버드의 STAT210과 STAT211과목이 약간 특별하다면, 그것은 교수님과 TA, 그리고 학생의 수준이라고 하고싶다.

 교수님들이야 세계적인 level이니 말할 것도 없지만, 그럼에도 불구하고 항상 1주일에 한 시간씩은 Office hour가 있어서 학생들이 자유로이 질문할 수 있게 하고, 또 수업 직후에도 질문에 답들 정성껏 해주신다. 기출문제는 5년~10년 자료는 항상 공개하신다. 어차피 시험문제는 새로 만드시니까 (그리고 그것이 당연하다.)
 TA들은 정말 감동이었는데, 자신들이 자료를 만들어서(혹은 선배들이 가지고 있던 자료들을 수정해서) 1주일에 1시간 정도 TA session을 진행하고 Q/A도 진행한다. 가끔 TA session은 교수님들이 가르치는 것 보다 나을 정도도 많고, 더 어려운 내용일 때도 훨씬 많았다.

TA Q/A시간


 학생들의 수준 또한 높았는데, 이해가 가지 않는 내용은 질문할 줄 알고, 교수님이 학생들에게 질문을 할 때 대답을 잘 하기 때문이다. 그리고 수업 내용이 어려워도 포기하는 것이 아니라 어떻게든 다들 따라간다. 숙제같은 것도 solution찾는 것이 아니라 study group을 만들어서 같이 함께 풀어간다...

------------------------------------------------------------
 어떻게 보면 하버드 통계학과의 역사와 함께한 STAT210과 STAT211을 들은 셈이었는데, 시간이 지난 후 생각해 보니 참 많은 것을 배웠던 수업이었던 것 같다. 수업의 내용 뿐만 아닌 무엇이 좋은 수업인가 하는 그런 것에 대해서...














댓글