숙명여자대학교

사이트맵 열기

사이트맵

 
모바일메뉴열기 모바일메뉴 닫기

SM뉴스

PEOPLE

정보의 홍수 시대, Data Scientist를 향한 도전 ‘제 11회 SAS 마이닝 챔피언십’ 금상, 동상 수상자 인터뷰

  • 조회수 5275
  • 작성자 커뮤니케이션팀
  • 보도일자 2013-10-08

SAS 코리아와 건강보험심사평가원이 함께 주최한 제 11회 SAS 마이닝 챔피언십이 지난 9월 26일 결선을 가졌다. 미래 빅데이터 전문가를 꿈꾸는 전국의 다양한 대학생 및 대학원생이 참여하는 본 대회에서 우리대학 통계학과 학생이 속한 연합팀이 금상을 차지하였고, 통계학과 학생들로 구성된 팀이 동상을 차지하였다. 대학원생도 함께 겨루는 대회에서 우리 학교 학생들이 이와 같은 성적을 거둔 비결은 무엇일까? 금상 수상자인 손정은(10, 통계학과)씨와 동상 수상팀의 일원인 장수정(11, 통계학과)씨를 만났다.

   

이번 대회에서 금상 수상자인 손정은 씨는 각각 다른 학교 학생이 모인 연합팀으로 출전하였다. 교내 학생들로 구성된 팀과 다른 이런 색다른 팀원 구성은 어떻게 한 것일까? “작년에도 출전을 했었지만, 대회를 출전하는 과정에서 해체된 적이 있었어요. 4학년이 된 만큼 바쁜 주변 친구들보다는 인터넷 사이트에서 대회 준비에 관심이 있는 사람들을 모집하는 것이 대회 준비에 더 좋을 거라는 생각이 들었어요. 그렇게 3명의 팀원들이 처음 모이게 되었죠” 

   

이와 다르게 동상 수상팀의 일원인 장수정 씨의 대회 참가는 졸업한 선배의 추천으로 시작되었다. “전에 들었던 전공과목 중에 졸업하신 선배님이 가르쳐주셨던 과목이 있어요. 수업 중간에 한 학생이 선배님께 SAS 회사에서 프로그램을 가지고 능력을 보는 자격증에 대해 여쭤봤는데, 자격증 대신 대회를 추천해주셨어요. 그 때 이 대회를 나가면 괜찮겠다 생각해서 기억을 해두고 있었죠”라고 말했다. 그렇게 원래 대회에 관심이 많았던 다른 두 명의 동기들이 합세해서 팀을 꾸렸다고 한다.

   

                                          (출처 : 금상 수상자 손정은 학우(가운데))

   

이번 대회의 주제는 건강보험심사평가원이 제공한 표본자료를 바탕으로 ‘의료기관 청구경향의 적정성 예측 모델 개발’을 하는 것이었다. 의료기관 측에서 돈을 과다 청구한 경우를 잡는 것이 분석의 목표였다. 주어진 데이터를 분석하여 모형을 만들고, 보고서를 작성하는 과정이 1차 대회이고, 제출한 서류들을 바탕으로 만든 ppt를 가지고 발표를 하는 것이 2차 대회였다. 

   

하지만 이러한 과정이 쉽지만은 않았다. 주어진 900만 개의 데이터 숫자에 한 번도 보지 못한 형태의 결과였기에 처음에 당황스러웠다고 했다. 장씨는 “저희는 3학년이라서 분석하는 과정을 많이 안 배워서 마이닝 방법에 익숙하지 않았어요. 게다가 대회 주최 측에서 쓰라는 프로그램이 따로 정해져 있는데, 학교에서는 한 가지 프로그램밖에 안 다루거든요. 두 가지 프로그램은 아예 모르는 상태여서 되게 막막했어요”라고 말했다.

   

연합팀의 경우에도 어려움은 있었다. 손 씨는 “공모전이라는 단일 목표 하에 모였지만 다른 환경 속에 있어서 친해지기도 오래 걸리고 서로의 개성을 이해하는 데 오래 걸렸죠. 소통하기가 쉽지 않았어요. 또 학교가 다르다 보니까 정착해서 하지 못하고 여기저기 떠돌아 다니느라 고생했었어요”고 털어놓았다.

   

어려운 점이 많았음에도 좋은 성과를 거둘 수 있었던 것은 끊임없는 노력 덕분이었다. 평소에 교수님들이 석사 과정에서 배운다고 흘려 이야기하셨던 것들을 생각하면서, 자세히는 몰라도 최대한 적용해보려고 애를 썼다. 장 씨는 “모르는 경우가 생기면 항상 교수님들과 조교님들을 찾아가 그 때 그 때 여쭈어 본 것도 어려움을 극복하는데 큰 도움이 되었다”고 설명했다. 반면 손 씨는 “저희는 3명의 개성이 강한 것이 플러스 요인이 되었어요. 각각 자신의 색이 달랐기 때문에 오히려 결과물을 도출해 내는 데 조화를 이루게 되더라고요. 서로를 향해 거침없는 토론도 이어졌고, 그 과정을 결과물로 도출시키는 데 능한 친구도 있어서 결과가 좋았던 것 같아요”라고 비결을 소개했다.

   

대회를 참여하는 동안 배운 점에 대해 묻자 두 팀 모두 “실질적인 것을 많이 배운 것 같아요” 라고 말했다. 손정은 씨는 “데이터를 보면 예전에는 막연하다는 생각만 들었는데 데이터를 보는 눈이 달라졌다”며 “무엇을, 어떻게 건드려야 하는 것인가에 대해 깨달음을 준 대회였다”고 말했다. 그는 “의료산업과 관련한 데이터를 만드는 것이 주제인 만큼 의료에 관해 공부하는 과정, 즉 배경지식을 쌓는 과정이 좋았다. 많은 변수를 고려하면서 다양한 관련 지식을 알게 되는 과정이 의미있었다”고 덧붙였다.

   

장수정 씨는 “학교에서는 단락단락을 배우지 전체적인 과정을 배우지는 않잖아요. 데이터가 주어졌을 때 어떻게 해야 하는 지에 대한 정석적인 것들만 배운 것 같아요. 그리고 데이터도 학교에서 다루는 건 정제되어 있는 데이터인데, 이 대회는 실질적으로 사용하는 데이터를 줬기 때문에 실제로 어떻게 해야 되는 지를 배울 수 있었어요”라고 의미를 부여했다. 더불어, 평소에는 생각하지 못했던 부분에 대해 다방면으로 생각할 수 있었던 계기가 되었다고도 언급했다.

   

이 대회에 참가할 학생들에게 해주고 싶은 조언은 짧지만 공감이 가는 대목이었다. “이 대회를 많은 학생들이 알게 되었으면 좋겠어요. 통계학과 친구들 중에서도 이 대회에 대해 잘 모르는 친구들도 있고, 타과생 중 복수전공 또는 부전공을 통해 통계학적 지식이나 관심이 있다면 시도해보았으면 좋겠어요”

두 팀 모두 포기하지 않고 도전해야 한다는 말도 잊지 않았다. 장 씨는 “제출 1주일 전 교수님께 조언을 구하기 위해 뵈었을 때, 교수님께서 포기하는 게 낫겠다는 말씀까지 하셨어요. 하지만 지금까지 준비한 것이 아깝고 오기도 들어서 열심히 준비했던 것이 결과로 돌아온 거 같아요”라며 “일단은 제출만 하면 돼요. 처음에는 200팀이 접수를 했는데, 1차 서류를 낸 팀은 50팀 정도 밖에 안 됐다고 하셨어요. 그만두는 사람이 많으니깐 일단 제출을 했으면 좋겠어요. 교수님들도 저희가 대회 준비 하는 모습을 보셨으니깐, 앞으로 나가는 분들에게 더 많은 도움을 주실 수도 있을 거예요”라며 조언을 아끼지 않았다.

   

최근에 많은 공모전이나 대회가 열리고 있고, 많은 학생들이 참여하기 위해 시도를 하지만 중간에 포기하는 사람도 적지 않다. 비록 잘 모르는 부분이 있고, 어려움이 닥치더라도 끝까지 할 수 있을 만큼 노력한다면 좋은 성과가 있다는 것을 두 팀의 대회 참가부터 수상까지의 이야기를 통해 새삼스레 깨달았다. 

   

취재 : 숙명통신원 11기 이정윤(법학부), 12기 홍나라(한국어문학부)

정리 : 홍보팀