외주민주주의 시대, 여론조사 및 데이터 분석보도 얼마나 신뢰할 수 있나?

필자는 본지 4월 25일자로 칼럼을 통해 “정치적 조정과 제도적 절차를 통해 풀어야 할 의사결정이 민의를 수렴하기 위한 하나의 수단에 불과한 여론조사에 대체되는 상황”을 “외주민주주의”로 정의한 바 있다(외주 민주주의의 한계… 민의 수렴보다 정치공학적 접근, 비용절감 업계 현실도). 여론조사가 선거 향방과 정치적 의사결정에 중요한 영향력을 행사하고 있지만, ARS조사 등 값싼 조사와 표본대표성에 근본적 결함이 있는 조사들이 범람하면서 민주주의를 왜곡시킬 수 있음을 강조했다.

그러나 외주민주주의의 문제는 “조사방법” 못지 않게 조사결과를 보도하는 “콘텐츠” 때문에 발생하고 있다. 최근에는 여론조사는 물론 빅데이터 분석 분야가 각광을 받으면서 각종 빅데이터 분석을 표방한 각종 기획들이 언론을 통해 쏟아지고 있다. 이를 접하는 적지 않은 독자들은 물론, 결정의 당사자인 정부나 정당에서 발표내용을 무비판적으로 수용하는 듯하다. 조사 및 데이터 분석결과를 조사기관이나 외부 전문가에 의존하는 외주민주주의 경향이 강해질수록 민의와 정책 추진 과정을 심각하게 왜곡할 수 있다. 최근 언론에서 관심을 끈 두 가지 사례를 통해 살펴보자.

두 사례로 본 분석 컨=콘텐츠의 문제
사례 1 : 거부권 행사 전후 박대통령 지지율 상승, 지지층 결집 효과일까?

먼저 얼마 전 정국에 큰 파장을 일으킨 소위 6월 25일 “박대통령의 국회법 개정안 거부권행사” 사례를 살펴보자. 6월 29일 대부분의 언론은 리얼미터 보도자료를 거의 그대로 인용해 메르스 정국 하에 급락하던 지지율이 24일 대통령 거부권 행사를 전후로 결집해 V자로 급반등했다는 소식을 대대적으로 발표했다(그림1). 지지율 상승요인으로 “박근혜 대통령 지지층의 결집 효과”를 꼽았다.

   
 
 

그러나 리얼미터 보도자료를 보면 25~26일의 박근혜 대통령 지지율의 상승을 지지층 결집효과만으로 해석하는 것은 왜곡에 가깝다. 새누리당 지지층에서 24일 조사는 67.2%였지만 26일 조사에서는 무려 80.4%에 달했다. 보수층에서도 지지율이 상승했다. 특히 TK지역은 19일부터 24일까지는 큰 폭으로 하락하다 26일에 57.5%까지 상승했다. 지지층 결집효과라 부를 만 하다.

그러나 대통령 지지계층인 연령, 지역별 분석을 해보면 논리적으로 상충하는 결과를 보여준다. 당시 리얼미터의 보도자료를 보면 박근혜 대통령 지지층인 TK, 50대, 새누리당 지지층에서는 지지율이 상승했지만, 심지어 대통령의 핵심 지지층 중에 하나인 PK에서는 거부권 행사 이후에도 오히려 39.2%까지 하락했다. 60대에서는 지지율이 정체되었다. 특히 반박근혜 정서가 가장 강한 호남에서도 무려 14.1%p나 올라 TK에서의 지지율 상승폭보다도 더 높다. 뿐만 아니라 충청, 수도권 모두 지지율이 상승했다. 세대로 보면 반박근혜 성향이 강한 40대 지지율 상승폭(12.6%p↑)과 20대 지지율 상승폭(7.3%p)이 50대의 지지율 상승폭(6.7%↑)을 상회한다.

결국 지지층 내에서도 상쇄효과도 컸고, 지지율 상승에는 지지층 외에 반대층에서도 지지율이 상승이 크게 기여했음을 알 수 있다. 실제로 한국갤럽의 6월 4째주 조사를 보면 거부권 행사는 정치적 반대층에서는 압도적으로 반대가 많았을 뿐 아니라 물론 새누리당 지지층에서조차 열 명 중 네 명은 반대하거나 입장을 유보한 사안이다. 박 대통령에 맞선 유승민 대표사퇴에 대해 PK에서는  사퇴 반대가 많았고, TK에서조차 대표사퇴에 찬반이 엇갈렸다.

그럼 무엇이 지지율 상승을 이끌었을까? 24일 이후 지지율 상승은 “거부권 행사”와 같은 정치적 성향에 따라 입장이 갈리는 “이념적 이슈(ideological issue)” 가 아닌 성향과 관련 없이 같은 방향으로 반응하는 “합의가능 이슈(valence issue)”의 영향으로 보는 것이 타당할 것이다. 이렇게 보면 메르스 효과를 주효과로 보는 것 보다 설득력 있다. 실제로 한국갤럽의 6월 네째주 조사에서 이미 대통령 지지율 부정평가 이유를 보면 “메르스 대처를 못해서”를 꼽은 응답이 눈에 띄게 감소하는 경향을 보여주고 있었다(한국갤럽 정기조사 6월 넷째주 6%p 감소, 7월 첫째주 11%p감소).

사례 2 : 조현아 ‘땅콩 회항’ 터진 후 정윤회 사건은 언급량 줄어

빅데이터 열풍으로 빅데이터 분석기법을 활용한 언론을 통해 경쟁적으로 보도되고 있다. 방대한 데이터양과 고도의 분석기법이 활용됨에 따라 일반국민은 물론 정부 및 정치권 정책결정자들도 무차별적으로 수용하기 쉽다. 지난 연말 정국을 달구었던 정윤회 사건(11월 24일), 조현아 땅콩회항 사건(12월 8일), 12월 19일 통합진보당 해산결정(12월 29일)까지 트위터와 블러그 등 SNS에서의 언급량 보도를 보자(그림2).

   
 
 

“조현아 ‘땅콩 회항’ 터진 후 정윤회 사건은 언급량 줄어”라는 제목의 언론보도에서는 정윤회 문건 유출 사건이 촉발된 “11월 28일 1만5055건을 기록하고”, “조응천 전 청와대 공직기강비서관과의 공방이 이어진 12월 2일 2만6857건으로 정점을 찍었다”고 보도했다. 12월 9일 이후 ‘정윤회-조현아’ 키워드 비교탐색 결과를 제시하며, 조현아 ‘땅콩회항’ 사건 이후 정윤회 사건 언급량‘이 줄었다고 분석했다. 이러한 결과가 조현아 땅콩 회항 사건을 덮기 위한 음모론을 뒷받침하는 것은 아니라고 분석하면서도 기사의 제목은 최소한 조현아 땅콩 사건으로 정윤회 사건 언급량이 줄어든 것은 팩트로 인정했다. 음모론이나 의혹으로 번질 여지가 충분하다.  

그러나 조현아 땅콩 사건과 정윤회 사건 언급량 변화 사이의 관계를 그래프를 통해 확인해보면 기사의 제목과 본문 사이에 음모론에 대한 이해에 미묘한 차이가 있음을 보여줄 뿐 아니라 기사와 본문 모두 사실관계에 대한 혼선을 불러일으킬 가능성이 크다.

물론 12월 8일로 그 이후로 보면 땅콩 회항사건에 대한 언급이 정윤회 사건 언급을 넘어선 것은 사실이다. 그러나 정윤회 사건에 대한 언급량이 줄기 시작한 시점은 땅콩 회항 사건 일주일 전인 12월 2일 정점을 찍었다. 즉 12월 2일 이후 땅콩 회항 사건이 일어나기 ‘이후’ 가 아닌 ‘이전’에 이미 정윤회 사건 언급량은 급감하는 양상으로 볼 수 있다. 땅콩회항 사건 하루 전 정윤회 사건에 대한 언급량이 다소 증가하는 양상을 보이고는 있으나 그 폭이 사건 초기의 증가 속도와는 차이가 있으며, 장기적으로는 하락 추세에 들어섰다는 해석도 가능한 자료이다. 즉 제시한 데이터를 보면 땅콩 회항 사건과 정윤회 사건에 대한 SNS 상의 언급량 사이의 인과관계는 커녕 상관관계 자체도 모호하다.

그래프를 보면 최대 관심사는 조현아 사건 이후 정윤회 사건 언급이 감소한다는 12월 8일 이후 시점보다는 11월 말부터 12월 초까지 정국을 뒤흔들던 정윤회 사건이 감소한 시점이다. 즉 12월 2일을 정점으로 이미 정윤회 사건에 대한 SNS에서 언급량은 급격하게 감소하는 추세를 보여주고 있다. 오히려 이 시기에 정윤회 사건에 대한 SNS 상의 논의가 감소한 이유가 무엇인지 규명하는 것이 현상을 정확히 이해하는 데 중요한 단서를 제공할 것으로 보인다. 이상의 내용을 보면 빅데이터 분석이라는 거창한 제목에 비해 분석결과에 대한 해석은 치밀하지 못하고 오히려 인식의 혼선과 의혹을 유발하는 측면이 크다.

 

클릭수 염두, 데이터 분석 보도: 콘텐츠의 부실화, 왜곡 가능성 높여
외주민주주의 폐해 증폭 : 정책결정자 및 유권자 오판 불러

여론조사든, 빅데이터 분석이든 객관적인 조사 데이터 및 과학적인 분석기법을 활용하여 도출한 콘텐츠로 인식된다는 점에서 다른 어떤 언론보도 보다도 많은 관심을 끌게 된다. 이에 따라 주요 선거가 끝나면 조사방법 및 데이터의 신뢰성에 대한 논란이 발생한다. 그러나 최근 정국의 핵심 이슈였던 두 사례를 살펴보면 조상방법 못지 않게 정책결정자나 유권자들에게 전달되는 컨텐츠에서의 부실과 왜곡 가능성이 크다는 것을 보여준다.

잘못된 데이터 해석은 대통령과 정치권에 국정 및 정치상황에 대한 오판을 낳는다. 거부권 행사 조사보도만 보더라도 거부권행사로 대통령의 지지가 상승할 수 있다는 해석은 콘크리트 지지층에 대한 과대평가를 낳을 수 있다. 대통령과 친박강경파 의원들로 하여금 유승민 전 대표에 대한 강한 압박을 밀어붙이는 근거가 되었을 수도 있다. 실제로 의도와 무관하게 현 정부의 성공여부에 대한 관심을 차기대선경쟁으로 돌려 놓았고, 힘으로 제압하려고 했던 유승민 전 대표를 일약 여권의 잠룡으로 만들었다. 땅콩회항 사건 SNS분석은 사건 이전에 정윤회 사건에 대한 언급량이 정점을 찍은 이유에 대한 분석은 도외시함으로써 음모론에 무게를 실을 수 있는 여지를 남겼다. 데이터 분석관련 언론보도에서 손쉽게 찾아볼 수 있는 사례들이다.

데이터기반 콘텐츠의 외주화에 따른 부실 분석과 선거 및 정책결정과정에서의 민의 왜곡 가능성에 비상한 관심과 대책이 필요하다. 혹여 언론의 입맛에 맞게 임팩트 있는 보도 자료를 생산하려는 조사기관 및 이를 무비판적으로 받아 적는 언론의 자성과 인식전환이 시급하다. 단기적으로는 클릭수는 높일 수 있지만, 장기적으로 신뢰를 잃는다. 특히 각 언론 미디어 차원에서 커지는 데이터 기반 의사결정 및 분석에 대한 모니터링과 검증할 수 있는 역량과 프로세스를 갖춰나갈 필요가 있어 보인다. 정책결정자 및 정치권 역시 언론의 조사데이터 보도를 비판적으로 평가하여 활용할 수 있는 전문적 역량과 안목을 키우는 것이 필요하다. 미디어의 보도, 전문기관의 발표라고 쉽게 맹신할 경우 엉뚱한 의사결정으로 심각한 피해를 초래할 수도 있을 것이다. 마지막으로 한국사회의 최종 주권자인 국민 스스로 데이터 기반 분석과 보도 콘텐츠들에 대해 경계등을 키고 비판적 시각에서 콘텐츠를 취사선택하는 자세를 견지해야 할 것으로 보인다. 잘못된 데이터분석 기반 정책결정의 최대 피해자는 유권자 자신이기 때문이다.

저작권자 © 미디어오늘 무단전재 및 재배포 금지