언론과 소셜 미디어 상의 건강보험공단 관련 이슈 분석

Beyond the buzz

completed
건강보험공단
소셜미디어
매스미디어
텍스트분석
이슈분석
건강보험공단

Creative & Interaction Research Institute

연구 수행 기관: 창의성과인터랙션 연구소

연구책임자 선임연구원 연구원 객원연구원
이창준 교수 이승경 박사과정 박영주 석사과정 조한슬 박사과정
한양대학교 ERICA
정보사회미디어
한양대학교
미디어인포매틱스
한양대학교
미디어인포매틱스
경희대학교
빅데이터응용학과

개요

건강보험공단이 긍정적인 공공 이미지를 유지하고 부정적인 이슈에 능동적으로 대응하기 위해서는 효과적인 홍보 전략과 미디어 및 온라인 트렌드에 대한 실시간 모니터링이 필요하다. 이를 위해 소셜빅데이터 분석팀은 매스 미디어와 소셜 미디어에서 건강보험공단과 관련된 텍스트를 수집하고 수면에 드러나지 않는 이슈들을 탐색적으로 도출해보고자 한다. 이를 통해 건강보험공단이 해당 이슈에 대해 체계적으로 대응하고 PR 전략을 설정할 수 있는 지표가 되고자 한다.

분석 매체

매스 미디어

기존의 분류와 같이 매스 미디어와 소셜 미디어로 구분하여 텍스트를 수집하고자 함. 아래 열거한 매체와 소스를 위주로 데이터를 수집해나갈 계획이지만 공급 업체의 웹사이트 운영 방침이나 기술적인 문제 등으로 텍스트 수집이 불가능한 경우가 있을 수 있음. 매스 미디어 중 방송사 관련 뉴스들은 거의 모든 방송사들이 공식 유튜브 계정을 가지고 있기 때문에 공식 유튜브 계정을 중심으로 수집하고자 함. 또한 해당 뉴스에 대한 댓글들은 실명 기반의 계정들의 댓글이기 때문에 포털 등의 뉴스 댓글에 비해 혐오성, 공격성 댓글이 적어 담론 수집에 용이함.

  • 전국일간지(11개): 경향신문, 국민일보, 내일신문, 동아일보, 문화일보, 서울신문, 세계일보, 조선일보, 중앙일보, 한겨레, 한국일보

  • 경제일간지(8개): 매일경제, 머니투데이, 서울경제, 아시아경제, 아주경제,
    파이낸셜뉴스, 한국경제, 헤럴드경제

  • 지역일간지(28개): 강원도민일보, 강원일보, 경기일보, 경남도민일보, 경남신문, 경상일보, 경인일보, 광주매일신문, 광주일보, 국제신문, 대구일보, 대전일보, 매일신문, 무등일보, 부산일보, 영남일보, 울산매일, 전남일보, 전북도민일보, 전북일보, 제민일보, 중도일보, 중부매일, 중부일보, 충북일보, 충청일보,
    충청투데이, 한라일보

  • 보건의료전문지(25개): 뉴스더보이스헬스케어, 데일리팜, 데일리메디, 데일리메디팜, 메디게이트뉴스, 메디칼업저버, 메디칼타임즈, 메디파나뉴스, 메디팜스투데이, 메디포뉴스, 병원신문, 보건신문, 약사공론, 약사신문, 약업신문, 의료정보, 의사신문, 의약뉴스, 일간보사, 의협신문, 청년의사, 헬스포커스, 현대건강신문, 후생신보, 히트뉴스

  • 전문지(2개): 디지털타임스, 전자신문

  • 방송 언론: 공식 유튜브 채널을 통해 수집(30개): 연합뉴스Yonhapnews, 연합뉴스TV, 뉴스1TV, 뉴시스, KBSNews, MBCNEWS, SBS뉴스, YTN, MBNNews, 채널A뉴스, JTBCNews, 뉴스TVCHOSUN, 이런경향, 동아일보, 매일경제TV, MTN 머니투데이방송, 서울경제TV, 서울신문, 세계일보, 아주경제, 조선일보, 중앙일보, tvFN, 한겨레TV, 한국경제TV, 한국일보, 내일신문, 이데일리TV, 아시아투데이,시사포커스TV

소셜 미디어

기존 소셜 미디어의 수집처였던 페이스북과 트위터는 국민건강보험 관련 담론에 대한 담론이 활발하게 생성되지 않고 있고 특히 트위터의 경우 정치적 성향이 한쪽으로 치우친 경향이 있어 적절한 수집처로 보기 어려움. 또한 인스타그램의 경우는 이미지 기반의 소셜네트워크서비스로 텍스트 기반 담론이 형성되고 있지 않음. 따라서 소셜빅데이터 팀은 유튜브 댓글 위주의 소셜 데이터를 수집하고 이후에 추가적으로 온라인 커뮤니티로 담론 수집을 확장하고자 함. 다만 온라인 커뮤니티별로 정치적 성향이 확연히 다르기 때문에 균형적인 담론 수집을 위한 전략이 필요함.

  • 블로그/카페(공개게시글)(2개): 네이버, 다음

  • 커뮤니티(7개): 각 커뮤니티의 성향을 파악하고 균형적인 담론 수집 전략을 세울 예정: 디시인사이드, 네이트판, 뽐뿌, MLB파크, 클리앙, 더쿠, 딴지일보

    • 건강보험 등의 키워드로 관련 담론 활발히 생성되는 추가적인 커뮤니티 탐색이 필요

    • 폐쇄적 구조와 집단극화 발생 가능성, 정확한 데이터 수집/분석 우려

  • 유튜브 댓글(30개): 매스 미디어 방송사 공식 유튜브 채널과 동일한 소스를 활용하여 기사 내용과 담론을 연결할 예정

분석 방법

데이터 수집 및 탐색조사

  • 빅데이터 수집 및 구축

    • 매스 미디어: 빅카인즈에서 수집가능한 언론사는 빅카인즈 API를 활용하여 수집, 그 외에는 해당 언론사 웹페이지에서 크롤링

    • 소셜 미디어: 각 소셜 미디어 서비스의 API를 활용하거나 온라인 커뮤니티 웹에서 크롤링을 통해 수집

분석 방향

빈도 분석 → 감성 분석 → 토픽 추출 → 추가 분석

  • 건강보험공단 관련 단어(명사)의 빈도 분석

    • 제시된 키워드와의 동시 출현단어(명사) TOP 20 추출

    • 분석기간 동안 시계열 추이 확인

  • 감성분석

    • 자연어 처리(NLP) 기술을 적용하여 수집된 데이터의 감정을 분석할 수 있음. 기사(또는 포스팅) 내용에 대한 감정 점수를 결정하여 대중의 인식을 측정하고자 함.

    • 제시된 키워드와의 동시 출현단어(형용사) 추출

    • 형용사 기반의 감성분석 진행

  • 토픽 모델링

    • 건강보험공단과 관련된 대중의 관심사와 관심사의 우선순위를 이해하기 위해 추출된 단어의 분포와 머신 러닝 알고리즘을 사용하여 주제를 도출하고자 함.

    • 제시된 키워드로 추출된 기사(또는 포스팅)의 제목으로 토픽(주제)를 도출

    • 건강보험공단과 관련된 주제들의 1개월 단위 추이 탐색

  • 추가 분석 논의

    • 위 분석들의 결과와 관련하여 추가적으로 탐색이 필요하다고 판단될 경우 추가 분석을 진행할 예정

    • (예) 소셜 네트워크 분석: 단어들 간의 연결성을 파악하여 해당 주제에 대한 담론을 구체적으로 살펴볼 수 있음. 또한 기사에서 등장하는 다양한 행위자(개인, 조직, 언론 매체) 간의 관계를 분석할 수 있음.