디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

기사 쓰는 로봇, 어떻게 작동될까모바일에서 작성

..(112.170) 2014.06.16 11:50:49
조회 121 추천 0 댓글 0


로봇이 기사를 작성하는 ‘로봇 저널리즘’ 시대가 성큼 다가왔다. 자동 기사 작성 시스템을 갖추고 적용한 사례도 적지 않다. \'LA타임스\'가 대표적이다. \'LA타임스\'는 지난 3월 로봇이 작성한 지진 속보 기사를 내보내 전세계 언론인들로부터 주목을 받기도 했다. 그래서인지 일부 연구자들 사이에선 “마침내 로봇 저널리즘이 주류로 진입했다”는 평가가 제기되기도 한다.



△ 오토메이티드 인사이트의 자동 기사 작성 시스템
기술력을 갖춘 기업도 속속 등장하고 있다. 미국 노스웨스턴대 내러티브 사이언스가 주도하는 가운데 오토메이티드 인사이트, 이지옵, 판타지 저널리스트 등 스타트업 기업도 속속 경쟁 대열에 가세하고 있다. CBS 인터랙티브 등 주류 언론사들도 관련 기술의 특허를 출원하는 등 발빠르게 움직이고 있다. 이제 로봇 저널리즘은 연구 대상을 넘어 하나의 산업으로 성장해갈 조짐을 보이고 있다.

로봇 저널리즘은 자동 기사 작성 알고리즘을 갖춘 소프트웨어를 가리킨다. 데이터를 수집, 분석해 이를 기사형 문장으로 표현하고 실제 언론사 홈페이지에 게시까지 하는 일련의 과정을 처리하는 프로그램을 일컫는다. 한국에선 아직 연구조차 시도되지 못하고 있는 분야다.

그동안 로봇 저널리즘은 핵심 알고리즘이 특허에 묶여 있어 구체적인 구현 방식이 잘 알려지지 않았다. 미 콜럼비아 저널리즘스쿨 토우센터 닉 디아카풀로스 연구원은 그동안 베일에 감춰졌던 자동화 기사 작성 알고리즘의 작동 과정을 특허 등을 분석해 지난 6월12일 토우센터 블로그에 소개했다.

그에 따르면 로봇 기사 작성 기술은 대체로 5가지 단계로 구성된다. 첫 번째는 데이터를 수집, 분석하는 단계이다. 로봇 저널리즘은 주로 표준화된 데이터가 풍부한 영역에서 활용된다. 예를 들면, 스포츠나 날씨, 증권 분야가 대표적이다. 표준화된 데이터를 얻기가 쉽고 그 형태도 비교적 깨끗한 것이 특징이다.

두 번째는 데이터에서 가치 있는 뉴스거리를 찾아내는 과정이다. 여기에는 통계적 방법론이 개입된다. 예를 들어 스포츠 뉴스에서 가장 의미 있는 정보는 통계적 일탈 지표를 먼저 확인하는 것이다. 최소치나 최고치 혹은 전 경기 대비 큰 변화를 보인 변수를 알고리즘은 계산해내야 한다. LA 다저스 투수 류현진 선수의 볼넷이 전 경기 대비 100% 증가했다는 데이터가 수집됐다면 뉴스 가치를 지닌 데이터로 분류하게 된다.

셋째는 어떤 각도로 기사를 작성할지 기사의 관점을 확정하는 단계다. 일반적으로 기자들이 제목을 뽑거나 기사의 주제를 확정하는 과정에 해당하는데, 이 또한 수집된 데이터의 분석을 통해 해결한다. LA 다저스가 슬럼프에 빠졌다거나 홈 경기 승률이 오락가락한다거나 하는 시각을 알고리즘이 데이터의 비교 분석을 통해 추출해낸다. 닉 디아코플로스 연구원은 “단일 기사에 대한 관점은 중요도에 따라 1~10까지 분류가 된다”고 설명했다.

다음으로는 최종 확정된 시각에 맞게 세부 기사를 배열하는 단계다. LA 다저스가 슬럼프에 빠졌다는 주제가 확정됐다면 그에 맞춰 근거가 되는 선수의 데이터를 제시하고 연결시킨다. 데이터만 풍부하다면 이 단계에서 외부 데이터를 더 끌어올 수 있고, 인용구도 만들어낼 수 있다고 한다. 데이터를 풍성하게 결합하는 프로세스가 진행되는 단계라고 요약할 수 있다.

마지막으로 자연어로 기사를 제작하는 단계이다. 닉 디아카풀로스 교수는 전체 과정 중에 가장 덜 복잡한 단계라고 언급했다. 확정된 관점, 연결된 데이터로 영어 문장을 구성하는데 기사 관점과 핵심 요소에 따라 반복적으로 재작성된다. 이렇게 제작된 영어 문장들은 서로 이어붙이기가 자동으로 진행되면서 완성된 하나의 기사로 탄생하게 되는 것이다.

닉 디아코풀로스 연구원은 “기사는 여러 설정에 의해 톤을 조정할 수도 있다”고 말했다. 비관적 기사, 심드렁한 형태, 신뢰를 강조하는 기사 등 설정된 논조에 따라 알고리즘은 선택하는 영어 단어도 바뀐다는 것. 이지옵에서 개발한 분석기를 활용하면 동일 단어를 유사 단어로 대체할 수도 있다는 것이 그의 설명이다.

그는 로봇 저널리즘 기술의 핵심은 뉴스 가치를 판단하는 알고리즘에 달려 있다고 강조한다. 기사 작성 템플릿 등은 핵심이 아니라는 것이다. 단순히 데이터 내 큰 편차에 주목해 뉴스 가치를 측정하는 현재의 알고리즘으로는 보다 폭넓은 관점을 담아내기 힘들다고 닉 디아코풀로스 연구원은 결론을 내렸다.
이성규 기자 dangun76@bloter.net

추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는? 운영자 24/04/29 - -
AD 보험상담은 디시공식설계사에게 받으세요! 운영자 24/02/28 - -
753916 내가 라쿤새끼아니라니까 미스테(1.247) 14.06.25 138 1
753915 나는 온라인으로만 공격하겠다 [2] 반카이저핌불갤로그로 이동합니다. 14.06.25 184 0
753913 14.8이 진실이라는 이유들 [15] ㅇㅇ(203.226) 14.06.25 1303 20
753912 여기 능력자들 많다면서요 특히 ㅇㅇ 너는 컴퓨터쪽 나왓다며 하드털어보세요 [2] 근육(110.70) 14.06.25 242 0
753911 미갤이 팬갤도 안하는 친목을 하고있네 ㅋ ㅇㅇ(112.167) 14.06.25 104 7
753906 여긴 여전히 활기차다! (175.198) 14.06.25 90 2
753905 뭐 애들끼리 싸울수 있어 1프로(211.198) 14.06.25 178 4
753903 종찬이가 누군데 밍밍아? [69] 미스테(1.247) 14.06.25 436 7
753902 왜 처 싸우는데 글을 올려 븅신들아... [12] 미스테(1.247) 14.06.25 260 7
753900 뭐만하면 나라고 그러니까 아예 뿌리뽑고싶엇다 [3] 근육(110.70) 14.06.25 274 2
753899 2014년과 2012년의다른점이뭐냐??? [4] ㅇㅇ(180.65) 14.06.25 288 0
753898 마녀사냥을 시작한다.제일 먼저 마녀들의 흉악한 우두머리 하악이를 처단한다 [1] 반카이저핌불갤로그로 이동합니다. 14.06.25 273 0
753897 핌불 쟤 마초네 [7] 미스테(1.247) 14.06.25 383 0
753896 소화시킬겸 하늘에서 미갤 전멸을 위해어택을 하겠다 하늘사람(123.109) 14.06.25 167 0
753895 내가분명히 말햇지 나다중짓안한다고 레알빅 너! 근육(110.70) 14.06.25 76 0
753894 하악이마녀를 편드는 사람들의 특징 [1] 반카이저핌불갤로그로 이동합니다. 14.06.25 236 0
753892 병신들좀 꺼져 [5] 1프로(211.198) 14.06.25 346 7
753891 하악이는 싸움을 부추기고 그걸 몰래 엿보고 웃는 변태 성욕자이다 반카이저핌불갤로그로 이동합니다. 14.06.25 186 2
753890 도키같은 심약갤러는 식물갤도병행하렴.. [1] 근육(110.70) 14.06.25 256 1
753889 인생은 길이 여러개라 살맛나는거가타 근육(110.70) 14.06.25 77 0
753886 아리안 되기 글렀다 그나저나 하악이에 대해 조사해봤다 [2] 반카이저핌불갤로그로 이동합니다. 14.06.25 233 0
753885 하악이 착한데 [12] 도키(175.223) 14.06.25 513 7
753884 하아기가 핌부리 벌레보듯하는 이유.jpg [8] 밍밍(58.234) 14.06.25 452 7
753883 검은화살표 보플 모음 [3] ㅁㄴㅁㄴ(14.42) 14.06.25 379 1
753882 야 ㅁㅁ! 관상보는애! 내가무슨중딩처럼생기냐 [4] 근육(175.223) 14.06.25 212 0
753881 2--2--2--2--2 [1] 검은화살표갤로그로 이동합니다. 14.06.25 158 0
753879 해물파전 ㅇㄹ(61.75) 14.06.25 73 0
753878 밍밍이 머한당가 [1] 자연파괴장(222.112) 14.06.25 87 0
753877 오늘만이라도 기억하자 [2] σ1ммчг(117.111) 14.06.25 124 3
753876 대체 먼일이여~~ 이게 무슨일이란가~~ [14] 자연파괴장(222.112) 14.06.25 385 0
753875 Toki Thisisaperson who is not a courtesy [7] JG(14.136) 14.06.25 371 0
753874 MALTA-BRINKS.Ag [1] 검은화살표갤로그로 이동합니다. 14.06.25 236 0
753873 재밋는 떡밥이 없단말이지 미스테(1.247) 14.06.25 52 0
753872 미갤 링크 변조 대처방법 [1] 33(14.42) 14.06.25 131 4
753871 네번째 글. 잠자기 전 술 하하 [3] 1(211.36) 14.06.25 124 0
753870 삐진토끼 파일 유포 삐진토끼(211.196) 14.06.25 209 0
753868 재일동포 학도병도 있었네 [4] σ1ммчг(117.111) 14.06.25 125 4
753867 인간으로 변장한 요괴가 포착된게 미스테리 헐랭이갤로그로 이동합니다. 14.06.25 79 0
753866 사람은 사람답게 열심히 살고 [2] 테투라이브(223.33) 14.06.25 108 0
753865 오늘자 구글 메인 [6] 컴베어(121.166) 14.06.25 645 14
753864 러시아군의 우크라이나 동부 침공으로 3 차 세계대전 발발 장자크정갤로그로 이동합니다. 14.06.25 49 0
753860 수욕님 [6] 밍밍(58.234) 14.06.25 183 7
753859 우주와하나되는순간 [1] 테투라이브(223.33) 14.06.25 119 1
753857 검은 화살표 어디갔냐 [1] ㅂㅁㄱ(182.215) 14.06.25 72 0
753856 To 도키 [19] 탈갤할하악★갤로그로 이동합니다. 14.06.25 563 7
753855 9번채널 감동실화 [4] σ1ммчг(117.111) 14.06.25 128 0
753854 내 옆엔 든든한 승아가 있는데 바람피면 안되지 [1] Goldstar갤로그로 이동합니다. 14.06.25 137 1
753853 나 오늘 9시부터 일해서 철야고 [7] 도키(175.223) 14.06.25 232 0
753850 ___ [10] 금발소년갤로그로 이동합니다. 14.06.25 307 1
753849 니미 개앂.. 죧털bc봤냐? 세월호 급변침 레이더 궤적이.. 궤적이.. [2] 最終鬼畜滅殺抹殺갤로그로 이동합니다. 14.06.25 420 5
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2