▲ 출처=픽사베이

구글이 가짜뉴스와의 전쟁을 선포했다. 25일(현지시간) 검색 엔진 알고리즘을 업그레이드해 오류가 있거나 공격적인 기사들을 검색 결과 하위로 보내도록 조치했다고 밝혔다.

하루에 구글 사이트에서 잡히는 트래픽 중 약 0.25% 검색어는 사용자가 원하는 정보가 아니라 불쾌감을 주거나 잘못된 정보다. 구글은 지난 대선 당시 가짜뉴스 등으로 몸살을 않으며 펙트 체크 등 다양한 프로젝트를 공개했으나 검색 알고리즘을 바꾼 것은 이번이 처음이다.

벤 고메즈 구글 검색 엔지니어링 담당 부사장은 공식 블로그를 통해 "페이크 뉴스라는 웹 콘텐츠가 눈에 띈다"며 "구글은 검색 기능의 구조적 변화를 통해 문제를 해결하기 위해 꾸준히 노력하고 있다"고 설명했다. 

고메즈 구글 검색 엔지니어링 담당 부사장은 "구글은 정보를 체계화해야 하는 과제 외에 검색 순위를 높이기 위해 품질이 떨어지는 '콘텐츠 농장'이나 숨겨진 텍스트와 같은 '속임수'를 사용하는 개인이나 시스템에 대응할 수 있게 알고리즘을 개선해왔다"고 설명했다.

그는 이어 "온라인에서 매분마다 수만 페이지에 달하는 정보들이 쏟아져 나오는 오늘날 시스템을 교란하기 위한 다양한 신종 수법이 등장하고 있다"며 "이 중 가장 눈에 띄는 것은 '페이크 뉴스'라고 하는 웹 콘텐츠다. 페이크 뉴스는 허위 정보, 낮은 품질의 정보, 불쾌감을 주는 정보 등을 노골적으로 퍼뜨리는 데 일조하고 있다"고 강조했다.

▲ 검색어 자동 완성 기능의 새로운 피드백 링크. 출처=구글

◇검색 기능 향상·피드백 도구 개선·투명성 강화

구글은 페이크 뉴스 해소를 위해 새로운 품질 평가사 가이드라인을 세웠다. 지난달 업데이트된 검색 품질 평가사 가이드라인에는 평가사가 신고해야 하는 낮은 품질의 웹페이지 사례가 상세히 설명됐다. 예를 들어 허위 정보, 뜻하지 않게 불쾌감을 주는 검색 결과, 날조된 내용, 근거 없는 음모론 등이다.

검색 순위 선정 방식도 업데이트됐다. 구글은 지난해 12월 '홀로코스트가 발생했느냐'는 질문에 대해인종차별주의 사이트 '스톰프런트'의 게시글이 구글 검색 결과 최상단에서 제공되며 뭇매를 맞았다. 이들은 1930년~40년대 나치에 의한 유대인 대학살을 부정하는 집단이다.

구글은 콘텐츠의 참신성부터 페이지에 검색어가 표시된 횟수에 이르기까지 수백 가지 신호를 조합해 검색어에 적합한 검색 결과를 결정한다. 웹페이지의 중요도를 측정해 검색 결과에 순위대로 표시하는 구글의 핵심 알고리즘 페이지랭크(PageRank) 기반으로 운용된다. 

고메즈 부사장은 "이런 신호를 조정해 믿을 수 있는 페이지의 노출수를 높이고 품질이 낮은 콘텐츠의 검색 순위는 낮추고 있다"며 "이 때문에 지난 12월 홀로코스트 부정론(Holocaust denial)이 상위 검색 결과를 차지했던 것과 같은 불미스러운 사건은 다시 발생하지 않을 것"이라고 설명했다.

직접적인 피드백 제출 도구도 만들었다. 구글은 사용자가 사이트를 이용할 때 빠르게 검색할 수 있도록 검색어 자동 완성 및 추천 스니펫 기능을 제공한다.

검색어 자동 완성은 사용자가 입력할 검색어를 예측하여 원하는 정보를 신속하게 검색할 수 있도록 도와주는 기능이다. 추천 스니펫은 검색어와 관련 있는 정보를 검색 결과 상단에 눈에 띄기 쉽게 표시한다.

▲ 추천 스니펫의 업데이트된 피드백 링크. 출처=구글

두 기능을 사용할 때 표시되는 콘텐츠는 알고리즘을 통해 생성된다. 다른 사용자들의 검색어와 웹에서 액세스 할 수 있는 정보가 반영됐다. 이 때문에 원하지 않거나 부정확하거나 불쾌감을 주는 검색 결과들이 표시되기도 한다. 구글은 검색어 자동 완성 및 추천 스니펫을 사용할 때 표시되는 콘텐츠를 신고하는 방법을 대폭 간소화했다.

사용자가 민감하거나 쓸모없는 콘텐츠를 발견했을 때 구글에 직접 신고할 수 있도록 새로운 피드백 도구의 카테고리를 명확하게 분류했다. 제출된 피드백은 구글 알고리즘을 개선하는 데 활용할 예이다.

지난 24일 구글은 검색창에 '카카오 맵'을 검색하면 '다음 지도를 망쳐버린 카카오'란 이름을 가장 먼저 보여줘 논란이 됐다. 이름만 저렇게 뜰뿐 클릭해 들어가면 카카오맵 사이트로 정상적으로 접속됐다.

구글은 이러한 문제를 해결하기 위해 콘텐츠 정책을 어떻게 개정해야 할지 파악한 후 해당 정책을 업데이트했다. 업데이트한 정책은 고객 센터에 게시해 누구나 검색어 자동 완성 기능과 특정 검색어를 삭제하는 방법에 대해 알아볼 수 있도록 했다.

구글은 최근 검색 서비스 운영 방식 사이트를 업데이트해 사용자와 웹사이트 소유자에게 검색 기반 기술에 대한 상세한 정보를 제공하기 시작했다. 사이트에서는 구글 검색 순위 시스템이 수천억개의 페이지 정보를 분류한 후 사용자에게 검색 결과를 제공하는 방식에 대해 설명하고 사용자 테스트 프로세스도 간략하게 소개하고 있다.