티스토리 뷰

이번 포스팅에서는 구글 애널리틱스 스팸 필터 설정에 대해서 알아 보겠습니다.


이전 포스팅에서 구글 애널리틱스를 티스토리에 연결 하여 통계 데이터를 볼수 있도록 설정 하였습니다.

구글 애널리틱스를 설정 하고 나서 접속을 해보면 실제 정상적으로/유효하게 접속된 기록도 있는 반면에 실제로는 접속하지 하고 않고 의미없는 분석 데이터를 제공하여 통계데이터의 질을 저하 시키는 스팸성 데이터가 종종 유입되고 있었습니다.




구글 애널리틱스 메뉴 중 [획득] -> [전체] -> [소스/매체]에서 스팸성 데이터를 확인 할 수 있습니다.

해당 메뉴의 기능은 구글 애널리틱스가 설정 된 사이트의 접속 유입 경로를 표현 해 주는 기능을 하는것으로  실제 어느 웹사이트/검색사이트에서 자신의 사이트로 어떤 키워드 혹은 어떤 경로로 접속하였는지를 수치상으로 표현 해주고 있습니다. 데이터를 확인 해보면 다음(daum), 네이버(naver),구글(google) 과 같은 일반적인 검색사이트 이외에 아래와 같은 스팸성(쓰레기) 데이터를 확인 할 수 있습니다.


forum.topic

makeeprogress

smartphonediscount


이러한 데이터를 쓰레기 데이터라고 합니다.

쓰레기 데이터란 ?



사이트의 데이터 질을 떨어뜨리기 위한 의미없는 데이터로 스팸 봇이 구글 애널리틱스등의 웹로그 수집툴의 


추적 로그를 수집하여 실제 사이트에 접속 하지 않고 스크립트 실행만으로 유입되는 데이터


이러한 쓰레기 데이터를 유입하는 이유는 여러가지가 있지만 대표적으로 2개로 분류 할 수 있습니다.


1.특정 사이트 홍보

유입데이터는 위에서 확인 한 것 같이 대부분 접속 URL의 형태를 가지고 있습니다.

해당 유입 URL를 연결하면 특정 사이트 혹은 특정 페이지로 이동 시킨후 사이트/제품은 홍보용 페이지로 사용하고 있습니다.


2.악성코드 배포

해당 URL로 접속 시 악성코드등을 배포시켜 좀비 피씨 혹은 사용자의 데이터를 삭제/암호화하여 복구 하도록 

유도 하여 금전을 요구하는데 사용 하고 있습니다.



출처: Stop Ghost Spam in Google Analytics with One Filter


이러한 쓰레기/스팸데이터가 지속적으로 유입된다면 구글 애널리틱스 취지 자체를 위험하고 일반 사용자에게 여러가지 불편을 주게 됩니다.

구글 애널리틱스에서 이러한 데이터가 유입되지 않도록 여러가지 방법을 제공 해 주고 있습니다.

이제부터 구글 애널리틱스에서 설정하는 방법에 대해서 알아 보도록 하겠습니다.


1. 구글 애널리틱스 [관리] -> [모든필터]를 선택 해줍니다.





2.[필터 추가]를 선택 해줍니다.



3.각각의 필터 데이터를 설정 해주고 하단의 저장을 선택 합니다.

  

-[필터이름] : 필터를 구분하기 위한 이름으로 특별한 규정/형식이 없으므로 본인이 구분 할 수 있는 이름으로 설정 해줍니다.

-[필터 유형] : "맞춤"으로 선택(기본적으로 "사전 정의됨"으로 선택되어 있으나 맞춤으로 설정하여 진행 하는것이 좋습니다.)

-[제외] : 유입되는 스팸/쓰레기 데이터의 차단이 목적이므로 제외를 선택 해 줍니다.

-[필터 입력란] : 앞에서 확인 해 보았던 스팸URL은 모두 캠페인 소스이므로 캠페인 소스를 선택 해 줍니다. 

-[필터 패턴] : 실제 제외할 유입URL를 작성 해줍니다.

보기에 필터 적용의 "사용 가능한 보기"에서 해당 필터를 적용한 사이트를 선택 해준 후

  반드시  추가버튼을 눌러 "선택된 보기"에 해당 웹사이트가 표시되어야만 실제 필터가 적용 됩니다. 

  반드시 추가 후 확인 해주어야 합니다.



4.정상적으로 등록된 필터를 목록에서 확인 해줍니다.

실제 필터를 적용 한 이후 데이터를 확인 해보면 더이상 쓰레기 데이터가 없는 것을 확인 할 수 있습니다.

지금까지 구글 애널리틱스에서 스팸/쓰레기 데이터의 필터링에 대해서 알아보았습니다.

이런한 스팸성 데이터들은 유입시키도록 하는 곳은 여러곳이 있으므로, 새로 스팸성 데이터가 유입될 때마다 해당  URL을 필터에 추가 해서 더이상 유입이 되지 않도록 관리 해야 합니다. 이러한 스팸  데이터는 통계/분석의 악역향을 끼치므로 반드시 필터로 설정 해주어야 합니다. 


댓글