오늘 우연히 구글 검색에서 내 블로그의 키워드중 하나인 '네이버 상단 광고'를 검색했다가 인지도가 높은 사이트도 구글 키워드 어뷰징에 이용되는것을 확인하였습니다.
요즘 chatGPT의 영향으로 키워드를 조합하여 만든 사이트들이 구글검색 상단에 위치한것을 자주 볼 수 있고, 검색 품질이 많이 떨어졌음을 체감할 수 있었는데요.
이걸 낮은 수준의 취약점이라고도 볼 수 도 있습니다.
결국에는 사이트의 평판 저하로 이어지기 때문에 사이트 운영자시라면 하단에 소개해드릴 대처법을 적용해보시는게 좋을것 같습니다.
작동원리
사이트에 검색시 일반적으로 검색 키워드를 포함한 제목을 서버에서 출력하게 되어있습니다.
제목은 검색엔진에서 중요하게 보는 내용중 하나인데, 여기에 특정 키워드(이 글 예시에서는 '네이버 상단 광고')가 포함되어있으면 광고 키워드가 있어도 함께 보여지는 식 입니다.
kakao.com은 당연히 인지도, 사용자 수, 평판 등에서 상위권이기 때문에 구글 검색에서 상단에 뜨기 좋습니다.
이걸 악용한 것으로 보이는데 어떻게 사이트 주인이 아닌데 구글 검색에 등록된것인지는 확실치는 않지만 다음의 방법을 생각해볼 수 있습니다.
- 검색 키워드를 포함하여 생성한 해당 URL로 검색
- 이미 등록 또는 등록 신청한 URL에 해당 URL을 포함 시키기
아무래도 두번째 방법으로 등록되는 것 같네요.
대처법
대처법은 간단한데 검색페이지를 크롤링 하지 않도록 만드는 것 입니다.
그러나 robots.txt에서는 소용이 없습니다.
https://shoppinghow.kakao.com/robots.txt
User-agent:*
Disallow:/
User-agent: Googlebot
Disallow: /html/
Disallow: /search/
Disallow: /mypage/
Sitemap: http://shoppinghow.kakao.com/sitemap/menu/pc
Sitemap: http://shoppinghow.kakao.com/sitemap/model/pc
Sitemap: http://shoppinghow.kakao.com/sitemap/category/pc
Sitemap: http://shoppinghow.kakao.com/sitemap/menu/m
Sitemap: http://shoppinghow.kakao.com/sitemap/model/m
Sitemap: http://shoppinghow.kakao.com/sitemap/category/m
저는 알고 있었는데 다들 알고계실지는 모르겠지만..
구글 크롤링 봇은 robots.txt보다 사이트 내에 meta태그(또는 응답헤더)로 지정된 로봇 태그가 우선순위가 높고, 링크로 연결되어 크롤링 되는 경우 robots.txt를 건너뛰기도 합니다.
구글 크롤링 가이드: https://developers.google.com/search/docs/crawling-indexing/robots/intro?hl=ko
위 검색어가 등록된 shoppinghow.kakao.com의 경우에도 robots.txt에
Disallow: /search/
가 있음에도 검색 결과가 수집되어 있습니다.
따라서 결과 수집을 방지하기 위해서는 아래의 HTML코드가 검색 결과 페이지에 포함되어야 합니다.
<meta name="robots" content="noindex">
'소개 > IT분석' 카테고리의 다른 글
15881555 '도로명 불일치' 스미싱 (21) | 2023.08.22 |
---|---|
장원영 인스타 검정하트(🖤) 기사 팩트체크 (0) | 2023.07.29 |
누누티비가 서비스를 유지하던 방식 (2) | 2023.04.16 |
은행, 정부의 취약한 시스템? (IT기술관점에서 호갱구조대 영상 리뷰) (0) | 2022.07.29 |
최근 확산중인 스미싱 문자 (032번호, crvud.com, tgbhb.com) (2) | 2022.04.13 |
KT + CloudFlare 오후8시~새벽1시경 느려지는 현상 (1) | 2021.11.23 |
d2ufj6gm1gtdrc.cloudfront.net 주소는? (0) | 2021.10.11 |
최근 CloudFlare의 라우팅 변경사항 (4) | 2021.09.01 |
저작권 보호안내
무단 전재, 재배포 행위는 금지됩니다. (글을 복사하여 게시금지)
본문의 일부(링크용 문장) 인용은 가능하지만, 출처와 링크(a 태그)를 남기셔야 됩니다.
(웹툴을 이용하고, 스크린샷/녹화하는것은 상관없습니다.)
예외적으로. 저에게 허락받은 경우에는 본문을 전재할 수 있습니다.
만약, 본문 공유를 원하신다면 링크 공유를 해주세요
저작권 정책 확인하기링크 공유하기