블로그 검색 알아보기 - 구글 편

카테고리 : 소개/IT 상식

구글은 검색이 주 서비스 제품이라 검색에 대한 가이드라인 및 원칙이 방대하며 구체적입니다.

 

이런 원칙들 덕분에 알고리즘이 대체로 거의 변화없이 좋은 품질의 검색결과를 낼 수 있으며 변경사항에 대응하여 발전해나가고 있습니다.

 

타 검색서비스에서는 색인조차 안하는 전문 글들을 쉽게 찾아볼 수 있습니다.

타 검색서비스에서는 전문 글에는 가치있는 키워드가 없다고 판단하여 색인조차 안하는 경우가 많습니다.

 

 

구글 검색알고리즘

구글의 공식문서에서 제공하는 알고리즘에대해 정리분석합니다.

여기에는 개인적인 의견이 포함되어있을 수 있으며, 공식문서는 페이지 하단에 모두 링크되어있으므로 공식문서를 참고해주셔도 됩니다.

 

단어 분석

먼저 검색하는 사람의 의도를 파악해야됩니다.

 

예를들어 (예시문장은 구글 공식문서를 참고하였습니다.)

  • 전구를 바꾸는 방법 : 교체하다.
  • 우체국에서 외환 바꾸기 : 교환하다.
  • 노트북 밝기 바꾸는 법 : 조절하다.

같은 단어인 바꾸다라는 의미지만 문맥에 따라 단어의 의미가 달라집니다.

 

구글은 검색하는 사람이 원하는 정보와 가지고 있는 문서의 정보를 비교하여 더 알맞은 검색결과를 보여줍니다.

 

 

웹 페이지 관련성

- 정보가 관련성이 있는지를 확인하는 가장 기본적인 방법은 웹페이지에 검색어와 동일한 키워드가 포함되어 있는지 확인하는 것입니다. 

검색알고리즘으로 웹페이지가 그냥 키워드를 반복하고 있는지, 사용자가 원하는 정보를 포함하는지 분석하여 결과를 보여줍니다.

 

- 비슷한 주제의 글을 지속적으로 작성한 경우 가산점이 주어집니다.

비슷한 주제의 글을 지속적으로 작성한다면 전문성을 인정해줍니다.

 

- 동일한 언어로 작성된 경우 가산점이 주어집니다.

예) 한국어로 검색시 한국어 검색결과가 주로 상단에 뜹니다.

 

 

구글에서 알고리즘을 공식적으로 밝히지는 않으나

  • 원하는 키워드로 설명이 되어있는가?
  • 이용자들이 정보를 얻어갔는가? (오래 머물렀는지, 방문후 같은키워드로 검색했다면 감점가능)

등의 흔한 방법도 당연히 고려됩니다. 

 

 

콘텐츠의 품질

일반적인 검색어라면 비슷한 글이 구글에는 셀수없이 많이 등록되어있습니다.

 

구글 알고리즘은 콘텐츠의 최신성, 검색어의 등장 빈도, 페이지의 우수한 사용자 환경 제공 여부 등 수백 개의 다양한 요인을 분석하여 웹에서 제공할 수 있는 가장 훌륭한 정보를 표시합니다.

 

정확한 알고리즘과 분석사항, 가중치는 절대 공개하지 않습니다.

이유는 점수로 채점한다면 당연히 점수잘받는방법으로 스팸문서를 최상단에 올릴수 있기 때문입니다.

 

웹에는 검색결과 상단에 표시되기 위해 검색어를 반복하는등 스팸사이트가 매우 많습니다.

Google은 스팸을 파악하고 Google의 웹마스터 가이드라인을 위반하는 사이트를 검색결과에서 제외하기 위한 알고리즘을 작성합니다.

 

 

웹페이지의 활용도(접근성)

접근성 알고리즘으로 여러 사용자가 이용가능한지 테스트 합니다.

 

  • 사이트가 다른 브라우저에서 올바르게 표시되는가
  • 사이트가 데스크톱, 태블릿, 스마트폰 등 모든 기기 유형과 크기에 맞게 설계되었는가
  • 페이지 로드 시간이 느린 인터넷 연결을 사용하는 사용자에게 적합한가

 

사이트가 다른 브라우저에서 올바르게 표시되는가?

* 브라우저 호환성

사용자는 다양한 웹브라우저를 사용하기 때문에 어떤 브라우저로 봐도 지원이 잘 되어야 검색에 유리합니다.

예를들어 IE9를 지원하는 사이트가 IE11만 지원하는 사이트보다 점수가 높게 평가됩니다.

 

따라서 가능한 많은 브라우저에서 사이트 테스트를 해봐야 좋습니다.

 

* 올바르고 오류가 없도록 HTML 작성

일부 브라우저에서는 오류가 있어도 자동으로 수정해주나, 오류가 있다면 브라우저에서는 웹페이지가 의도대로 안보일겁니다.

 

* 올바른 문자 인코딩 지정하기

<meta charset="utf-8"> 같은 메타태그를 넣어줘야 페이지내 문자가 안깨집니다.

 

* 누구나 액세스할 수 있는 사이트 만들기

  • 자바스크립트
  • Flash
  • ActiveX

이와같은 기술로 페이지작성보다 텍스트로 글을 보여주는게 검색에 훨씬 좋습니다.

 

사이트가 데스크톱, 태블릿, 스마트폰 등 모든 기기 유형과 크기에 맞게 설계되었는가?

구글 공식 설명 확인하기 (링크)

 

 

페이지 로드 시간이 느린 인터넷 연결을 사용하는 사용자에게 적합한가?

구글의 PageSpeed Insights 기능이 있습니다.

 

글작성일(2020-07-07) 기준 이 기능은 한국에서 정확성이 떨어집니다.

한국에 서버가 있는 티스토리 같은경우 페이지 속도가 매우빠르게 설계하더라도 모바일점수 80점정도가 최고 입니다.
아직 테스트서버가 해외에만 있는 이유로 생각되며
아직은 한국에서는 해설 참고만 하고 다른방식으로 속도측정을 하는게 좋습니다.

 

 

문맥 고려하기

위치, 이전 검색 기록과 같은 정보 및 Google 검색 설정 모두 Google이 사용자가 검색하는 순간에 사용자에게 가장 유용하고 관련성 있는 맞춤 검색결과를 제공하는 데 도움이 됩니다.

지역에 따라 식당검색시 지도와 식당정보등을 보여주고

 

이전 검색어로 "us presidents"을 검색한 후 "도널드 트럼프" 검색시

 

그냥 "도널드 트럼프" 검색시 둘의 검색결과는 다르다.

 

 

참고문서

Google 검색의 원리 https://www.google.com/search/howsearchworks/?fg=1

 

Google 검색의 원리 | 개요

Google에서 사용자에게 유용하고 관련성이 높은 검색결과를 신속하게 제공하기 위하여 인터넷에 있는 방대한 정보를 어떻게 훑어보고 구성하는지 자세히 알아보세요.

www.google.com

 

현재 글에 참고하진 않았으나 추가로 볼만한 문서(영어)

https://static.googleusercontent.com/media/guidelines.raterhub.com/ko//searchqualityevaluatorguidelines.pdf

이 문서는 세세하게 나와있으나 너무 길어서 번역할까 고민하다가 말았습니다.

 

 

블로그 검색 알아보기

 

저작권 보호안내
무단 전재, 재배포 행위는 금지됩니다. (글을 복사하여 게시금지)
본문의 일부(링크용 문장) 인용은 가능하지만, 출처와 링크(a 태그)를 남기셔야 됩니다.
(웹툴을 이용하고, 스크린샷/녹화하는것은 상관없습니다.)

예외적으로. 저에게 허락받은 경우에는 본문을 전재할 수 있습니다.

만약, 본문 공유를 원하신다면 링크 공유를 해주세요

저작권 정책 확인하기
링크 공유하기

 댓글