구성 요소

Google이 1 조 이상의 고유 웹 URL을 포함

[화이트보드]가상화 환경의 스토리지 ‘IP SAN’을 선택하는 이ìœ

[화이트보드]가상화 환경의 스토리지 ‘IP SAN’을 선택하는 이ìœ
Anonim

회사 측 관계자는 매일 수십억 개의 개별 페이지로 블로그 포스트에 글을 남겼다.

구글은이 발견을 발표하는 것 외에도 색인의 범위와 규모를 홍보하는 기회를 가졌다.

그 중 많은 페이지가 서로 유사하거나 자동 생성 된 콘텐츠를 나타냅니다. 이는 검색 사용자에게별로 도움이되지 않지만 검색 엔진에 대한 가장 포괄적 인 색인을 자랑스럽게 여깁니다. 우리의 목표는 항상 모든 세계 데이터를 색인화하는 것이 었습니다. "Jesse A Google의 웹 검색 인프라 팀의 소프트웨어 엔지니어 인 lpert와 Nissan Hajaj. Google이 색인의 크기에 대해 공개적으로 발표 한 지 오래되었지만 주요 검색 엔진 플레이어들 사이에서 논란과 반대를 일상적으로 생성 한 주제입니다 대부분의 사람들이 두 페이지 이상의 웹 결과를 스캔하는 일이 거의 없다는 것이 명백 해지자 색인 크기의시기가 끝났습니다. 즉 중요한 정보는 10 개 또는 20 개의 실제 웹 링크를 전달하는 것입니다. 직접적인 사실 답변을 제공하는 것도 중요합니다. 원하는 정보를 찾기 위해 5,000 개의 결과를 거칠 사람이 거의 없기 때문입니다.

주요 공식 블로그에 게시 된 이번 구글의 발표는 야후, 마이크로 소프트, Ask.com과 같은 라이벌들의 반응을 촉발시킬 것이다.

한편 구글은 또한 어떻게 분석하고 어떤 빈도로 이들을 분석하는지에 대한 흥미로운 정보를 공개했다

"오늘날 Google은 업데이트 된 페이지 정보를 수집하고 하루에 여러 번 전체 웹 링크 그래프를 다시 처리하며 웹을 지속적으로 다운로드합니다.1 조 개의 URL 그래프는 1 조 개의 교차로로 구성된지도와 유사합니다 매일 여러 번 그래서 우리는 미국의 모든 도로의 모든 교차로를 완전히 탐사하는 것과 동등한 계산 작업을 수행합니다. 단, 미국의 약 5 만 배의 도로지도와 5 만 배의 도로 및 교차로 관리들이 썼다.