[ì¤íì¸í°ë·°]'ê°ìí ì¤í 리ì§'(IP SAN)ì ê´í 5ê°ì§ ê¶ê¸ì¦
인터넷 검색 엔진에는 웹 페이지의 텍스트 크롤링에 주로 초점을 맞추고 있지만 구조화 된 데이터를 분석하고 체계화하는 방법에 대한 연구는 매우 중요하다고 회사 과학자는 금요일 밝혔다. "913"웹에 많은 구조화 된 데이터가 있으며 헤일리는 매사추세츠 공과 대학 뉴 잉글랜드 데이터베이스 데이 (New England Database Day) 컨퍼런스에서 알리 헤일리 (Alon Halevy)가 말했다.
헤일리는 부분적으로 소위 말하는 "딥 웹"소스를 언급했다. Cars.com 또는 Realtor.com과 같은 양식 기반 웹 사이트 뒤에있는 데이터베이스와 같이 Google은 정보를 유용하게 보일 경우 검색 결과에 웹 페이지를 가져 와서 검색 색인에 포함시키는 등 다양한 방식으로 검색어를 제출했습니다.
[추가 정보: 최고의 TV 스트리밍 서비스]
헤일리 대변인은 많은 웹 사이트에서 구조화 된 테이블에서 발견 된 데이터를 분석하기를 원한다고 Halevy가 말했다. 예를 들어 미국 대통령이 나열된 웹 페이지에 테이블을 제공했다.수십억 달러를 벌어 들였다. 그는 "이들 중 98 % 이상이 흥미롭지 않다는 것을 매우 빨리 깨달았습니다. 그러나 중요한 필터링을 한 후에도 색인을 생성하는 데 약 1 억 5 천 5 백만 테이블이 남아 있습니다."라고 말했습니다.
Google의 궁극적 인 목표 중 하나는 "측면 Halevy는 "베트남 인구와 같은 특정 사실에 대한 질문과는 대조적으로"베트남 여행 "과 같은 탐구적인 검색어에 대해 검색 쿼리를 사용합니다. 예를 들어, 이전 쿼리는 비자 요구 사항, 날씨 및 여행 패키지에 관한 정보를 생성합니다.
Kosmix가 제공하는 검색 서비스의 아이디어가 있지만 Halevy에 따르면 Google은 더 나아 가고 싶습니다. 그는 "코스 믹스 (Kosmix)는 너에게 '양상 (aspect)'을 줄 것이지만 정보 소스에 붙어있다"고 말했다. 그는 "코스모스에서 베트남 여행"을 검색하면 뉴욕 타임스의 레스토랑 리뷰, 야후와 플리커, 쇼핑 닷컴의 쇼핑 정보 및 구글의 일반적인 웹 결과 등이있다.
"우리의 경우 모든 측면은 웹 검색 결과 일 뿐이지 만 우리는이를 다르게 구성 할 것"이라고 할리비는 말했다.
Microsoft Research India는 구조화되지 않은 주소 데이터를 사용하여지도 검색을 위해 설계된 기술을 개발합니다. 인도는 주소가 구조화 된 형식이 아닌 인도와 같은 국가에서도지도를 검색 할 수있는 기술을 개발했습니다.
연구 프로젝트는 강력한 위치 검색이라고 불리며이 기술의 프로토 타입은 이미 준비가되었다고 B. Ashok, 수요일, Microsoft Research India의 고급 개발 및 프로토 타입 담당 이사. 인도에서 개발되었지만,이 기술은 비 구조적 주소가있는 모든 국가에 배포되도록 설계되었으며 추가되었습니다.
공격자가 페이스 북의 전화 검색 기능을 악용하여 유효한 것을 찾지 못한다고 연구원은 말합니다. 보안 연구원에 따르면 공격자는 유효한 전화 번호와 소유자 이름을 찾기 위해 페이스 북의 전화 검색 기능을 악용 할 수 있다고 보안 연구원은 전했다.
페이스 북 독립적 인 보안 연구원 인 Suriya Prakash는 최근 블로그 포스트에서 모바일 버전의 웹 사이트를 통해 사용자가 수행 할 수있는 전화 번호 검색 수를 제한하지 않는다고 말했다.
페이스 북은 방대한 양의 데이터를 처리하기 위해 '콜드 스토리지'를 사용할 준비를합니다. 소셜 네트워크의 사용자가 매월 업로드하는 새로운 사진 7 페타 바이트에 대처할 수있는 데이터를 저장합니다. 은 소셜 네트워크 사용자가 매월 업로드하는 새로운 사진 7 페타 바이트를 처리하기 위해 데이터를 저장하는 방식을 다시 생각합니다. 회사의 인프라 엔지니어링 담당 부사장은 사진 수가 늘어남에 따라 페이스 북은 저렴하고 전력을 많이 소비하는 방법을 찾아야한다고 주장했다.
사용자는 하루에 약 3 억 개의 사진을 업로드하고 특별한 경우, 페이스 북의 제이 파리 키 (Jay Parikh)는 수요일 암스테르담에서 개최 된 유럽 구조 회의에서 말했다. "할로윈은 가장 큰 사진 업로드 일 중 하나이며, 하루에 업로드되는 사진의 양은 약 1 ~ 20 억 개 사이 일 것입니다."라고 그는 말했습니다.