ì¸í -ëëìì¬ì°-ì½ë, ê±´ê° íìê¾¼ãí¬ì¤ì¼ì´PCãíë°° íë¤
전세계에 얼마나 많은 도서가 있는지에 대해 궁금해 한 사람들에게 Google은 Google 도서 프로젝트에서 일하는 Google 소프트웨어 엔지니어 인 Leonid Taycher에 따르면 129,864,880 개의 답변을 제공합니다.
번호 견적 전세계 도서 정보는 조직의 호기심을 자극하는 것 이상의 의미를 지니고있다. 또한 전세계 정보를 체계적으로 조직한다는 야심 찬 목표를 달성하기 위해 수행해야 할 작업에 대한 로드맵을 제공한다.
당신은 세계의 모든 책을 디지털화하려고 노력하는 회사의 일부입니다. 당신이 자주 얻는 첫 번째 질문은 '얼마나 많은 책이 있나?'라는 것입니다. "Taycher는 견적을 발표하는 블로그 게시물에서 설명했습니다.
[추가 읽기: 최고의 TV 스트리밍 서비스]합리적인 근사치를 찾기 위해 ISBN (International Standard Book Numbers)과 같은 여러 카탈로그 시스템에서 책 정보를 수집하여 시작했습니다.
이러한 카탈로그는 도움이되지만 명확한 계산을 제공하지는 않습니다 그러나. 예를 들어, ISBN은 1960 년대 이래로 서적에만 배정되어 서양 국가에서만 사용되는 경향이 있습니다.
ISBN 번호에 여러 권의 책이 할당되어 있으며 출판사는 책 이외의 항목에 ISBN을 할당했습니다. Google 엔지니어는 약 150 개의 카탈로그와 디렉토리를 샅샅이 뒤져 볼 수있는 중복 항목을 없애기 위해 프로그램을 작성했습니다.
Google은 또한 T-Shirts 및 DVD와 같이 많은 수의 Taycher는 설명한다. 예를 들어, 텍스트의 소프트 커버와 하드 커버 에디션은 두 권의 책으로 계산된다. 셰익스피어의 텍스트와 같은 많은 다른 버전이있다. "햄릿"은 그들이 포함 할 수있는 서문과 해설로 인해
6 월 현재 보스턴의 USENIX 연례 기술 컨퍼런스 (USENIX Annual Technical Conference)에서 Google 도서 엔지니어링 관리자 인 Jon Orwant가 발표 한 프리젠 테이션에 따르면 회사는 1200 만 권의 책을 스캔했습니다. 이 책은 약 480 개 언어로 작성되었습니다 (Star Trek에서 제작 한 Klingon 언어로 된 3 권의 책 포함).
회사는 10 년 이내에 기존 도서의 스캔을 완료 할 계획입니다. 결과적으로 가상 컬렉션은 40 억 페이지와 2 조 단어로 구성 될 것이라고 Orwant는 말했습니다.
세계 책의 약 20 %가 공개되어 있다고 Orwant는 설명합니다. 이 책의 약 10-15 %가 인쇄되어 있습니다. 나머지 도서 (모든 도서의 대다수)는 여전히 저작권으로 보호되어 있지만 절판되어 있습니다. Google은 전 세계 약 40 개 대형 도서관에서 디지털화하기 위해이 책의 사본을 차용 중입니다.
절판 된 책에서 스캔되지만 저작권으로 보호되는 것은이 행위입니다 출판 업계의 반대에도 불구하고
회사는 현재 뉴욕 남부 지방 법원으로부터이 책을 스캔 할 수 있는지에 대한 판단을 기다리고있다.
2005 년 저자 조직과 미국 출판 협회 (Association of American Publishers)는 도서 검색을 통해 저자의 저작권을 침해한다고 주장하면서 집단 소송을 별도로 제기했다.
구글은이 책의 디지털 사본을 판매하기를 원한다고 주장했다. 책을 인쇄하고, 저자가 청구 할 로열티를 따로 설정하십시오. 이 회사는 또한 웹 서치에서이 책의 일부분을 밝히기를 희망하고 있으며,이 사용법은 미국의 공정 사용 원칙에 해당한다고 주장합니다.
전세계 책을 스캔하면 검색 기능이 향상 될뿐만 아니라 다른 이점도 누릴 수 있다고 Orwant는 설명합니다. 이러한 모든 볼륨이 디지털화되면 해당 내용을 분석하여 새로운 통찰력을 얻을 수 있습니다. 언어 학자들은 특정 단어가 널리 보급 된시기 또는이 단어를 처음 사용하는 사람을 발견 할 수 있습니다.
구글 북 수색은 예를 들어 아이작 뉴튼과 갓 프리드 라이프니츠가 - 또는 누군가 다른 사람이 전적으로 미적분학을 발명했는지에 대한 논쟁을 알릴 수있다.
"우리는 문구가 아니라 컨셉을위한 것 "이라고 설명했다. "우리는 무한 성의 아이디어가 다른 언어로 변형 될 수 있고, 동시에 검색을 할 수있는 모든 다른 방법을 택할 수 있습니다."
"우리가 더 많은 것을 폭로하기 시작할 때 이 컬렉션은 사람들이 전에 물어볼 수 없었던 이런 질문을 할 수있게 해줄 것 "이라고 말했다.
IDG 뉴스 서비스 편집자 인 후안 카를로스 페레즈 (Juan Carlos Perez)는이 보고서에 기고했다.
IDG 뉴스 서비스
에 대한 일반적인 기술 소식. @Joab_Jackson에서 Twitter의 Joab을 팔로우하십시오. Joab의 전자 메일 주소는 [email protected]입니다.
1. 사고와 DNS 공격 코드에 의해 게시 된 주요 인터넷 결함에 대한 세부 정보 : 컴퓨터 보안 회사가 실수로 인터넷 DNS (도메인 이름 시스템)의 주요 결함에 대한 세부 정보를 온라인에 게시 한 후 공격 코드 순찰했다. Matasano Security의 잘못된 게시물은 신속하게 제거되었지만, 우리 모두가 알다시피 인터넷에서 어떤 일이 발생하면 실제로 제거 할 수는 없습니다. 물론 2 일 후 공격 코드가 게시되었습니다. 그리고 이제 우리 모두는 기다림을해야합니다. 결함이 예상되는 공격이 어떤 사람들이 믿는 것처럼 비극적 일지, 아니면 그렇게 큰 것이 아닌지 다른 사람들이 생각하는 것처럼 기다려야합니다.
2. 샌프란시스코 DA는 도시의 네트워크 암호를 공개하고 샌프란시스코의 시장은 네트워크에 열쇠를 되 찾는다 : 샌프란시스코 지방 검사는 테리 차일 즈 (Terry Childs)의 경우 5 백만 달러의 보석금을 삭감하기위한 국방부의 요청에 따라 법원의 동의를 얻어 공개적으로 사용자 이름을 공개하고 도시 네트워크의 암호. 차일드의 보석금 삭감에 대한 논쟁의 일부? 조사관이 자신의 컴퓨터에 저장 한 사용자 이름과 암호는 사용되는 "임박한 위험"을 나타냅니다. 그래 그리고 나서. 차일 즈는 패스워드를 포기하기를 거부 한 도시 네트워크 관리자로 컴퓨터를 조작하여 도시 광역 네트워크 인질로 잡고있다. 샌프란시스코 시장 개빈 뉴섬 (Gavin Newsom) 시장은 비밀스럽게 교도소에서 차일 즈 (Childs)를 만났고 월요일에 패스워드를 넘겨 받도록했다.
Google Billboard Ads Microsoft for Google 및 Google Apps 홍보
Google은 Microsoft를 타겟팅하고 Google Apps를 홍보하는 길가 광고 캠페인을 시작합니다.
시만텍 : 유출 된 Norton Utilities 2006 소스 코드가 이미 몇 달 전에 게시되었습니다.
익명의 해커 티브 집단과 관련된 해커가 시만텍의 '노턴 유틸리티 2006'제품은 '해적 베이 비트 토런트 (The Pirate Bay BitTorrent)'웹 사이트에 공개됐다. 보안 업체에 따르면 같은 파일이 1 월에 공개됐다.