Car-tech

Google : 1 억 2 천 9 백만 개의 서로 다른 책이 게시되었습니다.

인텔-늑대와여우-코디, 건강 파수꾼「헬스케어PC」한배 탔다

인텔-늑대와여우-코디, 건강 파수꾼「헬스케어PC」한배 탔다
Anonim

전세계에 얼마나 많은 도서가 있는지에 대해 궁금해 한 사람들에게 Google은 Google 도서 프로젝트에서 일하는 Google 소프트웨어 엔지니어 인 Leonid Taycher에 따르면 129,864,880 개의 답변을 제공합니다.

번호 견적 전세계 도서 정보는 조직의 호기심을 자극하는 것 이상의 의미를 지니고있다. 또한 전세계 정보를 체계적으로 조직한다는 야심 찬 목표를 달성하기 위해 수행해야 할 작업에 대한 로드맵을 제공한다.

당신은 세계의 모든 책을 디지털화하려고 노력하는 회사의 일부입니다. 당신이 자주 얻는 첫 번째 질문은 '얼마나 많은 책이 있나?'라는 것입니다. "Taycher는 견적을 발표하는 블로그 게시물에서 설명했습니다.

[추가 읽기: 최고의 TV 스트리밍 서비스]

합리적인 근사치를 찾기 위해 ISBN (International Standard Book Numbers)과 같은 여러 카탈로그 시스템에서 책 정보를 수집하여 시작했습니다.

이러한 카탈로그는 도움이되지만 명확한 계산을 제공하지는 않습니다 그러나. 예를 들어, ISBN은 1960 년대 이래로 서적에만 배정되어 서양 국가에서만 사용되는 경향이 있습니다.

ISBN 번호에 여러 권의 책이 할당되어 있으며 출판사는 책 이외의 항목에 ISBN을 할당했습니다. Google 엔지니어는 약 150 개의 카탈로그와 디렉토리를 샅샅이 뒤져 볼 수있는 중복 항목을 없애기 위해 프로그램을 작성했습니다.

Google은 또한 T-Shirts 및 DVD와 같이 많은 수의 Taycher는 설명한다. 예를 들어, 텍스트의 소프트 커버와 하드 커버 에디션은 두 권의 책으로 계산된다. 셰익스피어의 텍스트와 같은 많은 다른 버전이있다. "햄릿"은 그들이 포함 할 수있는 서문과 해설로 인해

6 월 현재 보스턴의 USENIX 연례 기술 컨퍼런스 (USENIX Annual Technical Conference)에서 Google 도서 엔지니어링 관리자 인 Jon Orwant가 발표 한 프리젠 테이션에 따르면 회사는 1200 만 권의 책을 스캔했습니다. 이 책은 약 480 개 언어로 작성되었습니다 (Star Trek에서 제작 한 Klingon 언어로 된 3 권의 책 포함).

회사는 10 년 이내에 기존 도서의 스캔을 완료 할 계획입니다. 결과적으로 가상 컬렉션은 40 억 페이지와 2 조 단어로 구성 될 것이라고 Orwant는 말했습니다.

세계 책의 약 20 %가 공개되어 있다고 Orwant는 설명합니다. 이 책의 약 10-15 %가 인쇄되어 있습니다. 나머지 도서 (모든 도서의 대다수)는 여전히 저작권으로 보호되어 있지만 절판되어 있습니다. Google은 전 세계 약 40 개 대형 도서관에서 디지털화하기 위해이 책의 사본을 차용 중입니다.

절판 된 책에서 스캔되지만 저작권으로 보호되는 것은이 행위입니다 출판 업계의 반대에도 불구하고

회사는 현재 뉴욕 남부 지방 법원으로부터이 책을 스캔 할 수 있는지에 대한 판단을 기다리고있다.

2005 년 저자 조직과 미국 출판 협회 (Association of American Publishers)는 도서 검색을 통해 저자의 저작권을 침해한다고 주장하면서 집단 소송을 별도로 제기했다.

구글은이 책의 디지털 사본을 판매하기를 원한다고 주장했다. 책을 인쇄하고, 저자가 청구 할 로열티를 따로 설정하십시오. 이 회사는 또한 웹 서치에서이 책의 ​​일부분을 밝히기를 희망하고 있으며,이 사용법은 미국의 공정 사용 원칙에 해당한다고 주장합니다.

전세계 책을 스캔하면 검색 기능이 향상 될뿐만 아니라 다른 이점도 누릴 수 있다고 Orwant는 설명합니다. 이러한 모든 볼륨이 디지털화되면 해당 내용을 분석하여 새로운 통찰력을 얻을 수 있습니다. 언어 학자들은 특정 단어가 널리 보급 된시기 또는이 단어를 처음 사용하는 사람을 발견 할 수 있습니다.

구글 북 수색은 예를 들어 아이작 뉴튼과 갓 프리드 라이프니츠가 - 또는 누군가 다른 사람이 전적으로 미적분학을 발명했는지에 대한 논쟁을 알릴 수있다.

"우리는 문구가 아니라 컨셉을위한 것 "이라고 설명했다. "우리는 무한 성의 아이디어가 다른 언어로 변형 될 수 있고, 동시에 검색을 할 수있는 모든 다른 방법을 택할 수 있습니다."

"우리가 더 많은 것을 폭로하기 시작할 때 이 컬렉션은 사람들이 전에 물어볼 수 없었던 이런 질문을 할 수있게 해줄 것 "이라고 말했다.

IDG 뉴스 서비스 편집자 인 후안 카를로스 페레즈 (Juan Carlos Perez)는이 보고서에 기고했다.

IDG 뉴스 서비스

에 대한 일반적인 기술 소식. @Joab_Jackson에서 Twitter의 Joab을 팔로우하십시오. Joab의 전자 메일 주소는 [email protected]입니다.