ìí´ë¡ ì§ê¸ë²¨ë½
데이터는 콘텐츠를 도난 당했던 다른 경쟁 구직 게시판에서 끝납니다. 이는 지적 재산권을 무료로 또는 심지어 구독 모델을 가진 사람들에게 공개해야하는 웹 사이트를 괴롭히는 문제이다.
그러나 봇 탐지를 전문으로하는 애틀랜타 기반의 보안 회사는 스크린 스크래핑을 탐지 할 수있는 소프트웨어를 개발했다
[추가 정보: Windows PC에서 멀웨어를 제거하는 방법]
Pramana의 주요 제품인 HumanPresent는 자동화 된 봇을 탐지하여 예를 들어 스팸을 웹 기반 양식에 입력하거나 무료로 등록합니다Pramana는 HumanPresent에 대해 "데이터 마이닝 및 화면 긁힘 방지"모듈을 개발했습니다. 휴먼 프레즌스 (HumanPresent)는 인간이 정상적으로 웹과 상호 작용하는 방식의 차이점을 발견함으로써 봇을 탐지 할 수 있다고 말했다. 보봇 (BOT)이 어떻게 행동하는지와 대조를 이룹니다. 키보드 스트로크, 마우스 클릭 및 해당 작업의 타이밍과 같은 30 개 이상의 메트릭을 살펴 봅니다. HumanPresent는 단일 트랜잭션을 조사하지만 데이터 마이닝 모듈이 수정되어 하나의 봇 Crowder는 말했다.
데이터 마이닝 봇은 브라우저의 사용자 인터페이스를 완전히 우회하는 경향이있다. 예를 들어, 로봇은 많은 양의 데이터가있는 웹 페이지를 요청할 수 있지만 페이지를 스크롤하거나 클릭하지 않습니다. 이러한 방식으로 일련의 페이지를 열어 본 경우 데이터 마이닝 로봇이 도착했음을 의미 할 수 있습니다.
Pramana는 방문자에게 고유 한 ID를 할당하고 방문자의 행동을 분석 한 후 레이블링 여부를 결정할 수 있습니다 방문객은 로봇이든 아니든. 웹 사이트 운영자가 상황을 처리 할 수있는 여러 가지 방법이 있습니다.
봇 컴퓨터의 IP (인터넷 프로토콜) 주소가 영구적으로 차단 될 수 있습니다. Pramana의 데이터 마이닝 모듈을 테스트중인 한 자동차 경매 웹 사이트는 의심스러운 봇을 완전히 잘못된 데이터를 제공하는 "샌드 박스"로 이동 시키기로 결정했습니다. "실제로 데이터 마이닝이므로 오류가 발생했습니다."Crowder가 말했습니다.
웹 사이트 방문자에게 봇이 완료 할 수없는 과제 또는 작업을 요구하는 옵션도 있습니다.
데이터 마이닝 비용은 귀중한 기업 비용입니다. 프리미엄 데이터를 판매하는 회사는 경쟁사가 구독을 구입 한 다음 자동 로봇을 사용하여 자신의 사이트에 대한 데이터를 훔칠 것입니다. 한 예로, 중고차 가격에 대한 기가 바이트의 데이터를 가진 웹 사이트는 데이터가 긁어내어 eBay에서 판매되고 있음을 발견했다.
"그들은 실제로 자신의 콘텐츠와 경쟁하고있다"고 Crowder는 말했다.
웹 사이트는 데이터 스크래핑을 훨씬 쉽게 만들어주는 열악한 디자인입니다. Crowder는 중고차 사이트에 URL (Uniform Resource Locators)을 순차적으로 수정하여 더 많은 데이터를 표시 할 수 있다고 전했다.
데이터 마이닝 모듈은 현재 HumanPresent 제품으로 포장 될 예정이지만 내년 초 Pramana는이를 판매 할 계획이다 별도로 Crowder가 말했다. Pramana는 HumanPresent를 사내 구축 형 또는 서비스 형 소프트웨어 구성으로 제공합니다. SaaS (Software as a Service) 오퍼링의 경우 Pramana의 기술이 웹 응용 프로그램에 통합되고 세션 정보가 다시 전송됩니다 분석을 위해 프라 마나에게. Crowder는 Pramana가 최신 버전의 대기 시간을 크게 줄일 수 있었다고 전했다. 더 많은 속도가 필요한 고객의 경우 기기를 사용할 수 있습니다.
AMD는 AMD의 새로운 상하이를 수용 할 새로운 칩셋을 포함하는 새로운 서버 플랫폼을 발표했다. Advanced Micro Devices는 2009 년 상반기에 새로운 서버 플랫폼을 제공 할 계획이라고 지난 금요일 발표했다.이 플랫폼은 새로운 칩셋을 중심으로 회전한다. 추가 서버 칩을 연결하기위한 다중 소켓. 칩셋은 그래픽 카드와 같은 여러 소켓 및 구성 요소의 칩이 서로 통신하는 방식을 향상시킬 수 있습니다. 이 회사에 따르면 새로운 가상화 기능과 HyperTransport 3.0 버스 기술 지원을 통해 향상된 성능을 제공한다고한다.

올 4 분기에 출시 될 AMD의 곧 출시 될 상하이 서버 칩셋이이 칩셋에 포함될 것이라고 Phil Hughes, 회사 대변인 상하이 칩은 엔비디아와 브로드 컴 칩셋 제품에도 적용될 예정이다. AMD가 2003 년경 옵테론 출시 초기부터 칩셋을 포함하는 서버 플랫폼을 갖고 있지 않았기 때문에 이는 중요한 발표 일 수 있다고 딘 매 캐런 (Dean McCarron) 머큐리 리서치의 수석 애널리스트. 현재 AMD 서버의 대부분은 엔비디아 (Nvidia) 또는 브로드 컴 (Broadcom) 칩셋을 포함하고 있다고 그는 말했다.
Microsoft 소프트웨어 사용자 중 상당수는 소프트웨어 거물의 Hyper-V 소프트웨어 가상화를 위해 ... Microsoft는 월요일에 워싱턴 주 벨뷰에서 개최 된 가상화 출시 파티에서 참석자들의 의견을 토대로 기존 고객들로부터 Hyper-V 가상화 소프트웨어 사용자를 확보하는 데 잠재적으로 적합하다고 생각합니다.

Amazon.com은 Hyper-V를 테스트하는 한 회사입니다. 현재 Amazon.com의 하드웨어 개발자 인 Joe Stewart는 실제 테스트 룸과 사용중인 가상 서버 두 가지를 운영하고 있다고 전했다.
페이스 북은 방대한 양의 데이터를 처리하기 위해 '콜드 스토리지'를 사용할 준비를합니다. 소셜 네트워크의 사용자가 매월 업로드하는 새로운 사진 7 페타 바이트에 대처할 수있는 데이터를 저장합니다. 은 소셜 네트워크 사용자가 매월 업로드하는 새로운 사진 7 페타 바이트를 처리하기 위해 데이터를 저장하는 방식을 다시 생각합니다. 회사의 인프라 엔지니어링 담당 부사장은 사진 수가 늘어남에 따라 페이스 북은 저렴하고 전력을 많이 소비하는 방법을 찾아야한다고 주장했다.

사용자는 하루에 약 3 억 개의 사진을 업로드하고 특별한 경우, 페이스 북의 제이 파리 키 (Jay Parikh)는 수요일 암스테르담에서 개최 된 유럽 구조 회의에서 말했다. "할로윈은 가장 큰 사진 업로드 일 중 하나이며, 하루에 업로드되는 사진의 양은 약 1 ~ 20 억 개 사이 일 것입니다."라고 그는 말했습니다.