Windows

Facebook의 대용량 데이터 계획에는 창고와 빠른 분석이 포함됩니다.

불황 속 다들 가상화~가상화 도대체 ëê¸¸ëž˜

불황 속 다들 가상화~가상화 도대체 ëê¸¸ëž˜
Anonim

[더 읽기: 최고의 TV 스트리밍 서비스]

"그러나 이것보다 더 깊다." 백그라운드 작업은 페이스 북의 분석 인프라와 관련이 있습니다.이 인프라는 사용자가 상태 업데이트를 게시하는 것과 같이 사이트에서 수행하는 작업으로 구성되어 있든 또는 사용 가능한 모든 데이터를 심층적으로 분석하여 제품 개발을 가속화하고 사용자 경험을 향상 시키도록 설계되었습니다. 페이스 북에서 다른 장치로 사용하는 애플리케이션.

Facebook은 현재 데이터를 처리하고 분석하기 위해 Hadoop, Corona 및 Prism으로 알려진 여러 가지 오픈 소스 소프트웨어 시스템을 사용합니다. 머지는 말했다. 페이스 북이 여러 소스의 데이터를 사용자 활동을 분석 할 수있는 데이터베이스로 결합하는 데이터웨어 하우스와 관련하여 많은 어려움을 겪고있다. 특정 국가에서 태그가 지정된 사진의 수에 대한 일일 보고서를 제공하거나 특정 지역의 몇 명의 사용자가 자신에게 권장 된 페이지를 사용했는지를 보는 등 총계로 볼 수 있습니다.

사용자 경험을 최적화하고 사용자가 좋아하고 싫어하는 것을 발견하도록 설계되었지만 Facebook이 사용자에 대해 점점 더 많은 데이터에 액세스 할 수있게됨에 따라 과세가되고 있다고 Murthy는 말합니다. 현재 Facebook 창고에는 매일 500 테라 바이트의 새로운 데이터 또는 50 만 기가 바이트가 소요됩니다. 창고의 크기는 지난 4 년 동안 약 4000 배 증가했다. 페이스 북의 사용자 증가를 앞두고있다. 머지는이 문제를 처리하기 위해 프리즘 소프트웨어 시스템을 개발했다. 머지 (Murthy)는 전세계의 데이터 센터 전반에서 주요 분석 기능을 제공하고 분석을 "청크 (chunk)"로 나눈다 고 전했다. 그런 식으로 사용자의 뉴스 피드와 관련된 통계를 분석해도 전반적으로 창고가 막히지는 않을 것입니다.

"이 데이터를 캡처하는 방법에 대한 생각이 점차 커지고 있습니다."

> 회사는 창고에 질의하는 완전히 다른 접근 방식을 사용하여 몇 초 내에 응답 시간을 제공하는 시스템에 대해서도 연구하고 있다고 Murthy는 말했다. 페이스 북이 지속적으로 개선을 바라는 또 다른 영역은 "트랜잭션 인프라" "소셜 네트워크를 원활하게 운영하기 위해 좋아요, 댓글 및 상태 업데이트와 같은보다 기본적이고 일상적인 데이터 처리를 처리합니다. 회사의 엔지니어와 분석가들이 바라는 질문 중에는 이러한 유형의 데이터의 실제 성장을 예측하는 방법과 페이스 북이 실제로 할당해야하는 컴퓨팅의 양이 포함되어 있다고 Murthy가 전했다."앞으로 6 개월이 될지 예측할 수 있을까?"페이스 북은 물리적 서버를보다 효율적으로 만드는 장기적인 노력에도 동참했다. 이 회사는 네트워킹, 메모리, 전원 공급 장치 및 기타 서버 구성 요소를보다 강력하게 제어 할 수있는 모듈화 된 서버를 설계하는 것을 목표로 2011 년에 Open Compute Project를 시작했습니다. 1 월에 ARM 프로세서를 통합하기 위해 확장되었습니다.