룬ë¤ìë² ì¬ê¸°ê¾¼1
차례:
Big Data 라는 용어는 요즘 인기가 있습니다. 용어,로드 및로드에서 분명히 알 수 있듯이 Big Data는 다양한 정보와 방법을 사용하여 여러 가지 방법으로 처리 할 수 있습니다. 이 기사에서는 Big Data의 개념에 대해 이야기하며 Infonomics (Information Economics) 분야를 시작한 것으로 간주되는 데이터웨어 하우징 분야의 선구자 인 Doug Laney가 언급 한 3 V를 사용합니다. 진행하기 전에 본질을 파악하기 위해 빅 데이터 및 빅 데이터 사용에 관한 기본 사항에 대한 기사를 읽는 것이 좋습니다. 빅 데이터 개념에 대한 자세한 설명을 위해이 게시물에 추가 할 수 있습니다.
대용량 데이터 3 Vs
거대한 형태로 다른 방식으로 축적 된 데이터는 이전에 다른 데이터베이스에 적절하게 저장되었고 얼마 후에 버려졌습니다. 데이터가 많을수록 관련성이 높은 다양한 정보를 쉽게 찾을 수 있다는 개념이 등장하면서 올바른 도구를 사용하여 회사는 더 오랜 기간 동안 데이터를 저장하기 시작했습니다. 이는 새로운 저장 장치를 추가하거나 클라우드를 사용하여 데이터가 조달 된 형식 (문서, 스프레드 시트, 데이터베이스 및 HTML 등)에 데이터를 저장하는 것과 같습니다. 그런 다음 대용량의 덩어리를 처리 할 수있는 도구를 사용하여 적절한 형식으로 정렬됩니다. 데이터.
참고:
빅 데이터의 범위는 구내 및 클라우드에서 수집 및 저장하는 데이터에만 국한되지 않습니다. 공개 도메인의 항목을 포함하되 이에 국한되지 않는 다른 여러 출처의 데이터를 포함 할 수 있습니다. 빅 데이터의 3D 모델은 다음 V를 기반으로합니다.
볼륨: 데이터 저장소 관리
- Velocity: 데이터 처리 속도를 나타냄
- Variety: 서로 관련되지 않은 서로 다른 데이터 세트의 데이터를 그룹화하는 것을 의미합니다.
- 다음 단락에서는 각 차원 (각 V)에 대해 자세히 설명하여 Big Data 모델링에 대해 설명합니다.
A] 빅 데이터의 볼륨
빅 데이터에 대해 말하면, 볼륨을 원시 정보의 거대한 수집으로 이해할 수 있습니다. 그것이 사실이지만 데이터의 저장 비용에 관한 것입니다. 중요한 데이터는 클라우드뿐만 아니라 구내에도 저장 될 수 있으며 후자는 유연한 옵션입니다. 그러나 각각을 저장해야합니까?
메타 그룹이 발표 한 백서에 따르면 데이터 양이 증가하면 데이터의 일부가 불필요하게 보이기 시작합니다. 또한 기업이 사용할 데이터의 양만 유지해야한다고 명시합니다. 다른 데이터는 폐기되거나 비즈니스가 "중요하지 않은 데이터"를 놓아주기를 꺼리는 경우 사용하지 않은 컴퓨터 장치 및 테이프에 저장하여 기업이 이러한 데이터를 저장하는 데 비용을 지불하지 않아도됩니다.
나는 어떤 유형의 데이터라도 조만간 모든 비즈니스에서 필요하다고 생각하기 때문에 "중요하지 않은 데이터"라고 생각했기 때문에 데이터가 있음을 알게되기 전에 많은 시간 동안 데이터를 보관해야합니다. 참으로 중요하지 않습니다. 개인적으로, 저는 구형 데이터를 예전부터 하드 디스크에 덤프하고 때로는 DVD에 덤프합니다. 주요 컴퓨터 및 클라우드 저장소에는 중요하다고 생각하는 데이터가 포함되어 있으며이를 사용하게 될 것입니다. 이 데이터 중에서도 몇 년 후에 구형 HDD에 사용되는 데이터가 한 번 사용됩니다. 위의 예는 단지 이해를 돕기위한 것입니다. 기업이 빅 데이터로 인식하는 것과 비교할 때 빅 데이터의 설명에 맞지 않습니다.
B
] 빅 데이터의 속도 데이터 처리 속도는 중요한 요소입니다 Big Data의 개념에 대해 이야기 할 때. 많은 웹 사이트, 특히 전자 상거래가 있습니다. Google은 이미 페이지로드가 더 나은 순위를 얻는 데 반드시 필요한 속도라는 것을 인정했습니다. 랭킹과는 별도로, 속도는 쇼핑하는 동안 사용자에게 안락함을 제공합니다. 다른 정보를 위해 처리되는 데이터에도 동일하게 적용됩니다.
속도에 관해 이야기하는 동안, 그것이 더 높은 대역폭 이상이라는 것을 아는 것이 중요합니다. 다양한 분석 도구와 쉽게 사용할 수있는 데이터를 결합합니다. 쉽게 사용할 수있는 데이터는 처리하기 쉬운 데이터 구조를 만드는 숙제를 의미합니다. 다양성의 빅 데이터
로드 및로드가 많은 경우, 분석 도구로 쉽게 처리 할 수있는 방법으로 구성하는 것이 중요합니다. 데이터. 데이터 정리 도구도 있습니다. 저장시 데이터는 구조화되지 않은 형식이 될 수 있습니다. 다른 데이터와 어떤 관계가 있는지를 파악하는 것은 당신에게 달려 있습니다. 관계를 파악한 후에는 구조화 된 정렬 된 저장을 위해 원하는 도구를 선택하여 원하는 형식으로 변환 할 수 있습니다. 요약
요약하면 Big Data의 3D 모델은 USABLE 데이터 당신이 소유하고있는 것; 데이터의 적절한 태깅; 빠른 처리. 이 세 가지를 돌보면 데이터를 쉽게 처리하거나 분석하여 원하는 것을 파악할 수 있습니다.
위 내용은 빅 데이터의 개념과 3D 모델을 모두 설명합니다. 두 번째 단계에서 링크 된 기사는 새로운 개념의 사용자라면 추가 지원이 될 것입니다.
아무거나 추가하려면 의견을 말하십시오.
IBM은 Informix에 데이터웨어 하우징 도구를 추가합니다. Informix OLTP (온라인 트랜잭션 처리) 서버가 새로운 옵션 툴셋을 통해 BI (비즈니스 인텔리전스) 및 데이터웨어 하우징에보다 강력한 옵션을 제공 할 수 있도록 노력할 것입니다.
Informix Warehouse Feature는 조직 및 준비 도구를 제공합니다. 주문 처리 또는 재고 시스템과 같은 거래 데이터 - 자체 소스 든 여러 소스의 정보를 사용하는 광범위한 BI 구현의 일부이든 상관없이 분석 용. IBM은 Cognos BI 소프트웨어 라인 중 가장 중요한 데이터를 처리 할 수있는 다양한 제품을 보유하고 있습니다. IBM은 DB2 데이터베이스를 BI 및 데이터웨어 하우징을위한 최고의 백엔드 플랫폼으로 자리 매김하고 있지만 상당수의 Informix 고객은 포레스터 리서치 (Forrester Research)의 애널리스트 인 제임스 코비 엘러스 (James Kobielus)는 다음과 같이 덧붙였다.
SAP와 Teradata는 데이터웨어 하우징 관계를 심화합니다
SAP Business Warehouse는 곧 Teradata의 데이터베이스에서 기본으로 실행됩니다.
에서 생방송됩니다. CEO : 데이터웨어 하우징 공급 업체 Dataupia는 최근 보고서와 달리 데이터웨어 하우스 공급 업체 인 Dataupia와 공동으로 운영 될 것이라고 Foster 설립자 겸 CEO는 말합니다. Hinshaw.
Dataupia는 힘든 한 해 였지만 데이터웨어 하우징 어플라이언스의 시작은 생존 해 있으며 주요 정리 해고 및 잠재적 자산 매각에 대한 보고서에 이어 Foster Hinshaw 창업자에 따르면