빅데이터(Big Data)

빅데이터(Big Data)

1. 빅데이터(Big Data)

 - R프로그래밍을 배우기 전에, 빅데이터에 대해서 알아보겠습니다.

 - 빅데이터기존의 데이터베이스 관리 도구데이터 수집, 저장, 관리, 분석 역량 넘어서는 데이터를 말합니다.

 - 빅데이터는 주로 세 가지 특성에 기반하여 정의됩니다. 이러한 특성을 3V라고 합니다.

 

2. 빅데이터의 특성 (3V)

 - 규모(Volume)

    - 빅데이터대량의 데이터를 다룹니다. 전통적인 DB 시스템에서 처리하기 어려운 정도의 막대한 양의 데이터를 포함합니다.

 

 - 다양성(Variety)

    - 빅데이터 다양한 유형의 데이터를 포함합니다.

    - 구조화된 데이터, 반구조화된 데이터, 비구조화된 데이터 다양한 형태의 데이터빅데이터의 일부입니다.

구조 예시
구조화된 데이터 관계형 DB의 테이블
반구조화된 데이터 XML 형식
비구조화된 데이터 텍스트, 이미지, 동영상

 

 - 속도(Velocity)

    - 빅데이터거의 실시간으로 생성되고 처리되는 경우가 많습니다.

    - 이는 데이터가 빠르게 생성되고 전송되는 환경에서 발생하는 특성을 나타냅니다.

 

3. 정리하며..

    - 빅데이터는 이러한 특성을 다루기 위해 특별히 설계된 도구와 기술을 사용하여, 데이터를 수집, 저장, 처리 및 분석합니다.

    - 다음 시간에는 데이터 분석 과정에 대해 알아보겠습니다.

'Programming Language > R' 카테고리의 다른 글

데이터 분석 과정  (0) 2023.11.23