빅데이터(Big Data)
1. 빅데이터(Big Data)
- R프로그래밍을 배우기 전에, 빅데이터에 대해서 알아보겠습니다.
- 빅데이터란 기존의 데이터베이스 관리 도구의 데이터 수집, 저장, 관리, 분석 역량을 넘어서는 데이터를 말합니다.
- 빅데이터는 주로 세 가지 특성에 기반하여 정의됩니다. 이러한 특성을 3V라고 합니다.
2. 빅데이터의 특성 (3V)
- 규모(Volume)
- 빅데이터는 대량의 데이터를 다룹니다. 전통적인 DB 시스템에서 처리하기 어려운 정도의 막대한 양의 데이터를 포함합니다.
- 다양성(Variety)
- 빅데이터는 다양한 유형의 데이터를 포함합니다.
- 구조화된 데이터, 반구조화된 데이터, 비구조화된 데이터 등 다양한 형태의 데이터가 빅데이터의 일부입니다.
구조 | 예시 |
구조화된 데이터 | 관계형 DB의 테이블 |
반구조화된 데이터 | XML 형식 |
비구조화된 데이터 | 텍스트, 이미지, 동영상 |
- 속도(Velocity)
- 빅데이터는 거의 실시간으로 생성되고 처리되는 경우가 많습니다.
- 이는 데이터가 빠르게 생성되고 전송되는 환경에서 발생하는 특성을 나타냅니다.
3. 정리하며..
- 빅데이터는 이러한 특성을 다루기 위해 특별히 설계된 도구와 기술을 사용하여, 데이터를 수집, 저장, 처리 및 분석합니다.
- 다음 시간에는 데이터 분석 과정에 대해 알아보겠습니다.
'Programming Language > R' 카테고리의 다른 글
데이터 분석 과정 (0) | 2023.11.23 |
---|