학교나 기업과 같은 큰 조직에서 데이터 관리를 대신해주는 데이터베이스에 대해 알아보자.
데이터는 어디에 있을까?
데이터는 위와 같이 지금도 실시간으로 데이터 베이스에 쌓이고 있다.
먼저, 데이터의 개념에 대해 알아보자.
정보를 데이터와 같은 의미로 사용하는 경우가 많은데, 이 둘은 명확히 구별해야 한다.
- 데이터(data) : 현실 세계에서 단순히 관찰하거나 측정하여 수집한 사실이나 값 (=자료)
- 정보(information) : 데이터를 의사 결정에 유용하게 활용할 수 있도로 처리하여 체계적으로 조직한 결과물
데이터베이스(DB:DataBase)
특정 조직의 여러 사용자가 '공유'하여 사용할 수 있도록 '통합'해서 '저장'한 '운영'데이터의 집합이라고 정의한다.
데이터베이스의 특징
- 데이터베이스는 실시간 접근이 가능하다.
사용자의 데이터 요구에 실시간으로 응답할 수 있어야한다.
- 데이터베이스는 계속 변화한다.
동적인 특징이 있어 데이터를 계속 삽입, 삭제, 수정하여 현실 세계의 상태를 정확히 반영해야 한다.
- 데이터베이스는 내용으로 참조가 가능하다.
저장된 주소나 위치가 아닌 데이터의 내용, 즉 값으로 참조할 수 있다.
형태에 따른 데이터 분류
어느 정도 구조화된 형태로 모여 있느냐에 따라 정형, 반정형, 비정형 데이터로 분류한다.
- 반정형 데이터
반정형 데이터는 구조에 따라 저장된 데이터이지만 정형 데이터와 달리 데이터 내용 안에 구조에 대한 살명이 함께 존재한다. 따라서 데이터 내용에 대한 설명, 즉 구조를 파악하는 파싱 과정이 필요하고, 보통 파일 형태로 저장된다.
ex) HTML, XML, JSON문서, 웹 로그, 센서 데이터
일반적으로 데이터를 특성에 따라 범주형 데이터와 수치형 데이터로 분류한다. 이러한 분류는 통계적 관점에서 데이터 특성에 따라 보다 적합한 분석 방법을 선택하기 위해 데이터 분석 분야에서 주로 활용한다.
'DataBase > SQL' 카테고리의 다른 글
[SQL] 관계 데이터 모델 (0) | 2023.11.12 |
---|---|
[SQL] MySQL 설치방법 (0) | 2023.10.16 |
[SQL] 데이터베이스 시스템(2), 데이터 모델링(1) (1) | 2023.10.06 |
[SQL] 데이터베이스 시스템(1) (0) | 2023.09.23 |
[SQL] 데이터베이스 관리 시스템(DBMS) (0) | 2023.09.22 |