Skip to content

Latest commit

 

History

History
15 lines (15 loc) · 1.26 KB

data.md

File metadata and controls

15 lines (15 loc) · 1.26 KB

정형 데이터(Structured Data)

가장 구성이 잘되있고 표 형태로 이루어짐
행과 열로 이루어진 데이터 베이스스프레드시트형태로 저장
각 열은 특정 유형의 데이터를 포함
SQL같은 구조화된 쿼리 언어를 사용 -> 쉽게 처리 가능

반정형 데이터(Semi-structured Data)

일정한 구조를 가지고 있으나 완전히 정형화되어 있지 않음
텍스트 형태,메타 데이터나 태그와 함께 제공
XML,JSON,YAML등의 형식으로 표현 가능
구조화된 형태로 변환 가능 -> 데이터 전처리스크립트 작업이 필요 할수도 있음

비정형 데이터(Unstructured Data)

가장 자유로운 형태의 데이터, 어떠한 구조나 정의가 없는 데이터
대표적인 예로는 텍스트, 이미지, 비디오, 음성 등이 있음
일반적으로 기계가 직접 해석하기 어려움
데이터를 분석하거나 활용하기 위해서는 자연어 처리, 이미지 분석, 음성 인식 등과 같은 고급 기술 필요