데이터 내용 인증

인증대상

  • 데이터 내용 인증은 데이터의 내용과 구조를 일정한 품질 기준에 따라 심사하고 수준을 평가하여 인증함. 데이터베이스, 데이터세트의 데이터 내용 인증을 수행하는 경우 데이터 구조를 인증 심사범위에 포함함.
  • 데이터 내용 인증의 대상 데이터 유형은 정형데이터, 반정형데이터, 비정형로 구분하고 각 데이터 유형별 특징에 따라 인증 심사 기준, 절차, 방법을 정의함.
구분세부내용
정형
데이터
  • (데이터 대상) 데이터 형식과 구조가 명확하여 데이터 검색, 선택, 갱신, 삭제 등의 연산수행이 용이
  • (데이터 예시) 고정된 컬럼에 저장되는 테이블(관계형 데이터베이스), 행과 열로 데이터 속성이 정의되어 있는 스프레드시트, 콤마로 구조가 결정되는 CSV 데이터 등
반정형
데이터
  • (데이터 특징) 데이터의 구조 정보를 데이터 내용과 함께 제공하는 파일 형식의 데이터로서 데이터의 구조와 형식 확장 용이
  • (데이터 예시) HTML(HyperText Markup Language), XML(eXtensible Markup Language), JSON(JavaScript Object Notation), RDF(Resource Description Framework) 등
비정형
데이터
  • (데이터 특징) 명확한 형식과 구조가 존재하지 않는 데이터로, 데이터 내용 인증에 적용하는 비정형데이터는 비정형 객체와 객체를 정의하는 메타데이터로 구성
  • (객체 예시) 미디어 파일(동영상 파일, 오디오 파일, 이미지 파일 등), 문서 파일(word, ppt, pdf 등), 로그 파일, 구조화되지 않은 텍스트, SNS 게시글, 이메일 본문 등

준비사항

- 정형데이터 준비사항 

구분세부내용
데이터 베이스
/
데이터 세트

테이블 정의서
테이블명, 엔티티 정보등을 정의한 문서
컬럼 정의서컬럼 정보를 정의한 문서
코드 정의서컬럼에 기재된 각 코드 정보를 정의한 문서
ERD(객체관계도)각 엔티티 간의 관계도
컬럼에 적용된 도메인 규칙 및 업무 규칙각 컬럼별로 연관성을 분석 할 수 있는 문서
데이터 파일컬럼 정의서컬럼 정보를 정의한 문서
코드 정의서컬럼에 기재된 각 코드 정보를 정의한 문서
컬럼에 적용된 도메인 규칙 및 업무규칙각 컬럼별로의 연관성을 분석할 수 있는 문서

심사항목

- 정형데이터 심사항목

1. 필수 심사 항목

기준심사항목명적용기준
1완전성데이터 값 완전성데이터 명세 등에 Notnull 조건이 있는 경우
2데이터 레코드 완전성반정형은 레코드를 정의할 수 있는 경우
3유효성구문 유효성

구문정확성이 요구되는 경우

(ex. 도메인 규칙, 데이터 타입 등)

4의미 유효성해당 필드 또는 속성에 의미상으로 유효한 리스트가 존재하는 경우
5범위 유효성

명세서 등에 범위(숫자)가 정의된 경우

(예: 최대값, 최소값이 적용 가능한 수치)

6관계 유효성명세서 등에 의미론적 업무규칙이 정의된 경우 (예: 성별과 주민등록번호의 뒤첫자리)
7일관성참조 무결 일관성명세서 등에 참조 무결성이 정의된 경우
2. 선택 심사 항목

기준심사항목명적용기준
1유효성데이터 값 정밀성

명세서 등에 정밀도가 정의된 경우

※ 반정형의 경우 단위와 자리수를 고려하여 측정 (예: 자리수-소수점, 시간 등)

2일관성
데이터 포맷 일관성
명세서 등에 데이터 포맷이 정의되어 있고, (예: 날짜표시형식) 2개 이상의 유사한 특성 컬럼이 존재해야 함
3공통 어휘 일관성

명세서 등에 데이터 사전(공통어휘) 정의된 경우

4정확성메타 데이터 정확성
요구사항 명세서에 메타 데이터에 제공되어야 하는 정보가 기록된 경우
5데이터 값 정확성

기대되는 데이터 아이템의 값이 정의된 경우(예: 업무규칙 등)

6접근성
표준기반 데이터 접근성
표준, 협약 또는 규정이 존재하는 데이터의 경우
7유일성데이터 값 유일성
명세서 내 값의 중복을 허용되지 않는 데이터 아이템이 존재하는 경우
3. 기타 심사 항목

기준심사항목명적용기준심사 결과 정량화 수식
1완전성데이터 파일 완전성명세서에 정의된 레코드의 수

심사 항목이 아니라 심사 사전 조건이며 인증 조건

<별도점수를 내지 않고 인증 전제 조건 항목으로 정의하고 심사 시 확인, 심사 체계 규정에 관련 내용 포함>

2유효성이상치 유효성이상치 목록 및 개수 + 차트 형태명세서 등에 이상치가 요구되는 경우

인증기준

심사체계
  • 심사지표는 데이터 구조/관리 특성에 따라 적용가능한 필수지표(기본 중요 지표)와 선택지표(기준정보애 따른 점검자료)로 구분
구분적용지표
필수 지표완전성(값, 레코드), 유효성(구문, 의미, 범위, 관계), 일관성(참조 무결성) 등 7개 세부 지표
선택 지표
유효성(값 정밀성), 일관성(포맷, 어휘), 정확성(메타정보, 값), 접근성(표준기반 데이터 접근성), 유일성(값) 등 7개 세부 지표
기타 지표
완전성(데이터 파일) - 대상의 정보(레코드)가 다른 경우 심사 중단
유효성(이상치) - 명세서 내 이상치 정보가 있는 경우 점검
판정기준
  • 3개 등급으로 판정기준을 구분하고, 등급별로 적용되는 지표 규모를 차등화하여 판정기준 적용
구분기준판정기준
A등급필수 심사 항목 전체 통과 + 최소 선택 항목 3개 이상 적용‧통과

심사 지표 평균 0.99(1-오류/전체검사),

개별심사항목 최소 0.95 이상

B등급
필수 심사 항목 전체 통과

심사 지표 평균 0.97(1-오류/전체검사),

개별심사항목 최소 0.95 이상

C등급

필수 심사 항목 일부 통과

(불가피하게 데이터 특성에 따라 일부 항목 진행 불가시)

개별심사항목 최소 0.95 이상

개인정보처리방침  공평성 선언서

서울시 금천구 가산디지털1로 168 C동 1105호

(우림라이온스벨리1차) 데이터품질인증센터

TEL : 02-6748-4958 (이창희 상무)

/ 02-6748-4960 (장종수 주임)

FAX 02-2026-3818

E-MAIL dqc@casit.co.kr 


Copyright CAS Corp. All rights reserved.

개인정보처리방침  공평성 선언서


서울시 금천구 가산디지털1로 168 C동 1105호(우림라이온스벨리1차) 데이터품질인증센터 

TEL 02-6748-4958 (이창희 상무) /  02-6748-4960 (장종수 주임)  FAX 02-2026-3818 E-MAIL  dqc@casit.co.kr 


Copyright CAS Corp. All rights reserved.