3. 데이터 입출력 구현

정보처리기사 정보처리기사요약 데이터입출력구현 데이터모델 데이터베이스 DBMS ERD 정규화 반정규화 인덱스 파티션

논리 데이터 저장소 확인

데이터 모델 :star::star::star:

  • 개념: 현실 세계정보인간과 컴퓨터이해할 수 있도록 추상화한 것.

  • 표시 요소: 연산, 구조, 제약 조건

  • 데이터 모델 절차: 구사항 분석 → 념적 설계(개념적 데이터 모델, ERD) → 리적 설계(논리적 데이터 모델, 정규화) → 리적 설계(물리적 데이터 모델, 반정규화) 요개논물

논리 데이터 모델 검증 :star::star::star:

  • 논리 데이터 모델링 종류

    • 관계 데이터 모델: 2차원 테이블 형태로 구성

      • 구성 요소: 릴레이션, 튜플, 속성, 카디널리티, 차수, 스키마, 인스턴스

      • 관계 대수: 일반 집합 연산자(집합, 집합, 집합, 티션 프로덕트 #합교차카), 순수 관계 연산자(렉트, 로젝트, 인, 비전 셀프조디)

      • 관계 해석: 관계 대수(절차적 정형 언어)와 반대로 비절차적 언어이다.

      • 속성: 체(피터 챈 모델: 사각형 / 까마귀발 모델: 표), 성(피터 챈 모델: 원 / 까마귀발 모델: 표 내부), 개속관

    • 계층 데이터 모델

    • 네트워크 데이터 모델

  • 개체-관계(E-R) 모델

    • 개념: 현실 세계에 존재하는 데이터와 관계이해할 수 있는 형태로 가장 널리 사용되고 있는 모델이다.

    • 기호: 개체(□), 관계(◇), 속성(○), 다중 값 속성(◎), 관계-속성 연결(─)

  • 정규화

    • 개념: 데이터의 중복성 제거, 이상 현상을 방지, 데이터 일관성과 정확성 유지, 무손실 분해

      • 이상 현상: 입, 제, 신 이상 삽삭갱
    • 정규화 단계: 1정규형(1NF, 자화) → 2정규형(2NF, 분 함수 종속 제거) → 3정규형(3NF, 행 함수 종속 제거) → 보이스-코드 정규형(BCNF, 정자 함수 종속 제거) → 4정규형(4NF, 치 종속 제거) → 5정규형(5NF, 인 종속 제거) 원부이 결다조

  • 반 정규화

    • 개념: 성능 향상, 개발 운영의 단순화를 위해 중복, 통합, 분리 등수행하는 기법

    • 기법: 이블(테이블 합, 테이블 할, 복 테이블 추가(집계 테이블 추가, 진행 테이블 추가, 특정 부분만을 포함하는 테이블 추가)), 럼(컬럼 복화), 계(복관계 추가) 테병분중 컬중 관중

물리 데이터 저장소 설계

물리 데이터 저장소 설계 :star::star::star:

  • 물리 데이터 모델링

    • 개념: 논리모델을 적용하고자 하는 기술에 맞도록 상세화해가는 과정이다.

    • 변환 절차: 개체를 테이블로 변환 → 속성을 컬럼으로 변환 → UID를 기본키로 변환 →관계를 외래키로 변환 → 컬럼 유형과 길이 정의 → 반 정규화 수행

물리 데이터 저장소 구성 :star:

  • 테이블 제약 조건 설계

    • 참조무결성 제약 조건: 참조하는 외래키의 값은 항상 참조되는 릴레이션에 기본키로 존재해야 한다.

    • 옵션: 제한(Restricted), 연쇄(Cascade), 널 값(Nullify)

  • 인덱스 설계

    • 개념: 검색 연산의 최적화를 위해 열에 대한 정보를 구성한 데이터구조이다.
  • 뷰 설계

    • 속성: REPLACE, FORCE, NOFORCE, WITH CHECK OPTION, WITH READ ONLY
  • 클러스터 설계

    • 적용 기준: 인덱스의 단점을 해결한 기법으로 분포도가 넓을수록 오히려 유리하다.
  • 파티션 설계

    • 종류: 인지 파티셔닝, 시 파티셔닝, 스트 파티셔닝, 포지트 파티셔닝, 운드로빈 파티셔닝 레해리컴라

    • 장점: 능 향상, 용성 향상, 업 가능, 경감소 성가백합

데이터베이스 기초 활용하기

데이터베이스 종류 :star::star::star:

  • 데이터베이스

    • 개념: 다수의 인원, 시스템사용할 목적으로 통합하여 관리되는 데이터집합이다.

    • 정의: 합된 데이터, 장된 데이터, 영 데이터, 용 데이터 통저운공

    • 특성: 실시간 접근성, 계속적인 변화, 동시 공용, 내용 참조

    • 종류: 파일 시스템(ISAM, VSAM), 관계형 데이터베이스 관리시스템(Oracle, SQL Server, MySQL, Maria DB), 계층형 데이터베이스 관리시스템(IMS, System2000), 네트워크 데이터베이스 관리시스템(IDS, IDMS, Database Manegement System)

  • DBMS

    • 개념: 데이터 관리복잡성해결하는 동시에 데이터 추가, 보안 등 추가 기능제공하는 소프트웨어이다.

    • 유형: Key-Value DBMS, Column Family Data Store DBMS, Document Store DBMS, Graph DBMS

    • 특징: 데이터 무결성, 데이터 일관성, 데이터 회복성, 데이터 보안성, 데이터 효율성

  • 데이터베이스 기술 트랜드

    • 빅데이터

      • 개념: 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트 크기비정형 데이터이다.

      • 특성: 데이터의 양, 데이터의 다양성, 데이터의 속도

      • 수집, 저장, 처리 기술: 비정형/반정형 데이터 수집, 정형 데이터 수집, 분산데이터 저장/처리(HDFS, 맵 리듀스), 분산데이터 베이스

      • 분석, 실시간 처리 및 시각화 주요 기술: 빅데이터 분석, 빅데이터 실시간 처리, 분산 코디네이션, 분석 및 시각화

    • NoSQL

      • 개념: 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어, 고정된 테이블 스키마가 필요없고 조인 연산을 사용하지 않고 수평적으로 확장이 가능하다.

      • 특성: Basically Available, Soft-State, Eventually Consistency

      • 유형: Key-Value Store, Column Family Data Store, Document Store, Graph Store 키컬도그

    • 데이터 마이닝

      • 개념: 대규모 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술.

      • 절차: 목적 설정 → 데이터 준비 → 가공 → 마이닝 기법 적용 → 정보 검증

      • 주요 기법: 류 규칙, 관 규칙, 속 규칙, 이터 군집화 분연 연데