정보처리기사
정보처리기사요약
데이터입출력구현
데이터모델
데이터베이스
DBMS
ERD
정규화
반정규화
인덱스
파티션
논리 데이터 저장소 확인
데이터 모델
-
개념: 현실 세계의 정보를 인간과 컴퓨터가 이해할 수 있도록 추상화한 것.
-
표시 요소: 연산, 구조, 제약 조건
-
데이터 모델 절차: 요구사항 분석 → 개념적 설계(개념적 데이터 모델, ERD) → 논리적 설계(논리적 데이터 모델, 정규화) → 물리적 설계(물리적 데이터 모델, 반정규화)
요개논물
논리 데이터 모델 검증
-
논리 데이터 모델링 종류
-
관계 데이터 모델: 2차원 테이블 형태로 구성
-
구성 요소: 릴레이션, 튜플, 속성, 카디널리티, 차수, 스키마, 인스턴스
-
관계 대수: 일반 집합 연산자(합집합, 교집합, 차집합, 카티션 프로덕트 #합교차카), 순수 관계 연산자(셀렉트, 프로젝트, 조인, 디비전
셀프조디
) -
관계 해석: 관계 대수(절차적 정형 언어)와 반대로 비절차적 언어이다.
-
속성: 개체(피터 챈 모델: 사각형 / 까마귀발 모델: 표), 속성(피터 챈 모델: 원 / 까마귀발 모델: 표 내부), 관계
개속관
-
-
계층 데이터 모델
-
네트워크 데이터 모델
-
-
개체-관계(E-R) 모델
-
개념: 현실 세계에 존재하는 데이터와 관계를 이해할 수 있는 형태로 가장 널리 사용되고 있는 모델이다.
-
기호: 개체(□), 관계(◇), 속성(○), 다중 값 속성(◎), 관계-속성 연결(─)
-
-
정규화
-
개념: 데이터의 중복성 제거, 이상 현상을 방지, 데이터 일관성과 정확성 유지, 무손실 분해
-
이상 현상: 삽입, 삭제, 갱신 이상
삽삭갱
-
이상 현상: 삽입, 삭제, 갱신 이상
-
정규화 단계: 1정규형(1NF, 원자화) → 2정규형(2NF, 부분 함수 종속 제거) → 3정규형(3NF, 이행 함수 종속 제거) → 보이스-코드 정규형(BCNF, 결정자 함수 종속 제거) → 4정규형(4NF, 다치 종속 제거) → 5정규형(5NF, 조인 종속 제거)
원부이 결다조
-
-
반 정규화
-
개념: 성능 향상, 개발 운영의 단순화를 위해 중복, 통합, 분리 등을 수행하는 기법
-
기법: 테이블(테이블 병합, 테이블 분할, 중복 테이블 추가(집계 테이블 추가, 진행 테이블 추가, 특정 부분만을 포함하는 테이블 추가)), 컬럼(컬럼 중복화), 관계(중복관계 추가)
테병분중 컬중 관중
-
물리 데이터 저장소 설계
물리 데이터 저장소 설계
-
물리 데이터 모델링
-
개념: 논리모델을 적용하고자 하는 기술에 맞도록 상세화해가는 과정이다.
-
변환 절차: 개체를 테이블로 변환 → 속성을 컬럼으로 변환 → UID를 기본키로 변환 →관계를 외래키로 변환 → 컬럼 유형과 길이 정의 → 반 정규화 수행
-
물리 데이터 저장소 구성
-
테이블 제약 조건 설계
-
참조무결성 제약 조건: 참조하는 외래키의 값은 항상 참조되는 릴레이션에 기본키로 존재해야 한다.
-
옵션: 제한(Restricted), 연쇄(Cascade), 널 값(Nullify)
-
-
인덱스 설계
- 개념: 검색 연산의 최적화를 위해 열에 대한 정보를 구성한 데이터구조이다.
-
뷰 설계
- 속성: REPLACE, FORCE, NOFORCE, WITH CHECK OPTION, WITH READ ONLY
-
클러스터 설계
- 적용 기준: 인덱스의 단점을 해결한 기법으로 분포도가 넓을수록 오히려 유리하다.
-
파티션 설계
-
종류: 레인지 파티셔닝, 해시 파티셔닝, 리스트 파티셔닝, 컴포지트 파티셔닝, 라운드로빈 파티셔닝
레해리컴라
-
장점: 성능 향상, 가용성 향상, 백업 가능, 경합감소
성가백합
-
데이터베이스 기초 활용하기
데이터베이스 종류
-
데이터베이스
-
개념: 다수의 인원, 시스템이 사용할 목적으로 통합하여 관리되는 데이터의 집합이다.
-
정의: 통합된 데이터, 저장된 데이터, 운영 데이터, 공용 데이터
통저운공
-
특성: 실시간 접근성, 계속적인 변화, 동시 공용, 내용 참조
-
종류: 파일 시스템(ISAM, VSAM), 관계형 데이터베이스 관리시스템(Oracle, SQL Server, MySQL, Maria DB), 계층형 데이터베이스 관리시스템(IMS, System2000), 네트워크 데이터베이스 관리시스템(IDS, IDMS, Database Manegement System)
-
-
DBMS
-
개념: 데이터 관리의 복잡성을 해결하는 동시에 데이터 추가, 보안 등 추가 기능을 제공하는 소프트웨어이다.
-
유형: Key-Value DBMS, Column Family Data Store DBMS, Document Store DBMS, Graph DBMS
-
특징: 데이터 무결성, 데이터 일관성, 데이터 회복성, 데이터 보안성, 데이터 효율성
-
-
데이터베이스 기술 트랜드
-
빅데이터
-
개념: 주어진 비용, 시간 내에 처리 가능한 데이터 범위를 넘어서는 수십 페타바이트 크기의 비정형 데이터이다.
-
특성: 데이터의 양, 데이터의 다양성, 데이터의 속도
-
수집, 저장, 처리 기술: 비정형/반정형 데이터 수집, 정형 데이터 수집, 분산데이터 저장/처리(HDFS, 맵 리듀스), 분산데이터 베이스
-
분석, 실시간 처리 및 시각화 주요 기술: 빅데이터 분석, 빅데이터 실시간 처리, 분산 코디네이션, 분석 및 시각화
-
-
NoSQL
-
개념: 전통적인 RDBMS와 다른 DBMS를 지칭하기 위한 용어, 고정된 테이블 스키마가 필요없고 조인 연산을 사용하지 않고 수평적으로 확장이 가능하다.
-
특성: Basically Available, Soft-State, Eventually Consistency
-
유형: Key-Value Store, Column Family Data Store, Document Store, Graph Store
키컬도그
-
-
데이터 마이닝
-
개념: 대규모 데이터 안에서 체계적이고 자동적으로 통계적 규칙이나 패턴을 찾아내는 기술.
-
절차: 목적 설정 → 데이터 준비 → 가공 → 마이닝 기법 적용 → 정보 검증
-
주요 기법: 분류 규칙, 연관 규칙, 연속 규칙, 데이터 군집화
분연 연데
-
-