2. 문자 인코딩?
문자 인코딩은 문자들의 집합을 컴퓨터에서 저장하거나 통신에
사용할 목적으로 부호화하는 방법을 가리키며,그냥 인코딩이라
고도 불린다.
대표적인 예로 전건을 길게,또는 짧게 두드려서 라틴 알파벳을
나타내는 모스 부호가있으며, 라틴 알파벳, 숫자, 특수문자 등을
정수와 그에 대응되는 7비트 이진수로 표현하는 방법인 A SCII
가 있다.
3. BCD, ASCII, EBCDIC 코드
BCD : 숫자, 영자, 특수 기호를 나타내기 위한 6비트로 이루어
지는 코드. 오류 검사용의 1비트가 부가되어, 전체로서는 7비트
로 구성된다.
ASCII : 미국에서 표준화가 추진된 정보교환용 7비트 부호로
PC를 중심으로 국제적으로 사용된다. 컴퓨터에서 처리하기 용이
한 8비트 데이타를 이용하기 위하여 숫자, 문자, 특수문자에 번
호를 부여한 것이다.
EBCDIC : Extended binary coded decimal interchanged
code의 약어. 8자리의 2진수를 사용하여 문자, 숫자, 구두점 등
을 부호화하는 IBM의 시스템. 7자리의 2진수를 사용하는
ASCII 코드에 비해 두배의 기호와 제어기능을 표현함.
4. 한국 표준 문자 세트 (KS C 5601)
2 바이트 완성형 코드
장점: 아스키 문자 세트와 충돌하지 않음
아스키 문자를 다루는 대부분의 프로그램 및 시스템에 문제없이 사
용될 수 있고, EUC-KR 인코딩을 다루는 프로그램 및 시스템은 아
스키 문자를 그대로 다룰 수 있다.
단점 :
1. 모든 현대 한글 음절(뷁, 쉙 등…)을 표현할 수 없다.
2. 한글이 완성형 형태로 배열되어, 자모 분리 및 조합이 어렵다.
5. 유니코드 (Unicode)
국제 표준 문자 세트 (16 비트 코드).
목적 :
1. 통합 문자 세트 및 인코딩 – 전세계의 서로 다른 문자코드를 하
나로 통일.
2. 효율성과 편리성 – 원칙적으로 모든 문자가 2바이트로 통일.
단점 :
1. 기존 아스키 문자 세트와 충돌.
2. 아스키 문자가 2 바이트로 표현되므로, 기존 아스키 화일의 크기
가 2배로 늘어난다.