... | ... | @@ -194,6 +194,18 @@ class StarTest |
|
|
## 질문사항
|
|
|
|
|
|
### 유니코드와 인코딩 방식
|
|
|
유니코드란?
|
|
|
유니코드는 기존의 여러 문자 표현 방식들의 문제점을 해결하기 위해서 전 세계의 모든 문자를 컴퓨터로 표현할 수 있게 문자마다 고유의 Character code를 부여하는 방식이다. 그래서 기존에 발생하던 각 언어와 문자 체계에 따른 충돌 문제를 해결하였다. 유니코드를 사용하는 환경에서는 세계 각국의 언어를 깨뜨리지 않고 사용할 수 있다.
|
|
|
|
|
|
유니코드의 구조
|
|
|
UCS(Universal Character Set)는 ISO 10646으로 정의된 문자 인코딩의 국제 표준이다. 유니코드는 UCS의 하위 집합이고, UCS의 구조를 알면 유니코드의 구조를 알 수 있다. 아래 그림은 UCS의 구조와 의미를 정리한 그림이다.
|
|
|
|
|
|

|
|
|
|
|
|

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
유니코드는 ASCII 방식에서 표현하지 못하던 문자까지 표현할 수 있다는 장점을 가졌다. 유니코드의 인코딩 방식은 UTF-8, UTF-16, UTF-32 등이 있고, 가변 길이 인코딩이다. 뒤의 숫자는 기본 표현이 몇 비트로 이루어지는지 차이에 따라서 숫자가 달라진다.
|
|
|
|
... | ... | |