... | @@ -266,8 +266,6 @@ UTF-8은 8비트로 표현하는 방식이다. UTF-16은 주로 사용되는 BMP |
... | @@ -266,8 +266,6 @@ UTF-8은 8비트로 표현하는 방식이다. UTF-16은 주로 사용되는 BMP |
|
|
|
|
|
UTF-8의 경우 엔디안 문제가 일어나지 않으므로 BOM 문자를 붙일 필요가 없지만, 해당 자료가 UTF-8 인코딩이라는 것을 나타내기 위한 표식으로 사용하는 경우도 있다. 편집기에 따라서 UTF-8로 저장할 때 BOM 문자를 자동으로 추가하는데, 유닉스와 같은 UTF-8에서 BOM 문자를 사용하지 않는 경우에는 BOM 문자를 일반 문자로 잘못 인식하여 문제가 발생할 수 있다.
|
|
UTF-8의 경우 엔디안 문제가 일어나지 않으므로 BOM 문자를 붙일 필요가 없지만, 해당 자료가 UTF-8 인코딩이라는 것을 나타내기 위한 표식으로 사용하는 경우도 있다. 편집기에 따라서 UTF-8로 저장할 때 BOM 문자를 자동으로 추가하는데, 유닉스와 같은 UTF-8에서 BOM 문자를 사용하지 않는 경우에는 BOM 문자를 일반 문자로 잘못 인식하여 문제가 발생할 수 있다.
|
|
|
|
|
|
BOM 문자는 텍스트를 저장할 때 데이터 스트림의 맨 앞에 붙인다. (UTF-8은 편집 환경이나, 설정에 따라 붙이지 않을수도 있다.) 그리고 이 데이터 스트림을 자바로 가져와서 읽으면, 자바는 UTF-16 인코딩이라서 BOM 문자가 표시되는 것을 알 수 있다.
|
|
BOM 문자는 텍스트를 저장할 때 데이터 스트림의 맨 앞에 붙는다. (UTF-8은 편집 환경이나, 편집기 설정에 따라 붙이지 않을수도 있다.) 그리고 이 데이터를 자바로 불러와서 읽으면 BOM 문자가 포함되어 읽힌다. 이것으로 문자열을 읽을 때는 BOM 문자도 같이 읽히는 것을 알 수 있다.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|