C언어 char 형 배열이 한글(unicode)을 어떻게 인식할까?

사실 인식 여부의 문제는 아니겠고
한글의 이 char에 들어갈 경우 사실 2바이트로 나눠서 들어가야 하니까..
char[2] 에 들어간다고 해야겠지.

각설하고 unicode가 16비트이니 8비트 8비트씩 해서 0번과 1번 인덱스에 들어간다고
하자.

그리고 실제로 ㄱ부터 ㅎ까지 int값을 찍어보면 다음과 같은 결과를 얻을 수 있다.


마이너스 값이다. 아마도 첫 비트가 1인가보다. 문자를 인식하는 경우에
1번째 비트가 0이면 ASCII로 인식하고 1이면 UNICODE로 인식할게 뻔하다.
어쨌거나 ㄱ->ㅎ으로 갈수록 1씩 증가한다.

또 ㅏ->ㅣ로 갈수록 또 1씩 증가한다.

중성 값도 순차적이라고 봐야할거고.. 이게 값이 bit or 연산이 되는건지
아니면 단순히 bit 값을 더하는 건지 잘 모르겠다. 아마 bit or는 아닐거고
bit 값을 더하는 거겠지?

아 어지럽다 젠장 -_-;;;

by muzie | 2007/12/01 23:35 | STUDY | 트랙백 | 덧글(0)

트랙백 주소 : http://muzie.egloos.com/tb/3510975
☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]

:         :

:

비공개 덧글

◀ 이전 페이지          다음 페이지 ▶