2007년 12월 01일
C언어 char 형 배열이 한글(unicode)을 어떻게 인식할까?
사실 인식 여부의 문제는 아니겠고
한글의 이 char에 들어갈 경우 사실 2바이트로 나눠서 들어가야 하니까..
char[2] 에 들어간다고 해야겠지.
각설하고 unicode가 16비트이니 8비트 8비트씩 해서 0번과 1번 인덱스에 들어간다고
하자.
그리고 실제로 ㄱ부터 ㅎ까지 int값을 찍어보면 다음과 같은 결과를 얻을 수 있다.

마이너스 값이다. 아마도 첫 비트가 1인가보다. 문자를 인식하는 경우에
1번째 비트가 0이면 ASCII로 인식하고 1이면 UNICODE로 인식할게 뻔하다.
어쨌거나 ㄱ->ㅎ으로 갈수록 1씩 증가한다.
또 ㅏ->ㅣ로 갈수록 또 1씩 증가한다.
중성 값도 순차적이라고 봐야할거고.. 이게 값이 bit or 연산이 되는건지
아니면 단순히 bit 값을 더하는 건지 잘 모르겠다. 아마 bit or는 아닐거고
bit 값을 더하는 거겠지?
아 어지럽다 젠장 -_-;;;
한글의 이 char에 들어갈 경우 사실 2바이트로 나눠서 들어가야 하니까..
char[2] 에 들어간다고 해야겠지.
각설하고 unicode가 16비트이니 8비트 8비트씩 해서 0번과 1번 인덱스에 들어간다고
하자.
그리고 실제로 ㄱ부터 ㅎ까지 int값을 찍어보면 다음과 같은 결과를 얻을 수 있다.

마이너스 값이다. 아마도 첫 비트가 1인가보다. 문자를 인식하는 경우에
1번째 비트가 0이면 ASCII로 인식하고 1이면 UNICODE로 인식할게 뻔하다.
어쨌거나 ㄱ->ㅎ으로 갈수록 1씩 증가한다.
또 ㅏ->ㅣ로 갈수록 또 1씩 증가한다.
중성 값도 순차적이라고 봐야할거고.. 이게 값이 bit or 연산이 되는건지
아니면 단순히 bit 값을 더하는 건지 잘 모르겠다. 아마 bit or는 아닐거고
bit 값을 더하는 거겠지?
아 어지럽다 젠장 -_-;;;
# by | 2007/12/01 23:35 | STUDY | 트랙백 | 덧글(0)




☞ 내 이글루에 이 글과 관련된 글 쓰기 (트랙백 보내기) [도움말]