컴퓨터 문자 인코딩 체계 -아스키(ASCII) 코드, 유니코드(Unicode)
- 컴퓨터과학
- 2021. 1. 13.
컴퓨터 문자 인코딩 체계 -아스키(ASCII) 코드, 유니코드(Unicode)
아스키 코드(ASCII, American Standard Code for Information Interchange)
1960년대에 개발되어 초기 컴퓨터 시스템에서 문자 인코딩 표준으로 사용되었습니다.
7비트로 구성되어 있어 총 128개의 문자를 표현할 수 있습니다. 0부터 127까지의 숫자로 문자를 나타내며 영어 알파벳(대소문자), 숫자, 몇몇 특수문자 및 제어문자(줄바꿈, 탭 등)가 포함됩니다.
예: A = 65, a = 97, 0 = 48
영어가 아닌 다른 언어의 문자를 표현하는데에 한계가있습니다(비영어권 문자를 처리하기 어려움)
소규모 문자 집합
https://en.wikipedia.org/wiki/ASCII
기타
유니코드(Unicode)
영어를 포함한 비영어권의 여러 언어를 포함한 글로벌한 문자 인코딩을 지원하기 위해 1990년대에 개발되었습니다.
기본적으로 16비트를 사용해 최대 65,536개의 문자를 표현할 수 있으며 확장되어 현재 100만 개 이상의 문자를 지원합니다. 아스키 문자는 유니코드의 첫 128자에 포함되어 있어 하위 호환성을 유지합니다.
대규모 문자 집합
https://en.wikipedia.org/wiki/Unicode
https://en.wikipedia.org/wiki/List_of_Unicode_characters
UTF-8(Unicode Transformation Format)
유니코드의 한 인코딩 형식으로 가변 길이 인코딩 방식입니다. 아스키와 호환되며 영어는 1바이트로 표현하고 다른 언어는 2~4바이트로 표현합니다. 웹과 같은 다양한 플랫폼에서 널리 사용되며 효율성과 호환성이 뛰어납니다.
https://en.wikipedia.org/wiki/UTF-8
UTF-16
유니코드의 또 다른 인코딩 형식으로 기본적으로 2바이트로 문자를 표현합니다. 비트수에 따라 4바이트로도 표현할 수 있습니다. 일부 시스템에서는 UTF-16이 기본 인코딩으로 사용됩니다(Windows의 내부 문자 인코딩)
https://en.wikipedia.org/wiki/UTF-16
기타
https://home.unicode.org/
https://www.ibm.com/docs/ko/db2/11.5?topic=support-unicode-character-encoding
'컴퓨터과학' 카테고리의 다른 글
컴퓨터 하드웨어 - 파워서플라이(PSU, power supply unit) (0) | 2023.09.07 |
---|---|
바이트 코드(Bytecode)와 바이너리 코드(Binary code) (0) | 2023.04.06 |
컴퓨터 하드웨어 구매할때 고려할 사항들(CPU, 메모리, 마더보드, 그래픽카드, 기타) (0) | 2022.06.22 |
DDR(DDR SDRAM) 메모리 종류와 차이 - DDR1, DDR2, DDR3, DDR4 (0) | 2021.12.05 |
캐시 기억 장치(cache memory) (0) | 2021.04.30 |