컴퓨터 문자 인코딩 체계 -아스키(ASCII) 코드, 유니코드(Unicode)

반응형

컴퓨터 문자 인코딩 체계 -아스키(ASCII) 코드,  유니코드(Unicode)

아스키 코드(ASCII, American Standard Code for Information Interchange)

1960년대에 개발되어 초기 컴퓨터 시스템에서 문자 인코딩 표준으로 사용되었습니다.
7비트로 구성되어 있어 총 128개의 문자를 표현할 수 있습니다.  0부터 127까지의 숫자로 문자를 나타내며 영어 알파벳(대소문자), 숫자, 몇몇 특수문자 및 제어문자(줄바꿈, 탭 등)가 포함됩니다.
예: A = 65, a = 97, 0 = 48
영어가 아닌 다른 언어의 문자를 표현하는데에 한계가있습니다(비영어권 문자를 처리하기 어려움)
소규모 문자 집합
https://en.wikipedia.org/wiki/ASCII

 

 

기타

https://www.ascii-code.com/

 

 

 

유니코드(Unicode)

영어를 포함한 비영어권의 여러 언어를 포함한 글로벌한 문자 인코딩을 지원하기 위해 1990년대에 개발되었습니다.
기본적으로 16비트를 사용해 최대 65,536개의 문자를 표현할 수 있으며 확장되어 현재 100만 개 이상의 문자를 지원합니다. 아스키 문자는 유니코드의 첫 128자에 포함되어 있어 하위 호환성을 유지합니다.
대규모 문자 집합

https://en.wikipedia.org/wiki/Unicode
https://en.wikipedia.org/wiki/List_of_Unicode_characters


UTF-8(Unicode Transformation Format)
유니코드의 한 인코딩 형식으로 가변 길이 인코딩 방식입니다. 아스키와 호환되며 영어는 1바이트로 표현하고 다른 언어는 2~4바이트로 표현합니다. 웹과 같은 다양한 플랫폼에서 널리 사용되며 효율성과 호환성이 뛰어납니다.
https://en.wikipedia.org/wiki/UTF-8

UTF-16
유니코드의 또 다른 인코딩 형식으로 기본적으로 2바이트로 문자를 표현합니다. 비트수에 따라 4바이트로도 표현할 수 있습니다. 일부 시스템에서는 UTF-16이 기본 인코딩으로 사용됩니다(Windows의 내부 문자 인코딩)
https://en.wikipedia.org/wiki/UTF-16

 

 

기타
https://home.unicode.org/
https://www.ibm.com/docs/ko/db2/11.5?topic=support-unicode-character-encoding

https://unicode.org/charts/

 

반응형

댓글

Designed by JB FACTORY