본문 바로가기

cs 기본지식

컴퓨터 - 인코딩

궁금증

meta 태그에서 http-equiv 속성은 content 속성에 명시된 값에 대한 HTTP 헤더를 제공한다고 한다.

만약 http-equiv 속성이 명시되어 있다면, 반드시 content 속성도 함께 명시되어야 한다.

content- type : 해당 문서의 문자 인코딩 방식을 명시함.

 

인코딩

동영상이나 문자 인코딩 뿐 아니라 

사람이 인지 할수 있는 형태의 데이터를 약속된 규칙에 의해

컴퓨터가 사용하는 0과 1로 변환하는 과정을 통틀어 일컫는다. 

 

디코딩

인코딩의 반대

컴퓨터가 알아들을 수 있는 부호로 만들어진 문장을 사람이 읽을 수 있도록 전환해줌

 

Charset (문자셋)

character set

웹 브라우저 혹은 HTML 문서가 어떠한 문자셋으로 저장되었는지 명시해놓은 속성

인코딩을 어떤 종류의 문자셋으로 해줄지 정하는 과정.

즉, 인코딩 방식을 정하는 것

 

Charset의 종류

1. ASCII 아스키코드

- 가장 처음 만들어진 문자셋

- 127개의 영문자와 숫자로만 이루어져 있다.

- 한글을 지원하지 않아 한글은 깨져서 나타난다.

 

2. UNICODE 유니코드

- 아스키코드의 단점을 극복하기 위한 코드 체계

- 각 나라별 언어를 모두 표현할 수 있다.

 

3. UTF-8

- 유니코드를 사용하는 인코딩 방식 중 하나

- 전세계 모든 글자들을 한꺼번에 표현 할 수 있다.

- 유니코드로 충분히 한글을 지원받을 수 있음에도 불구하고 UTF-8이 나온 이유
   : 영어권 사용자들은 유니코드를 사용하면 메모리 낭비가 2배가 되기 때문에 이를 방지하기 위함

- UTF-8 유니코드는 아스키 코드와 영문 영역에서는 100% 호환됨

  즉, UTF-8 유니코드 문서가 오로지 영문과 숫자만 포함한다면 아스키코드와 동일

 

출처 : https://pythontoomuchinformation.tistory.com/333

 

 

 

 

'cs 기본지식' 카테고리의 다른 글

마크업 언어  (0) 2023.03.28
웹(Web)  (0) 2023.03.28
hostname과 domainname  (0) 2023.01.13
네트워크, 인터넷, 인트라넷, 클라이언트/서버  (0) 2022.02.07
절대 경로 / 상대 경로  (0) 2022.01.17