반응형
대부분 한글 깨짐을 방지하기 위해 UTF-8로 인코딩을 한다.
간혹가다 EUC-KR 로 인코딩 하는 회사들이 몇군데 있어서 난감한 상황에 놓일때가 있었따.
UTF-8과 EUC-KR 의 차이를 알아보자.
1. UTF-8(Unicode Transforamtion Format - 8 bit)
- 문자집합: 유니코드를 기반으로 한 인코딩 방식. 유니코드는 전세계의 거의 모든 문자를 포함하는 포괄적인 문자 집합입니다.
- 바이트 길이: UTF-8은 가변 길이 인코딩 방식으로 하나의 문자를 표현하기 위해 1~4바이트를 사용한다.
- 범용성: 전 세계의 모든 문자를 표현할 수 있기 때문에 다국어 지원이 필요할 때 널리 사용된다.
2. UTF-8 의 장단점
장점
- 호환성: 기존의 ASCII와 호환된다.
- 다국어지원: 다양한 언어와 문자를 지원한다
- 표준성: 전 세계적으로 사용되는 인코딩 표준이다.
단점
- 많은 바이트 사용: 한글이나 일본어 등 일부 문자에서 EUC-KR에 비해 더 많은 바이트를 사용한다.
3. EUC-KR(Extended Unix Code for Korean)
- 문자집합: 한국어를 표현하기 위한 인코딩 방식
- 바이크길이:EUC-KR은 고정길이 인코딩 방식으로, 한글은 2바이트로 인코딩 된다
- 범용성: 한국어 텍스트를 처리하는 데 적합하지만, 한국어 외의 언어에 대해서는 지원이 부족하다.
4. EUC-KR 의 장단점
장점
- 한글표현: 한국어만 사용할 때는 효율적인 인코딩을 제공
단점
- 제한된 문자 집합: EUC-KR은 한국어만을 대상으로 하기 때문에 다국어 환경에는 적합하지 않다
- 확장성 부족: 유니코드처럼 다양한 언어를 지원하지 않으며, 비표준 문자나 특수 기호등은 표현 할 수 없다.
- 구식:오래된 인코딩 방식으로, 현대 시스템에서는 UTF-8로 많이 대체되고 있다.
이렇듯 UTF-8 의 장점이 더욱 뚜렷하고 대부분은 시스템들은 다국어 환경이기 때문에 UTF-8을 사용하는 것을 권장한다.
728x90
반응형
LIST
'잡학' 카테고리의 다른 글
신용카드 결제 IC 결제와 MS 결제의 차이 (0) | 2024.11.07 |
---|---|
ASCII 란? (0) | 2024.11.07 |
정규화 (0) | 2024.09.24 |
클러스터드 인덱스 (Clustered Index) VS 논 클러스터드 인덱스(Non-Clustered Index) (0) | 2024.09.11 |
클라이언트 사이드 렌더링 VS 서버 사이드 렌더링 (3) | 2024.09.03 |