데이터를 한 형식에서 다른 형식으로 변환하는 프로세스를 인코딩이라고 합니다. 데이터를 다른 시스템에서 지원하고 사용할 수 있도록 데이터를 변환하는 데 사용됩니다. 인코딩은 온도를 섭씨에서 화씨로 변환하는 것과 유사하게 작동합니다. 온도는 다른 형식으로 변환되지만 원래 값은 항상 동일하게 유지됩니다. 인코딩은 주로 두 가지 분야에서 사용됩니다.
참고: 인코딩은 주요 목적이 데이터를 숨기는 것이 아니라 적절하게 사용할 수 있는 형식으로 변환하는 것이므로 암호화와 다릅니다.
이 주제에서는 컴퓨팅에 사용되는 다양한 유형의 인코딩 기술에 대해 논의하겠습니다.
인코딩 기술 유형
문자 인코딩
문자 인코딩은 문자를 바이트로 인코딩합니다. . 0과 1을 실제 문자, 숫자 및 기호로 해석하는 방법을 컴퓨터에 알려줍니다. 컴퓨터는 바이너리 데이터만 이해합니다. 따라서 이러한 문자를 숫자 코드로 변환해야 합니다. 이를 위해 각 문자를 바이너리 코드로 변환하고 이를 위해 텍스트 문서를 인코딩 형식으로 저장합니다. 숫자와 문자를 쌍으로 연결하여 수행할 수 있습니다. 문자 인코딩을 적용하지 않으면 당사 웹사이트에서 문자와 텍스트가 적절한 형식으로 표시되지 않습니다. 따라서 가독성이 떨어지고 기계가 데이터를 올바르게 처리할 수 없게 됩니다. 또한 문자 인코딩을 통해 각 문자가 컴퓨터 또는 이진 형식으로 적절하게 표현되도록 할 수 있습니다.
다음과 같은 다양한 유형의 문자 인코딩 기술이 있습니다.
HTML 인코딩
HTML 인코딩은 HTML 페이지를 적절한 형식으로 표시하는 데 사용됩니다. 인코딩을 통해 웹 브라우저는 어떤 문자 집합이 사용될지 알게 됩니다.
HTML에는 . 이러한 문자를 콘텐츠로 인코딩하려면 인코딩을 사용해야 합니다.
URL 인코딩
URL(Uniform Resource Locator) 인코딩은 다음 용도로 사용됩니다. 인터넷을 통해 전송될 수 있는 형식으로 문자를 변환합니다. . 퍼센트 인코딩이라고도 합니다. URL 인코딩은 ASCII 문자 집합을 사용하여 URL을 인터넷으로 보내기 위해 수행됩니다. ASCII가 아닌 문자는 %로 바뀌고 그 뒤에 16진수가 옵니다.
유니코드 인코딩
유니코드는 범용 문자 집합의 인코딩 표준입니다. 전 세계적으로 사용 가능한 대부분의 언어 또는 쓰기 시스템으로 표현된 텍스트를 인코딩, 표현 및 처리할 수 있습니다. 지원되는 모든 언어의 각 문자에 대한 코드 포인트 또는 번호를 제공합니다. 이는 모든 언어에서 가능한 거의 모든 문자를 나타낼 수 있습니다. 특정 비트 시퀀스를 코딩 단위라고 합니다.
UNICODE 표준은 8, 16 또는 32비트를 사용하여 문자를 나타낼 수 있습니다.
유니코드 표준은 코드 포인트를 인코딩하기 위해 UTF(Unicode Transformation Format)를 정의합니다.
UNICODE 인코딩 표준에는 다음과 같은 UTF 체계가 있습니다.
UTF8은 전자 통신에 사용되는 가변 너비 문자 인코딩인 UNICODE 표준에 의해 정의됩니다. UTF-8은 1~4개의 1바이트(8비트) 코드 단위를 사용하여 유니코드에서 1,112,064개의 유효한 문자 코드 포인트를 모두 인코딩할 수 있습니다.
UTF16 인코딩은 두 개의 16비트 정수 중 하나를 사용하여 문자의 코드 포인트를 나타냅니다.
UTF32 인코딩은 각 코드 포인트를 32비트 정수로 나타냅니다.
Base64 인코딩
Base64 인코딩은 이진 데이터를 동등한 ASCII 문자로 인코딩하는 데 사용됩니다. Base64 인코딩은 메일 시스템에서 사용됩니다. SMTP와 같은 메일 시스템은 ASCII 텍스트 데이터만 허용하기 때문에 이진 데이터를 사용할 수 없습니다. 또한 자격 증명을 인코딩하기 위해 간단한 HTTP 인증에도 사용됩니다. 또한 변조를 방지하기 위해 데이터를 읽을 수 없도록 바이너리 데이터를 쿠키 및 기타 매개변수로 전송하는 데에도 사용됩니다. Base64 인코딩 없이 이미지나 다른 파일을 전송하면 메일 시스템이 바이너리 데이터를 처리할 수 없기 때문에 파일이 손상됩니다.
Base64는 데이터를 3바이트 블록으로 표현하며, 각 바이트는 8비트를 포함합니다. 따라서 24비트를 나타냅니다. 이 24비트는 6비트씩 4개의 그룹으로 나뉩니다. 이러한 각 그룹 또는 청크는 동등한 Base64 값으로 변환됩니다.
ASCII 인코딩
정보 교환을 위한 미국 표준 코드 (ASCII)는 문자 인코딩의 한 유형입니다. 1963년에 발표된 최초의 문자 인코딩 표준이었습니다.
ASCII 코드는 영어 문자를 숫자로 표시하는 데 사용되며, 각 문자에는 다음과 같은 숫자가 할당됩니다. 0~127. 대부분의 최신 문자 인코딩 체계는 ASCII를 기반으로 하지만 많은 추가 문자를 지원합니다. 하위 7비트만 사용하는 단일 바이트 인코딩입니다. ASCII 파일에서 각 알파벳, 숫자 또는 특수 문자는 7비트 이진수로 표시됩니다. 키보드의 각 문자에는 동등한 ASCII 값이 있습니다.
이미지, 오디오 및 비디오 인코딩
저장 공간을 절약하기 위해 이미지와 오디오 및 비디오 인코딩이 수행됩니다. 이미지, 오디오, 비디오 등의 미디어 파일을 인코딩하여 보다 효율적이고 압축된 형식으로 저장합니다.
이러한 인코딩된 파일에는 일반적으로 비슷한 품질의 동일한 콘텐츠가 포함되어 있지만 크기가 압축되어 있어 더 적은 공간에 저장할 수 있고, 메일을 통해 쉽게 전송하거나 시스템에서 다운로드할 수 있습니다.
우리는 그것을 . WAV 오디오 파일을 .MP3 파일로 변환하여 크기를 1/10로 줄입니다.일원래 크기로.