본문 바로가기

리눅스

iconv 명령어

728x90

iconv 명령어

iconv 명령어는 문자 인코딩 변환을 수행하는 유용한 유틸리티입니다. 특히, 텍스트 파일의 문자 인코딩을 변경할 때 사용됩니다.

기본 구문

iconv [옵션] -f 입력인코딩 -t 출력인코딩 [입력파일] > [출력파일]

주요 옵션

  • -f, --from-code=인코딩: 입력 파일의 문자 인코딩을 지정합니다.
  • -t, --to-code=인코딩: 출력 파일의 문자 인코딩을 지정합니다.
  • -o, --output=파일: 출력 파일을 지정합니다.
  • -l, --list: 시스템에서 지원하는 인코딩 목록을 출력합니다.

사용 예시

UTF-8에서 ISO-8859-1으로 변환

iconv -f UTF-8 -t ISO-8859-1 input.txt > output.txt

파일의 인코딩 확인

file -i filename

시스템에서 지원하는 인코딩 목록 확인

iconv -l
$ iconv -l
The following list contains all the coded character sets known.  This does
not necessarily mean that all combinations of these names can be used for
the FROM and TO command line parameters.  One coded character set can be
listed with several different names (aliases).

  437, 500, 500V1, 850, 851, 852, 855, 856, 857, 858, 860, 861, 862, 863, 864,
  865, 866, 866NAV, 869, 874, 904, 1026, 1046, 1047, 8859_1, 8859_2, 8859_3,
  8859_4, 8859_5, 8859_6, 8859_7, 8859_8, 8859_9, 10646-1:1993,
  10646-1:1993/UCS4, ANSI_X3.4-1968, ANSI_X3.4-1986, ANSI_X3.4,
  ANSI_X3.110-1983, ANSI_X3.110, ARABIC, ARABIC7, ARMSCII-8, ARMSCII8, ASCII,
  ASMO-708, ASMO_449, BALTIC, BIG-5, BIG-FIVE, BIG5-HKSCS, BIG5, BIG5HKSCS,
  BIGFIVE, BRF, BS_4730, CA, CN-BIG5, CN-GB, CN, CP-AR, CP-GR, CP-HU, CP037,
  CP038, CP273, CP274, CP275, CP278, CP280, CP281, CP282, CP284, CP285, CP290,
  CP297, CP367, CP420, CP423, CP424, CP437, CP500, CP737, CP770, CP771, CP772,
  CP773, CP774, CP775, CP803, CP813, CP819, CP850, CP851, CP852, CP855, CP856,
  ...

iconv는 파일뿐만 아니라 표준 입력 및 표준 출력을 지원하므로 파이프를 사용하여 다양한 용도로 활용할 수 있습니다.

728x90

iconv로 character set encoding 변환하기

CP949으로 되어 있는 파일을 UTF-8로 변환

iconv -f CP949 -t UTF-8 source.txt > target.txt

출력 조정 : -c 출력에서 잘못된 문자를 제외합니다.

iconv -c -f CP949 -t UTF-8 inputfile.txt > outputfile.txt

iconv 버전 정보

iconv --version
$ iconv --version
iconv (Ubuntu GLIBC 2.35-0ubuntu3.1) 2.35
Copyright (C) 2022 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
Written by Ulrich Drepper.

iconv 사용법

$ iconv --help
Usage: iconv [OPTION...] [FILE...]
Convert encoding of given files from one encoding to another.

 Input/Output format specification:
  -f, --from-code=NAME       encoding of original text
  -t, --to-code=NAME         encoding for output

 Information:
  -l, --list                 list all known coded character sets

 Output control:
  -c                         omit invalid characters from output
  -o, --output=FILE          output file
  -s, --silent               suppress warnings
      --verbose              print progress information

  -?, --help                 Give this help list
      --usage                Give a short usage message
  -V, --version              Print program version

Mandatory or optional arguments to long options are also mandatory or optional
for any corresponding short options.

For bug reporting instructions, please see:
<https://bugs.launchpad.net/ubuntu/+source/glibc/+bugs>.

 

728x90