2012. 12. 23. 19:24

Encoding - utf8 and euckr / Fedora


1. euc-kr 문서의 utf-8 변환 >
o file내용 변환 : iconv -c -f euc-kr -t utf-8 filename > outfile
-위와 같이 하면 euc-kr 코드로 쓰여진 filename 파일의 내용이 utf-8로 바뀌어서 outfile로 저장한다.
- -c옵션은 잘못된 문자는 빼고...
o file_name convert : convmv -f euckr -t utf8 --notest -r <directory_name>
- --unescape

2. window에서 zip된 파일 Linux에서 풀기>
- windows(euckr), linux(utf8)
패치된 unzip 파일을 쓴다...아 쉽다..이방법을 몰라 계속 헤매었다..파~
http://www.suse.or.kr/suse/?doc=bbs/gnuboard.php&bo_table=download&page=1&wr_id=101

3. vi 또는 메일 내용 변환 - ko_KR.eucKR vs ko_KR.UTF-8 >
LC_ALL=ko_KR.UTF-8
o bash에선
export LC_ALL=ko_KR.UTF-8
export LANG=$LANG

o vim에선 home디렉토리에 .vimrc 파일에 추가
set encoding=utf-8
set fileencodings=ucs-bom,utf-8,korea
vimrc에 'fileencodings' 옵션을 설정해놓고 사는 것도 방법입니다.
파일을 열 때 우선 utf-8인지 검사하고, 그 다음에 euc-kr로 시도합니다.
(따라서 영문 ASCII 파일은 utf-8으로 열립니다. ASCII가 utf-8의 subset이므로..)
set fileencodings=utf-8,euc-kr /*요놈만 추가해도 잘 되더라*/

o mutt에선
set assumed_charset=utf-8:cp949
set strict_mime=no
set config_charset = cp949 # 아쉽게도 설정 파일 자체는 cp949입니다 :(
set file_charset=utf-8:cp949
set send_charset=utf-8:cp949

charset-hook windows-949 cp949
charset-hook ks_x_1001-1997 cp949
charset-hook ks_c_5601-1987 cp949
charset-hook 5601 cp949

터미널은 gnome-terminal이나 PuTTY에서 UTF-8으로 놓고 씁니다.

Cygwin에서 Windows의 UTF-8 파일이름에 접근하지 못해서 rsync 따위를 쓰기가 어렵다는 문제를 빼고는 다 괜찮은 것 같습니다. 물론 이 문제도 윈도우즈에서 공유시켜놓고 Linux 등에서 s
mbfs로 utf-8으로 mount하면 접근하면 그나마 위로는 가능하고요..

mp3는, iTunes를 쓰는 관계로 이미 다 UTF-8을 쓰고 있군요.



Cygwin에서면 모를까,
아직도 ko_KR.eucKR을 쓰시는 분들이 계셨군요! ;)

<vim/gvim에서 자동 인코딩 변환 >
vim/gvim 의 경우 인코딩을 자동으로 인식하는 방법이 있습니다. vim 공식 홈페이지에서 win32 iconv 라이브러리를 받아 설치하시고, fenc 와 fencs 옵션을 참고하시기 바랍니다. :e ++enc
= 도 필요하지 않을까 싶네요.

<기타 - 쓸데없는 것>
1. 프로그램>인터넷>컹커러
2. 압축파일선택
- 압축파일 안에 묶여 있는 파일 리스트가 보여진다(파일명은 깨진다)
3. 한개 파일 또는 여러개 선택 후 오른쪽 버튼선택한 후 copy선택한다.(copy하면 압축이 해제 되더라)
- /home/goguma/temp/directory에 copy한다.
- 디렉토리가 묶여 있으면 압축이 풀리지 않더라.
4. convmv명령으로 파일명을 변환해 준다.
- convmv -f euckr -t utf8 --notest -r directory_name
<case-2>
1. extract file at windows
2. rezip tar file with 7zip
3. extract file at linux
4. convmv -f euckr -t utf8 --notest -r directory_name