明輝手游網(wǎng)中心:是一個(gè)免費(fèi)提供流行視頻軟件教程、在線學(xué)習(xí)分享的學(xué)習(xí)平臺(tái)!

Linux系統(tǒng)搜索替換非UTF-8編碼文件的方法

[摘要]UTF-8是Linux系統(tǒng)下的一種可變長(zhǎng)度的字符萬國(guó)碼,使用UTF-8碼就可以支持多種語言。但是某些文件并不是UTF-8編碼的,這個(gè)時(shí)候我們可以用命令來查找替換非UTF-8碼,下面就來介紹一下Lin...

  UTF-8是Linux系統(tǒng)下的一種可變長(zhǎng)度的字符萬國(guó)碼,使用UTF-8碼就可以支持多種語言。但是某些文件并不是UTF-8編碼的,這個(gè)時(shí)候我們可以用命令來查找替換非UTF-8碼,下面就來介紹一下Linux系統(tǒng)查找替換非UTF-8編碼文件的方法。

Linux系統(tǒng)查找替換非UTF-8編碼文件的方法

  開始之前,請(qǐng)先安裝enca這個(gè)軟件包。enca是Linux等系統(tǒng)下用來查看文件編碼和轉(zhuǎn)換文件編碼的工具。

  下面一行Linux命令能夠查找當(dāng)前目錄下所有文件中,哪些文件不是UTF-8編碼。我對(duì)文件加了些限制,用find命令時(shí)候,排除了所有目錄下的.svn目錄,且只查找后綴為.php的文件。

  命令1:

  jw@~/sqlite>

  find 。 ! -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {} grep GB2312 》 /dev/null && echo {}” \;

  ./sqlite_utility.php

  ./sqlite_result.php

  ./sqlite_forge.php

  ./sqlite_driver.php

  既然找到了這些非UTF8編碼的文件,接下來再用一條命令將他們都轉(zhuǎn)換成UTF8編碼。

  命令2:

  jw@~/sqlite>

  find . ! -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {} grep GB2312 》/dev/null && enconv -L zh_CN -x UTF-8 {}” \;

  當(dāng)你用命令2 全部轉(zhuǎn)換完成后,如果你期待命令1的輸出為空,那么你就錯(cuò)了。實(shí)際上英語字母的utf8編碼和ASCII編碼是一樣的。當(dāng)一個(gè)全是英文字母的文件用UTF8 w/o BOM編碼保存,那么enca會(huì)識(shí)別他是一個(gè)ACSII編碼的文件。所以,你猜到了,命令2做了一些無用功。

  以上就是Linux系統(tǒng)查找替換非UTF-8編碼文件的方法了,這樣一來就不用擔(dān)心Linux文件不是UTF-8編碼而無法顯示其他語言了。


Linux是一套免費(fèi)使用和自由傳播的類Unix操作系統(tǒng)