Linux系統(tǒng)搜索替換非UTF-8編碼文件的方法
發(fā)表時(shí)間:2023-08-13 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]UTF-8是Linux系統(tǒng)下的一種可變長(zhǎng)度的字符萬國(guó)碼,使用UTF-8碼就可以支持多種語言。但是某些文件并不是UTF-8編碼的,這個(gè)時(shí)候我們可以用命令來查找替換非UTF-8碼,下面就來介紹一下Lin...
UTF-8是Linux系統(tǒng)下的一種可變長(zhǎng)度的字符萬國(guó)碼,使用UTF-8碼就可以支持多種語言。但是某些文件并不是UTF-8編碼的,這個(gè)時(shí)候我們可以用命令來查找替換非UTF-8碼,下面就來介紹一下Linux系統(tǒng)查找替換非UTF-8編碼文件的方法。
開始之前,請(qǐng)先安裝enca這個(gè)軟件包。enca是Linux等系統(tǒng)下用來查看文件編碼和轉(zhuǎn)換文件編碼的工具。
下面一行Linux命令能夠查找當(dāng)前目錄下所有文件中,哪些文件不是UTF-8編碼。我對(duì)文件加了些限制,用find命令時(shí)候,排除了所有目錄下的.svn目錄,且只查找后綴為.php的文件。
命令1:
jw@~/sqlite>
find 。 ! -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {} grep GB2312 》 /dev/null && echo {}” \;
./sqlite_utility.php
./sqlite_result.php
./sqlite_forge.php
./sqlite_driver.php
既然找到了這些非UTF8編碼的文件,接下來再用一條命令將他們都轉(zhuǎn)換成UTF8編碼。
命令2:
jw@~/sqlite>
find . ! -iregex ‘.*\.svn.*’ -type f -name ‘*.php’ -exec bash -c “enca -L zh_CN {} grep GB2312 》/dev/null && enconv -L zh_CN -x UTF-8 {}” \;
當(dāng)你用命令2 全部轉(zhuǎn)換完成后,如果你期待命令1的輸出為空,那么你就錯(cuò)了。實(shí)際上英語字母的utf8編碼和ASCII編碼是一樣的。當(dāng)一個(gè)全是英文字母的文件用UTF8 w/o BOM編碼保存,那么enca會(huì)識(shí)別他是一個(gè)ACSII編碼的文件。所以,你猜到了,命令2做了一些無用功。
以上就是Linux系統(tǒng)查找替換非UTF-8編碼文件的方法了,這樣一來就不用擔(dān)心Linux文件不是UTF-8編碼而無法顯示其他語言了。
Linux是一套免費(fèi)使用和自由傳播的類Unix操作系統(tǒng)