BCB3.0中讓TRichEdit支持BIG5內(nèi)碼
發(fā)表時(shí)間:2024-06-18 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]大家好,現(xiàn)在的軟件如:Foxmail等軟件,都有顯示GB內(nèi)碼和BIG5內(nèi)碼的功能。我經(jīng)過一段時(shí)間的摸索,發(fā)現(xiàn)了實(shí)現(xiàn)這種功能的方法,F(xiàn)在就來介紹給大家。首先,要給大家介紹一下這兩種內(nèi)碼:大家都知道英文的ASCII碼是用一個(gè)字節(jié)來表示的,但中文因?yàn)槲淖謹(jǐn)?shù)量太多,所以只能用兩個(gè)字節(jié)來表示。實(shí)際上我們常見...
大家好,現(xiàn)在的軟件如:Foxmail等軟件,都有顯示GB內(nèi)碼和BIG5內(nèi)碼的功能。我經(jīng)過
一段時(shí)間的摸索,發(fā)現(xiàn)了實(shí)現(xiàn)這種功能的方法,F(xiàn)在就來介紹給大家。首先,要給大家
介紹一下這兩種內(nèi)碼:大家都知道英文的ASCII碼是用一個(gè)字節(jié)來表示的,但中文因?yàn)?br>文字?jǐn)?shù)量太多,所以只能用兩個(gè)字節(jié)來表示。實(shí)際上我們常見的文本文件中保存的就是
每個(gè)漢字對(duì)應(yīng)的內(nèi)碼,而漢字的內(nèi)碼就是該漢字在中文字庫中的邏輯位置。在中文字庫
中,該邏輯位置存放了這個(gè)漢字的圖像信息,有了這些圖像信息,就可以顯示該漢字
了,當(dāng)然在現(xiàn)在的Windows中這個(gè)顯示的過程是由操作系統(tǒng)自動(dòng)來完成的,我們不必去
關(guān)心它。但是由于一些歷史上的原因,漢字的內(nèi)碼方案有兩種,我們大陸地區(qū)使用的是
GB碼,而臺(tái)灣省卻使用的是BIG5碼。GB碼文件中保存的是漢字相應(yīng)的GB編碼,BIG5碼文
件中保存的是漢字相應(yīng)的BIG5編碼。而兩種內(nèi)碼又都對(duì)應(yīng)于各自的字庫文件,所以當(dāng)我
們使用GB內(nèi)碼的簡體中文Windows來看BIG5內(nèi)碼的文件時(shí),就會(huì)產(chǎn)生常說的亂碼現(xiàn)象。
由于我們是要顯示BIG5碼的漢字,所以再介紹一下BIG5碼的編碼方案:
每個(gè)漢字由兩個(gè)字節(jié)構(gòu)成,第一字節(jié)的范圍從0X81-0XFE,第二個(gè)字節(jié)的范圍分別為
0X40-0X7E,0XA1-0XFE。好了,知道了漢字顯示的原理和BIG5碼的編碼方案,就可以
很容易讓TRichEdit支持BIG5碼了。
第一步:找一個(gè)用于內(nèi)碼轉(zhuǎn)換的碼表文件。
我用的是CCDOS97里帶的CCDOS.TAB,這個(gè)文件的大小為45840個(gè)字節(jié)。
如果你沒有這個(gè)文件,可以給我來信(cnprogram@netease.com)我會(huì)寄一個(gè)給你。當(dāng)
然你還可以根據(jù)BIG5碼的編碼方案自己做一個(gè),這里就不多說了。
第二步:把碼表文件轉(zhuǎn)換成數(shù)組文件。見下面的程序。
用BCB建立一個(gè)控制臺(tái)應(yīng)用程序。把它存為TABTOHEX.BPR和
TABTOHEX.CPP。然后在TABTOHEX.cpp中添加以下代碼:
#pragma hdrstop
#include <condefs.h>
#include"stdio.h"
#include"stdlib.h"
#pragma argsused
int main(int argc, char **argv)
{
FILE *tab;
FILE *hex;
int i=0;
unsigned int ch;
tab=fopen("ccdos.tab","rb");//打開CCDOS.TAB文件
hex=fopen("tab.h","wb");
fputs("unsigned char tab[45840]={",hex);
fprintf(hex,"\n");
for(i=0;i<45840;i++)
{
if(i%20==0)
{
fprintf(hex,"\n");
}
ch=fgetc(tab);
fprintf(hex,"0x%x\x2c",ch);//把碼表文件轉(zhuǎn)換為數(shù)組文件
}
fputs("0xff};",hex);
fcloseall();
return 0;
}
然后編譯并執(zhí)行這個(gè)程序,得到TAB.H文件。
第三步:在BCB3.0中新建一個(gè)標(biāo)準(zhǔn)的應(yīng)用程序。添加一個(gè)TButton組件:
Button1添加一個(gè)TRichEdit組件:RichEdit1適當(dāng)調(diào)整它們的大小與位置。然后在
Unit1.cpp中添加下面的代碼:
#include <vcl.h>
#pragma hdrstop
#include "Unit1.h"
#include"tab.h"//把頭文件TAB.H包含在內(nèi)
file://---------------------------------------------------------------------
------
#pragma package(smart_init)
#pragma resource "*.dfm"
TForm1 *Form1;
file://---------------------------------------------------------------------
------
__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)
{
}
file://---------------------------------------------------------------------
------
void __fastcall TForm1::FormCreate(TObject *Sender)
{
RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//讀取一個(gè)BIG5
碼的文件,可自己的情況設(shè)定
}
file://---------------------------------------------------------------------
------
void __fastcall TForm1::Button1Click(TObject *Sender)
{
unsigned long i,address;//把BIG5碼轉(zhuǎn)換為GB碼
unsigned char ch1,ch2;
char *x;
x=RichEdit1->Lines->GetText();
i=0;
while(x[i]!='\0')
{
ch1=x[i];
if(ch1>=0xa1)
{
ch2=x[i+1];
if(ch2>=0x40&&ch2<=0x7e)
{
address=ch1*314+ch2*2-33010;
x[i]=tab[address];
x[i+1]=tab[address+1];
}
if(ch2>=0xa1&&ch2<=0xfe)
{
address=ch1*314+ch2*2-33078;
x[i]=tab[address];
x[i+1]=tab[address+1];
}
i+=2;
}
else
i++;
}
RichEdit1->Lines->Text=x;
RichEdit1->SetFocus();
RichEdit1->SelStart = 0;
}
編譯并執(zhí)行它,首先你會(huì)看到RichEdit1中的BIG5碼文件顯示為亂碼。
按一下Button1,這時(shí),你就會(huì)看到RichEdit1中的亂碼變成了正常的漢字。好了,現(xiàn)在
你自己編的軟件也可以支持BIG5碼了,是不是感覺更專業(yè)一些。GB->BIG5的轉(zhuǎn)換方法也
是類似的,有興趣的朋友可以給我來信。最后,祝大家龍年愉快。本程序在WIN97,
BCB3.0下編譯通過