讓TRichEdit支持BIG5內碼

大家好,現在的軟件如:FoxMail等軟件,都有顯示GB內碼和BIG5內碼的功能。我經過一段時間的摸索,發現了實現這種功能的方法。現在就來介紹給大家。首先,要給大家介紹一下這兩種內碼:大家都知道英文的ASCII碼是用一個字節來表示的,但中文因爲文字數量太多,所以只能用兩個字節來表示。實際上我們常見的文本文件中保存的就是每個漢字對應的內碼,而漢字的內碼就是該漢字在中文字庫中的邏輯位置。在中文字庫中,該邏輯位置存放了這個漢字的圖像信息,有了這些圖像信息,就可以顯示該漢字了,當然在現在的Windows中這個顯示的過程是由操作系統自動來完成的,我們不必去關心它。但是由于一些曆史上的原因,漢字的內碼方案有兩種,我們大陸地區使用的是GB碼,而台灣省卻使用的是BIG5碼。GB碼文件中保存的是漢字相應的GB編碼,BIG5碼文件中保存的是漢字相應的BIG5編碼。而兩種內碼又都對應于各自的字庫文件,所以當我們使用GB內碼的簡體中文Windows來看BIG5內碼的文件時,就會産生常說的亂碼現象。

由于我們是要顯示BIG5碼的漢字,所以再介紹一下BIG5碼的編碼方案:每個漢字由兩個字節構成,第一字節的範圍從0X81-0XFE,第二個字節的範圍分別爲0X40-0X7E,0XA1-0XFE。好了,知道了漢字顯示的原理和BIG5碼的編碼方案,就可以很輕易讓TRichEdit支持BIG5碼了。

第一步:找一個用于內碼轉換的碼表文件。

我用的是CCDOS97裏帶的CCDOS.TAB,這個文件的大小爲45840個字節。假如你沒有這個文件,可以給我來信(cnprogram@netease.com)我會寄一個給你。當然你還可以根據BIG5碼的編碼方案自己做一個,這裏就不多說了。

第二步:把碼表文件轉換成數組文件。見下面的程序。

用BCB建立一個控制台應用程序。把它存爲TABTOHEX.BPR和TABTOHEX.CPP。然後在TABTOHEX.cpp中添加以下代碼:

#pragma hdrstop

#include <condefs.h>

#include"stdio.h"

#include"stdlib.h"

#pragma argsused

int main(int argc, char **argv)

{

FILE *tab;

FILE *hex;

int i=0;

unsigned int ch;

tab=fopen("ccdos.tab","rb");//打開CCDOS.TAB文件

hex=fopen("tab.h","wb");

fputs("unsigned char tab[45840]={",hex);

fprintf(hex,"\n");

for(i=0;i<45840;i++)

{

if(i%20==0)

{

fprintf(hex,"\n");

}

ch=fgetc(tab);

fprintf(hex,"0x%x\x2c",ch);//把碼表文件轉換爲數組文件

}

fputs("0xff};",hex);

fcloseall();

return 0;

}

然後編譯並執行這個程序,得到TAB.H文件。

第三步:在BCB3.0中新建一個標准的應用程序。添加一個TButton組件:Button1添加一個TRichEdit組件:RichEdit1適當調整它們的大小與位置。然後在Unit1.cpp中添加下面的代碼:

#include <vcl.h>

#pragma hdrstop

#include "Unit1.h"

#include"tab.h"//把頭文件TAB.H包含在內

//---------------------------------------------------------------------------

#pragma package(smart_init)

#pragma resource "*.dfm"

TForm1 *Form1;

//---------------------------------------------------------------------------

__fastcall TForm1::TForm1(TComponent* Owner): TForm(Owner)

{

}

//---------------------------------------------------------------------------

void __fastcall TForm1::FormCreate(TObject *Sender)

{

RichEdit1->Lines->LoadFromFile("c:\\BIG5.TXT");//讀取一個BIG5碼的文件,可自己的情況設定

}

//---------------------------------------------------------------------------

void __fastcall TForm1::Button1Click(TObject *Sender)

{

unsigned long i,address;//把BIG5碼轉換爲GB碼

unsigned char ch1,ch2;

char *x;

x=RichEdit1->Lines->GetText();

i=0;

while(x[i]!='\0')

{

ch1=x[i];

if(ch1>=0xa1)

{

ch2=x[i+1];

if(ch2>=0x40&&ch2<=0x7e)

{

address=ch1*314+ch2*2-33010;

x[i]=tab[address];

x[i+1]=tab[address+1];

}

if(ch2>=0xa1&&ch2<=0xfe)

{

address=ch1*314+ch2*2-33078;

x[i]=tab[address];

x[i+1]=tab[address+1];

}

i+=2;

}

else

i++;

}

RichEdit1->Lines->Text=x;

RichEdit1->SetFocus();

RichEdit1->SelStart = 0;

}

編譯並執行它,首先你會看到RichEdit1中的BIG5碼文件顯示爲亂碼。按一下Button1,這時,你就會看到RichEdit1中的亂碼變成了正常的漢字。好了,現在你自己編的軟件也可以支持BIG5碼了,是不是感覺更專業一些。GB->BIG5的轉換方法也是類似的,有愛好的朋友可以給我來信。最後,祝大家龍年愉快。本程序在WIN97,BCB3.0下編譯通過。

GB與BIG5內碼轉換COM的原代碼(已經貼在開發者俱樂部了,在這裏再貼一下)
這個COM用到了一個VC的資源文件。就是字典。大家可以去61.134.75.70/download/gb2big5.zip下載原代碼如下:'//////////////////////////////////////////'中文名稱:GB與BIG5內碼互換控件'英文名稱:GB2BIG5'作者:B...查看完整版>>GB與BIG5內碼轉換COM的原代碼(已經貼在開發者俱樂部了,在這裏再貼一下)
 
在BCB中實現TRichEdit的自動格式化
  原文是以Delphi爲例子,原作:張晶晶。原出處已不知。ccrun(老妖)將其改爲C++Builder例子。已編譯通過。這是一個注冊EXE,OBJ,BIN三種類型文件,當其被RichEdit打開時會自動轉換爲16進制顯示的例子 -------------...查看完整版>>在BCB中實現TRichEdit的自動格式化
 
TRichEdit右鍵滾屏代碼
  void __fastcall TMainForm::RichEditMouseMove(TObject *Sender,TShiftState Shift, int X, int Y){if(RightButtonFlag) { if(RightY>(Y+8)) { RightY=Y; SendMessage(RichEdit->Handle, EM_S...查看完整版>>TRichEdit右鍵滾屏代碼
 
中文內碼轉換簡易算法
中文內碼轉換類??? 中文分爲簡體、繁體兩種內碼,另外還有統一碼,如果要在不同碼之間轉換,需要有一個對應表格,程序編寫起來非常繁瑣,而且更要有內碼對照表格。筆者,在閱讀MSDN中發現只要妙用MultiByteToWideCha...查看完整版>>中文內碼轉換簡易算法
 
2300的內碼
在待機狀態下按“*#92702689#”(可以按“<”、“>”滾動)Serial No.——顯示手機串號Made——手機生産日期,格式爲“月月年年”Purchasing date——購買時間,格式“月月年年”可由用戶自行更改,但只可以更...查看完整版>>2300的內碼
 
巧改注冊表,爲Windows Vista添加“內碼輸入法”
  我們都知道,在默認情況下,Windows Vista(以下簡稱Vista)中除了默認的微軟拼音輸入法之外,只是提供了全拼、雙拼、鄭碼等有限的幾種中文輸入法。如果你使用其他的中文輸入法,例如智能陳橋、紫光拼音什麽的,...查看完整版>>巧改注冊表,爲Windows Vista添加“內碼輸入法”
 
C程序實現漢字內碼與GB碼
  // HZEncode.cpp : Defines the entry point for the console application.  //  /*  參考文獻:  漢字的編碼和表示  1)漢字交換碼(國標碼) 漢字交換碼(國標碼)主要用于漢字信息交換。  國標碼:以國...查看完整版>>C程序實現漢字內碼與GB碼
 
C程序實現漢字內碼與GB碼
  // HZEncode.cpp : Defines the entry point for the console application.  //  /*  參考文獻:  漢字的編碼和表示  1)漢字交換碼(國標碼) 漢字交換碼(國標碼)主要用于漢字信息交換。  國標碼:以國...查看完整版>>C程序實現漢字內碼與GB碼
 
用C#通過內碼實現漢字轉化爲拼音
  其實現的原理就是先將漢字轉化成爲內碼,然後通過內碼和拼音的對照來查找。  詳細的代碼如下所示:  public class chs2py  {///   ///將漢字轉換成爲拼音  ///作者:鐵匠(chinahuman)  ///完成于:...查看完整版>>用C#通過內碼實現漢字轉化爲拼音
 
 
回到王朝網路移動版首頁