2006年11月6日星期一

UTF-8 Traditional-Simplified Chinese conversion - 繁簡互轉

下午看到 simon 提到 台灣Adsense小組回覆現在投放廣告在繁中網站是違反規定,所以我就先把 AdSense for content 給拿掉了。

後來想了想,既然已經是 UTF-8 了,所謂的繁體中文和簡體中文,就應該只是字元對應的問題而非編碼的問題,例如 這樣 => 这样、或者 網頁 => 网页,於是就去 Unicode.org 找了一份對照表,寫了一個轉換的工具,然後利用 mod_rewrite 即時轉換:

這樣轉換的好處是完全不用修改原始網站的東西,包括內容、程式和模版,唯一更動的設定是新增一個 DNS entry,並且在 apache 的設定檔裡面設定這個網址的轉址路徑,剩下的工作就交給轉換工具來執行。

因為簡體中文版存在的目的只是為了瀏覽,所以只支援 GET 而不支援 POST。還有,這是中文字一對一的轉換,所以短期內不會出現詞彙的轉換功能,例如把雷射印表機換成激光打印機這種。

本篇是 Server-side 的繁簡互轉,如果想嘗試 Client-side 的繁簡互轉請參考 Mark 的 "在 UTF8 編碼下的網頁簡繁互轉"

0 意見: