Big5的來源和歷史
WIKI!

蠻有趣的
Big5的從1984年發展到現在經過這麼多的版本
變成了整個使用繁體中文地區的編碼標準
不過竟然一直到2003年才正式成為台灣的官方標準

從Big5碼衍生出來的因為當初編碼上的缺陷
導致使用Big5馬的地方會有有名的『許功蓋問題』
原因是這些字的第二個byte會和unix-like系統上的一些關鍵字編碼重複
像是『|』(pipe line)、『\』
於是在這些系統上會在這樣的地方多重複一次
於是『許』就會變成『許\』
被多加了一個『\』
這樣的問題有一些高手有放出自己的解決方式在網路上
用Google查『許功蓋』應該可以輕鬆找到不少資料

再來
在Unicode中
繁體中文的編碼區
第一個Byte(高位元組)的範圍在 A1~FE, 8E~A0
總共有126個區間
第二個Byte(低位元祖)的範圍在 40~7E, A1~FE
總共是157個區間
控制碼的範圍是 A3C0~A3E0
保留控制碼範圍 A3E1~A3FE
使用者造字(USRFONT)
第一段 FA40~FEFE
第二段 8E40~A0FE
第三段 8140~8DFE

參考資料:http://bbs.ecstart.com/archiver/?tid-9230.html
http://www.cmex.org.tw/cmex/tech_all.htm
arrow
arrow
    全站熱搜

    swangs 發表在 痞客邦 留言(1) 人氣()