2007年8月17日 星期五

[嘴泡] 論中文編碼 1

網路上這一類的文章已經很多了,不過我還是很想再桶一刀。

現在仍有不少人深受不良中文內碼的荼毒,其中,最讓人想要公幹的就是 BIG 5,它之所以最為人所公幹,只是因為它是最廣為流傳的爛編碼。因為種種無聊的因素──例如:有人想要在歷史上留名﹝即使是臭名也無坊﹞,讓這一個差勁的編碼,在中文電腦世界稱霸多年。

有些人也許會說 BIG 5 當時設計時,根本沒有考慮這麼多,它的設計者很務實,抱持「先求有、後求好」的心態,所以有很多問題﹝例如:和 ASCII 衝碼﹞是當初沒考慮到的。

但這根本是鬼扯

早在 BIG 5 之前,就早已存在著 CCCII 這一個相當先進的編碼,尤其它的特殊的編碼方式,使得異體字之間可以保有一定的關係,這是連現在大多數的編碼都做不到的。

就結論來說,BIG 5 是垃圾!它之所以稱霸天下,只是因為一些政治因素。

如果說 BIG 5 是垃圾,則 Unicode 中日韓表意文字區就是一個垃圾堆!完全繼承 BIG 5 隨意收字,隨意排字的特點。Unicode 是怎麼確立「一丨亅丿丶」這幾個字的先後順序的?我真的很想知道。有些人說,等到所有程式改用 Unicode 中文處理就不再是問題了。我想,這最多也只能拖一點時間擺了!

但很可惜的是根據謝清俊教授的說法,自從張仲陶教授去逝之後,CCCII 便不再維護了,甚為可惜!

﹝未完,待續﹞

__________h.s.