Site Network: um_bloggers | imagebank | videoworks | essence | business home

Welcome to the official blog of Uncle Ming's Gallery

I have always been among those who believed that the greatest freedom of speech was the greatest safety, because if a man is a fool the best thing to do is to encourage him to advertise the fact by speaking. (我以為讓愚蠢的人自暴其醜, 正是最大之言論自由所以是最安全的主因)

WOODROW WILSON (編輯組譯)


資科人看世界之24


中國文字是當今最先進的文字系統-2

Chinese Character as Super 2-dimensional Code-2

無極 PoleZero
chinese char

註:  以下內容, 純屬作者一般個人意見,不能視為有法律約束力之專業意見,凡涉及如投資、法律、會計、建築或醫療等受法律規管行業之專業問題,如有疑問請自行向具專業操守 之相關專業顧問或從業員查 詢

免 責條款 DISCLAIMER





-1/2/2014

中文落後一説大有市場

多年前曾聽過一位在某大專院校當初級數學講師的人士說中文不及西方文字先進,例如英文是由左至右書寫,配合人面上橫排的眼睛,閲讀速度比中文快;其次是讀 音跟串法一致,音字相通,容易學習;最後還有是西方文字的數字系統,令運算非常方便,亦配合横排文字。雖然心中充滿疑惑,但身為大專講師的說話當然有根 據,為了尊師重道,但還是没有質疑。

疑惑第一是中文其實可横可直,彈性更大,數學上來説是多了一個自由度(degree of freedom);第二是中文繹成英文時,字元數總是多了一個可觀的百份比,讀起來豈不是更慢;至於發音,英文字認識多了便發覺是一派胡言,那些外來字才 要命,希臘文,拉丁文,法文,西班牙文,葡萄牙文,意大利文等等,都不是按串字來拼音便可以讀得準確。最後更發現阿拉伯數字原來根本就不是西方人的發明, 也不是阿拉伯文字,而是印度人的記數符號。但不能否認,箂布箂兹和牛頓等的西方科學家所發展出來的數學符號及運算表達方式是完全超越前人成就的創新發明。

線性排列架構文字訊息承載能力有限

隨著知識和科技的發展,回頭再想起這番隨口說出來的話,更覺是一派胡言。他的理論,不過是個人的主觀感覺,並非因為他對中文和英文都有相同的造諧並且曾進 行過嚴肅的研究比較後得出的結論,這是自小讀「番書」長大的人士常有的通病,當年採用淘汰分流學制,英文成績較好,才有升學的機會,出路亦往往比其他人 好,能力高的會分流到英文中學,令人覺得懂英文的人比不懂的要優秀得多,英文中學學生面對中文中學學生便充滿優越感,其實這是分流的結果而不是英文教育的 功勞。說閲讀速度,如果是一般的記敍文字,個人經驗還是中文快,想當年借閲金庸的武俠小說,為了在限期前歸還,差不多是以一晚兩本的速度來完成,勉强還能 應付到朋友們對小説內容的提問。但自已的中文閲讀速度比英文快很大可能是本身的英文程度太低,還是不敢挑戰英文的優越性。

可是,用一維度線性排列方式(one dimension linear permutation)造字的西方文字,在更高層次的訊息處理上,便愈來愈捉襟見肘,在數學運算中,首先是字元不足,什麽二元幾次方程式當然没有問題, 但在一些較大型的數學模型中,變數隨隨便便也有十多二十個,廿六個字母當然不敷應用,勉强用下標subscript來將同一字母重覆使用,例如X1, X2...等等。但這樣子的組合,豈不是等於中文字的二維結構原理(two dimensional architecture ),因為同一數字,放在上標位置及下標位置代表不同含義,跟中文字將部首放在九個位置上代表不同的含義是同一道理,那便是數學上的二維座標排列。在生物及 化學名詞上,西方文字更是笨拙得要命,例如有機化合物,中文名詞便比英文名詞簡潔得多,隨便拿醇(日常通稱酒精 alcohol,按分子結構分為甲醇 methanol,乙醇 ethanol,丙醇 propanol 等),苯(benzene),氨(ammonia,作字根為ammino),或酮(ketone )等做例子,都可見到中文比英文簡潔清晰得多,原因是中文具有極為強大的二維造字功能,用資訊科技術語來説是延展性(extendability)優越, 佔用的記憶資源及頻寛更少,英文為了分隔文字,更要在兩字之間插入一個佔據一個字節的空格(space),有電腦知識的不防計算這些名詞的中英文字節數目 便清楚。

有機化合物分類
A
Alicyclic compound
Aliphatic compound
Alisiaquinone
Alkane
Alkene
Allocryptopine
Aminoketone
Anhalamine
Anhalonidine
Aurantiomide
Avicularin
Aviculin

B
Bechgaard salt
Biomolecule
Bottromycin
Bridged compounds
Bromofluorocarbon

C
Carbene
2-Carbomethoxytropinone
Carboxylic acid
Covalent organic framework
Cylindrocyclophanes

D
Delsoline
Diazonium compound

E
Erinacine
Ethylenediamine pyrocatechol
Explosophore
F
Fluorenylidene
Fumitremorgin

G
Golm Metabolome Database

H
Half sandwich compound
Hericenone
Hexaethyl tetraphosphate
Hydrogenated starch hydrosylate
Hydroxamic acid

I
In-Methylcyclophane
Inducer

K
Ketone

L
Ladderane
Liriodenine
List of organic salts

M
MassBank (database)

O
Oreobeiline
Organic matter
Organic peroxide
Organic superconductor
Organosulfate
Orthoacetic acid
Oxalyldihydrazide
Oxime
P
Perfluorobutanesulfonyl fluoride
Perfluorodecyltrichlorosilane
Peroxide
Persistent carbene
Polycyclic compound
Polyethylene Succinate

S
Shearinine
Spectral Database for Organic Compounds
Spiropyran
Sulfite ester

T
Thiol
Thiourea
(2,4,6-Trimethylphenyl)gold

V
Venturamide
Vermixocin
Volatile organic compound

X
Xestoquinone


其實說是中文的生化名詞不太準確,應該說是漢字,因為不少是日本人引入西方科技時創造的。日本人曾有一段時間考慮像韓國和越南一樣放棄漢字而改用拼音文 字,可是發覺對原來文化的破壞極大,終於没有實行,改為利用原有漢字或創造一些新漢字來翻譯新的科技文字。所以從宏觀一些的角度來看,中文字應該是整個漢 字文化的一個主要部份,中文字的存亡,關係到整個漢字文化的存亡,一種文字無論如何先進,没有一個強大的政治經濟文化實體當載體,便無法繼續生存發展,不 說埃及和巴比倫文字,兩者都已經隨著原來的民族被征服,毁滅或没落而失傳,就算是拉丁文(Latin),雖然曾經在羅馬帝國和教廷的強大影嚮力下一度成為歐洲最普及的文 字,牛頓和箂布箂兹等科學家的科學文獻很多都用拉丁文發表,現在已經成了死文字,除了教廷的文獻外,只會在法律事務中偶然使用,行外人說是用死人文字來嚇 唬活人,行內人則説是死文字不會有新意義可避免混淆。所以中文字和漢字的長處只是先天條件,没有後天的營養注入和一個強大的文化實體當寄主,便難逃死亡的 命運,成為没有人懂的死文字,而且肯定會死得比拉丁文更徹底,因為中文更難懂。過去中國百多年的衰落,便令韓國和越南拋棄了漢字。

向詆毁中文者挑機  還漢字一個公道

别人要捨棄漢字,是出於短視和功利,誰叫這個「老大」變成「老大衰」,無法保護小的,樹倒猢猻散,要留也留不下。但中國人中,竟亦有不少人要捨棄漢字,那 些中不成英不就的小學雞崇洋憤青的意見當然不值一哂,但貌似很科學的理由,例如那位數學講師所説的中文不適合科技的表達和運算便很能騙倒一些人云亦云的 人,由於挺中文的大都是學文史哲出身,除了訴諸承傳,民族大義和文學書法藝術外,涉及到科技那邊的辯論便不懂應對,經常輸得一塌糊塗,到現時為止,都不大 見有人從科技角度提出理由來支持中文,因為學科技的人都無法避開英文,尖端科技的論文,更是以英文為主,給人的感覺便是科技和西方文字是不可分割的。懂科 技的,除了像陳之藩教授,張系國先生那類文理雙絕的少數人外,對文字多數没有太多認識和感情,擅用文字亦不等如懂文字學,結果讓那些胡説八道的謬論有機會 大行其道,在下唯有勉為其難出來挑機(嗆challenge),解釋為什中文才是最屈機(即最牛supreme)的文字,有什麽人看到又認同的便口耳相 傳,誰是原創者不要緊,在下不會說是抄襲侵權索賠償,還漢字的地位一個公道是地球人的責任。


資訊科技不兼容中文的謬誤

文字在數學角度來看是一種符號系統(notation system),在資訊科技來說是一種編碼系統(code system),當電腦還在發展初階時,由於開發機構大都位於英語文化地區,他們是不是没有普世觀念不清楚,但没有能力去熟悉世界所有的文字則可以肯定, 電腦就是設計給那些懂英語的人士用的,親疏有别得很,一點也不普世,閣下要使用電腦便要學習英文,所以令人以為中文亦不兼容資訊科技。analog to digital conversion 要知道當初不兼容的原因,得要從電腦處理資訊的基本原理説起:現代資訊科技革命由二進制的運用開始,從前的模擬(analogue)記錄傳送模式,是由聲 音和影像自然訊號(signal)的紀錄傳送開始,訊號強弱對應聲音或光線強弱,簡單地轉換成另一種可還原的記錄模式,屬於連續性資訊 (continuous data),對內容的準確還原要求,起始標準很低,因為人的容忍度高,對雜訊造成噪音和雪花,只要能識别便算紀錄傳送成功,但隨著時間過去,要求便逐漸提 高,尤其是在文本資料(textual information)那類非連貫資訊(discrete data)的記錄和傳送,例如電腦程式(program code)或文件(document),失真和訊號衰減問題便不能容忍,因為程式原代碼(program code),那怕是一個錯誤,整個系統的運作便會崩潰。重要文件,同樣無法容忍內容出現錯誤。對連貫性的模擬訊號進行除錯理論上根本不可能,因為連貫性資 訊理論上有無限多,如果不是可以按公式還原的有序資訊(ordered information),例如正弦餘弦那類三角函數的訊號,任何無序訊號的複製,都不過是近似複製值(approximation value ),不過取様的密度越高,便越接近原來的資訊,就好像用多邊形來模擬圓形一樣,邊的數目越高便越近似圓形,有人以為模擬式訊號也是連貫訊號,不必受取樣密 度限制,那是對記錄和收發儀器的物理性質不了解所引致的誤解,任何儀器在輸入和輸出之間都有反應的延滯和慣性,反應越快慣性越低,記錄或收發便越準確,好 像速記員做速記,速度慢的便會省略了一些細節,那是為什麽頻率越高的電波能攜帶更多訊號的原因。

有限取樣訊號更勝無限模擬訊號

科學家靈機一觸,既然連續的原始訊號不能百份百還原,而非連貫的資訊應用卻越來越多,倒不如將原始的連續無限訊號變成不連貫(discrete)的有限訊 號,簡單來說,就是用多邊形來模擬圓滑曲線,只要多邊形的密度高得令人類感觀不能察覺便可以,但這種簡約後的訊號在記錄收發過程中仍有出錯可能,強約訊號 的數值如果只是用普通的方式將數值記錄,傳送,接收和還原,仍很大可能跟原始資料有差異,要達到百份百準確,那便須要用數學原理加入除錯機制(error handling algorithm)。

除錯機制,人與人溝通時都會很自然地採用,例如接收的一方重覆一遍對方說話來求證便是除錯的一種方法,在加減運算中,一種最常用的除錯驗算方 法便是將最小 那一位的數字加起來看最小那位數字是不是和結果吻合(sum of digits )。雖然理論上,除錯機制還是達不到百份之一百的準確度,但將錯誤限制在百萬、千萬甚至萬萬份之一的機率是可能的,接著科學家發現記錄,傳送,接收,還原 及除錯在二進制的環境下執行是最有效率的,結果多邊形的訊號進一步簡化成波幅相同的方波,訊號只有1(high )和0(low)兩種,電腦採用二進制便成為共識,人類習慣使用的十進制數字會先行轉換成二進制數字,0至63,換算成二進制是6位數字,0至127是7 位數,0至255是8位數。在光碟上,普遍採用的除錯碼(Error Correction Code, ECC) 是里德-所羅門碼(Reed–Solomon codes),,Compact CD 便有2層(layer)的除錯碼,可以矯正每碟內不超過 4,000bit 或 2mm 的錯誤,Data CD 和 DVD 的容錯能力更高.

八位元字節只兼容拼音文字

由於英文字母(alphabet 包括大小寫共52個),數字(共10個),加上其他常用符號,128個二進制數字已經能全部對應,所以美國政府最初為了統一電腦的訊號來方便訊息交換,利 用7位二進制數字來代表英文中的所有字符,那便是1967年發表的第一代ASCII(American Standard Code for Information Interchange,美國訊息交換標準代碼),後期發覺不敷應用,便擴充成8位數字共可代表256個英文字符的EASCII(Extended American Standard Code for Information Interchange,美國擴充訊息交換標準代碼),就算是轉換成其他的歐洲拼音文字,256 個字符亦非常足够,結果在硬件設計上,都是以八位元(8bit)一字節(byte )做資訊的基本單位,並且成為早期的資訊交換標準,每一個字符在電子訊號來説是一串方波,1和零用高低電位代表,與模擬訊號不同,採用二進制數碼記錄傳送 的訊號,不必考慮波幅大小,只用考慮有或無,然後將八位訊號換成對應字符便可以。

ASCII CODE TABLE

DEC OCT HEX BIN Symbol HTML Number HTML Name Description
0 0 0 0 NUL �   Null char
1 1 1 1 SOH    Start of Heading
2 2 2 10 STX    Start of Text
3 3 3 11 ETX    End of Text
4 4 4 100 EOT    End of Transmission
5 5 5 101 ENQ    Enquiry
6 6 6 110 ACK    Acknowledgment
7 7 7 111 BEL    Bell
8 10 8 1000 BS    Back Space
9 11 9 1001 HT 	   Horizontal Tab
10 12 0A 1010 LF 
   Line Feed
11 13 0B 1011 VT    Vertical Tab
12 14 0C 1100 FF    Form Feed
13 15 0D 1101 CR 
   Carriage Return
14 16 0E 1110 SO    Shift Out / X-On
15 17 0F 1111 SI    Shift In / X-Off
16 20 10 10000 DLE    Data Line Escape
17 21 11 10001 DC1    Device Control 1 (oft. XON)
18 22 12 10010 DC2    Device Control 2
19 23 13 10011 DC3    Device Control 3 (oft. XOFF)
20 24 14 10100 DC4    Device Control 4
21 25 15 10101 NAK    Negative Acknowledgement
22 26 16 10110 SYN    Synchronous Idle
23 27 17 10111 ETB    End of Transmit Block
24 30 18 11000 CAN    Cancel
25 31 19 11001 EM    End of Medium
26 32 1A 11010 SUB    Substitute
27 33 1B 11011 ESC    Escape
28 34 1C 11100 FS    File Separator
29 35 1D 11101 GS    Group Separator
30 36 1E 11110 RS    Record Separator
31 37 1F 11111 US    Unit Separator
32 40 20 100000       Space
33 41 21 100001 ! !   Exclamation mark
34 42 22 100010 " " " Double quotes (or speech marks)
35 43 23 100011 # #   Number
36 44 24 100100 $ $   Dollar
37 45 25 100101 % %   Procenttecken
38 46 26 100110 & & & Ampersand
39 47 27 100111 ' '   Single quote
40 50 28 101000 ( (   Open parenthesis (or open bracket)
41 51 29 101001 ) )   Close parenthesis (or close bracket)
42 52 2A 101010 * *   Asterisk
43 53 2B 101011 + +   Plus
44 54 2C 101100 , ,   Comma
45 55 2D 101101 - -   Hyphen
46 56 2E 101110 . .   Period, dot or full stop
47 57 2F 101111 / /   Slash or divide
48 60 30 110000 0 0   Zero
49 61 31 110001 1 1   One
50 62 32 110010 2 2   Two
51 63 33 110011 3 3   Three
52 64 34 110100 4 4   Four
53 65 35 110101 5 5   Five
54 66 36 110110 6 6   Six
55 67 37 110111 7 7   Seven
56 70 38 111000 8 8   Eight
57 71 39 111001 9 9   Nine
58 72 3A 111010 : :   Colon
59 73 3B 111011 ; &#59;   Semicolon
60 74 3C 111100 < &#60; &lt; Less than (or open angled bracket)
61 75 3D 111101 = &#61;   Equals
62 76 3E 111110 > &#62; &gt; Greater than (or close angled bracket)
63 77 3F 111111 ? &#63;   Question mark
64 100 40 1000000 @ &#64;   At symbol
65 101 41 1000001 A &#65;   Uppercase A
66 102 42 1000010 B &#66;   Uppercase B
67 103 43 1000011 C &#67;   Uppercase C
68 104 44 1000100 D &#68;   Uppercase D
69 105 45 1000101 E &#69;   Uppercase E
70 106 46 1000110 F &#70;   Uppercase F
71 107 47 1000111 G &#71;   Uppercase G
72 110 48 1001000 H &#72;   Uppercase H
73 111 49 1001001 I &#73;   Uppercase I
74 112 4A 1001010 J &#74;   Uppercase J
75 113 4B 1001011 K &#75;   Uppercase K
76 114 4C 1001100 L &#76;   Uppercase L
77 115 4D 1001101 M &#77;   Uppercase M
78 116 4E 1001110 N &#78;   Uppercase N
79 117 4F 1001111 O &#79;   Uppercase O
80 120 50 1010000 P &#80;   Uppercase P
81 121 51 1010001 Q &#81;   Uppercase Q
82 122 52 1010010 R &#82;   Uppercase R
83 123 53 1010011 S &#83;   Uppercase S
84 124 54 1010100 T &#84;   Uppercase T
85 125 55 1010101 U &#85;   Uppercase U
86 126 56 1010110 V &#86;   Uppercase V
87 127 57 1010111 W &#87;   Uppercase W
88 130 58 1011000 X &#88;   Uppercase X
89 131 59 1011001 Y &#89;   Uppercase Y
90 132 5A 1011010 Z &#90;   Uppercase Z
91 133 5B 1011011 [ &#91;   Opening bracket
92 134 5C 1011100 \ &#92;   Backslash
93 135 5D 1011101 ] &#93;   Closing bracket
94 136 5E 1011110 ^ &#94;   Caret - circumflex
95 137 5F 1011111 _ &#95;   Underscore
96 140 60 1100000 ` &#96;   Grave accent
97 141 61 1100001 a &#97;   Lowercase a
98 142 62 1100010 b &#98;   Lowercase b
99 143 63 1100011 c &#99;   Lowercase c
100 144 64 1100100 d &#100;   Lowercase d
101 145 65 1100101 e &#101;   Lowercase e
102 146 66 1100110 f &#102;   Lowercase f
103 147 67 1100111 g &#103;   Lowercase g
104 150 68 1101000 h &#104;   Lowercase h
105 151 69 1101001 i &#105;   Lowercase i
106 152 6A 1101010 j &#106;   Lowercase j
107 153 6B 1101011 k &#107;   Lowercase k
108 154 6C 1101100 l &#108;   Lowercase l
109 155 6D 1101101 m &#109;   Lowercase m
110 156 6E 1101110 n &#110;   Lowercase n
111 157 6F 1101111 o &#111;   Lowercase o
112 160 70 1110000 p &#112;   Lowercase p
113 161 71 1110001 q &#113;   Lowercase q
114 162 72 1110010 r &#114;   Lowercase r
115 163 73 1110011 s &#115;   Lowercase s
116 164 74 1110100 t &#116;   Lowercase t
117 165 75 1110101 u &#117;   Lowercase u
118 166 76 1110110 v &#118;   Lowercase v
119 167 77 1110111 w &#119;   Lowercase w
120 170 78 1111000 x &#120;   Lowercase x
121 171 79 1111001 y &#121;   Lowercase y
122 172 7A 1111010 z &#122;   Lowercase z
123 173 7B 1111011 { &#123;   Opening brace
124 174 7C 1111100 | &#124;   Vertical bar
125 175 7D 1111101 } &#125;   Closing brace
126 176 7E 1111110 ~ &#126;   Equivalency sign - tilde
127 177 7F 1111111
&#127;   Delete


EXTENDED ASCII CODE TABLE

DEC OCT HEX BIN Symbol HTML Number HTML Name Description
128 200 80 10000000 &#128; &euro; Euro sign
129 201 81 10000001        
130 202 82 10000010 &#130; &sbquo; Single low-9 quotation mark
131 203 83 10000011 ƒ &#131; &fnof; Latin small letter f with hook
132 204 84 10000100 &#132; &bdquo; Double low-9 quotation mark
133 205 85 10000101 &#133; &hellip; Horizontal ellipsis
134 206 86 10000110 &#134; &dagger; Dagger
135 207 87 10000111 &#135; &Dagger; Double dagger
136 210 88 10001000 ˆ &#136; &circ; Modifier letter circumflex accent
137 211 89 10001001 &#137; &permil; Per mille sign
138 212 8A 10001010 Š &#138; &Scaron; Latin capital letter S with caron
139 213 8B 10001011 &#139; &lsaquo; Single left-pointing angle quotation
140 214 8C 10001100 Π&#140; &OElig; Latin capital ligature OE
141 215 8D 10001101        
142 216 8E 10001110 Ž &#142;   Latin captial letter Z with caron
143 217 8F 10001111        
144 220 90 10010000        
145 221 91 10010001 &#145; &lsquo; Left single quotation mark
146 222 92 10010010 &#146; &rsquo; Right single quotation mark
147 223 93 10010011 &#147; &ldquo; Left double quotation mark
148 224 94 10010100 &#148; &rdquo; Right double quotation mark
149 225 95 10010101 &#149; &bull; Bullet
150 226 96 10010110 &#150; &ndash; En dash
151 227 97 10010111 &#151; &mdash; Em dash
152 230 98 10011000 ˜ &#152; &tilde; Small tilde
153 231 99 10011001 &#153; &trade; Trade mark sign
154 232 9A 10011010 š &#154; &scaron; Latin small letter S with caron
155 233 9B 10011011 &#155; &rsaquo; Single right-pointing angle quotation mark
156 234 9C 10011100 œ &#156; &oelig; Latin small ligature oe
157 235 9D 10011101        
158 236 9E 10011110 ž &#158;   Latin small letter z with caron
159 237 9F 10011111 Ÿ &#159; &yuml; Latin capital letter Y with diaeresis
160 240 A0 10100000   &#160; &nbsp; Non-breaking space
161 241 A1 10100001 &#161; &iexcl; Inverted exclamation mark
162 242 A2 10100010 &#162; &cent; Cent sign
163 243 A3 10100011 &#163; &pound; Pound sign
164 244 A4 10100100 &#164; &curren; Currency sign
165 245 A5 10100101 &#165; &yen; Yen sign
166 246 A6 10100110 &#166; &brvbar; Pipe, Broken vertical bar
167 247 A7 10100111 &#167; &sect; Section sign
168 250 A8 10101000 &#168; &uml; Spacing diaeresis - umlaut
169 251 A9 10101001 &#169; &copy; Copyright sign
170 252 AA 10101010 &#170; &ordf; Feminine ordinal indicator
171 253 AB 10101011 &#171; &laquo; Left double angle quotes
172 254 AC 10101100 &#172; &not; Not sign
173 255 AD 10101101   &#173; &shy; Soft hyphen
174 256 AE 10101110 &#174; &reg; Registered trade mark sign
175 257 AF 10101111 &#175; &macr; Spacing macron - overline
176 260 B0 10110000 &#176; &deg; Degree sign
177 261 B1 10110001 &#177; &plusmn; Plus-or-minus sign
178 262 B2 10110010 &#178; &sup2; Superscript two - squared
179 263 B3 10110011 &#179; &sup3; Superscript three - cubed
180 264 B4 10110100 &#180; &acute; Acute accent - spacing acute
181 265 B5 10110101 &#181; &micro; Micro sign
182 266 B6 10110110 &#182; &para; Pilcrow sign - paragraph sign
183 267 B7 10110111 &#183; &middot; Middle dot - Georgian comma
184 270 B8 10111000 &#184; &cedil; Spacing cedilla
185 271 B9 10111001 &#185; &sup1; Superscript one
186 272 BA 10111010 &#186; &ordm; Masculine ordinal indicator
187 273 BB 10111011 &#187; &raquo; Right double angle quotes
188 274 BC 10111100 &#188; &frac14; Fraction one quarter
189 275 BD 10111101 &#189; &frac12; Fraction one half
190 276 BE 10111110 &#190; &frac34; Fraction three quarters
191 277 BF 10111111 &#191; &iquest; Inverted question mark
192 300 C0 11000000 &#192; &Agrave; Latin capital letter A with grave
193 301 C1 11000001 &#193; &Aacute; Latin capital letter A with acute
194 302 C2 11000010 &#194; &Acirc; Latin capital letter A with circumflex
195 303 C3 11000011 &#195; &Atilde; Latin capital letter A with tilde
196 304 C4 11000100 &#196; &Auml; Latin capital letter A with diaeresis
197 305 C5 11000101 &#197; &Aring; Latin capital letter A with ring above
198 306 C6 11000110 &#198; &AElig; Latin capital letter AE
199 307 C7 11000111 &#199; &Ccedil; Latin capital letter C with cedilla
200 310 C8 11001000 &#200; &Egrave; Latin capital letter E with grave
201 311 C9 11001001 &#201; &Eacute; Latin capital letter E with acute
202 312 CA 11001010 &#202; &Ecirc; Latin capital letter E with circumflex
203 313 CB 11001011 &#203; &Euml; Latin capital letter E with diaeresis
204 314 CC 11001100 &#204; &Igrave; Latin capital letter I with grave
205 315 CD 11001101 &#205; &Iacute; Latin capital letter I with acute
206 316 CE 11001110 &#206; &Icirc; Latin capital letter I with circumflex
207 317 CF 11001111 &#207; &Iuml; Latin capital letter I with diaeresis
208 320 D0 11010000 &#208; &ETH; Latin capital letter ETH
209 321 D1 11010001 &#209; &Ntilde; Latin capital letter N with tilde
210 322 D2 11010010 &#210; &Ograve; Latin capital letter O with grave
211 323 D3 11010011 &#211; &Oacute; Latin capital letter O with acute
212 324 D4 11010100 &#212; &Ocirc; Latin capital letter O with circumflex
213 325 D5 11010101 &#213; &Otilde; Latin capital letter O with tilde
214 326 D6 11010110 &#214; &Ouml; Latin capital letter O with diaeresis
215 327 D7 11010111 &#215; &times; Multiplication sign
216 330 D8 11011000 &#216; &Oslash; Latin capital letter O with slash
217 331 D9 11011001 &#217; &Ugrave; Latin capital letter U with grave
218 332 DA 11011010 &#218; &Uacute; Latin capital letter U with acute
219 333 DB 11011011 &#219; &Ucirc; Latin capital letter U with circumflex
220 334 DC 11011100 &#220; &Uuml; Latin capital letter U with diaeresis
221 335 DD 11011101 &#221; &Yacute; Latin capital letter Y with acute
222 336 DE 11011110 &#222; &THORN; Latin capital letter THORN
223 337 DF 11011111 &#223; &szlig; Latin small letter sharp s - ess-zed
224 340 E0 11100000 &#224; &agrave; Latin small letter a with grave
225 341 E1 11100001 &#225; &aacute; Latin small letter a with acute
226 342 E2 11100010 &#226; &acirc; Latin small letter a with circumflex
227 343 E3 11100011 &#227; &atilde; Latin small letter a with tilde
228 344 E4 11100100 &#228; &auml; Latin small letter a with diaeresis
229 345 E5 11100101 &#229; &aring; Latin small letter a with ring above
230 346 E6 11100110 &#230; &aelig; Latin small letter ae
231 347 E7 11100111 &#231; &ccedil; Latin small letter c with cedilla
232 350 E8 11101000 &#232; &egrave; Latin small letter e with grave
233 351 E9 11101001 &#233; &eacute; Latin small letter e with acute
234 352 EA 11101010 &#234; &ecirc; Latin small letter e with circumflex
235 353 EB 11101011 &#235; &euml; Latin small letter e with diaeresis
236 354 EC 11101100 &#236; &igrave; Latin small letter i with grave
237 355 ED 11101101 &#237; &iacute; Latin small letter i with acute
238 356 EE 11101110 &#238; &icirc; Latin small letter i with circumflex
239 357 EF 11101111 &#239; &iuml; Latin small letter i with diaeresis
240 360 F0 11110000 &#240; &eth; Latin small letter eth
241 361 F1 11110001 &#241; &ntilde; Latin small letter n with tilde
242 362 F2 11110010 &#242; &ograve; Latin small letter o with grave
243 363 F3 11110011 &#243; &oacute; Latin small letter o with acute
244 364 F4 11110100 &#244; &ocirc; Latin small letter o with circumflex
245 365 F5 11110101 &#245; &otilde; Latin small letter o with tilde
246 366 F6 11110110 &#246; &ouml; Latin small letter o with diaeresis
247 367 F7 11110111 &#247; &divide; Division sign
248 370 F8 11111000 &#248; &oslash; Latin small letter o with slash
249 371 F9 11111001 &#249; &ugrave; Latin small letter u with grave
250 372 FA 11111010 &#250; &uacute; Latin small letter u with acute
251 373 FB 11111011 &#251; &ucirc; Latin small letter u with circumflex
252 374 FC 11111100 &#252; &uuml; Latin small letter u with diaeresis
253 375 FD 11111101 &#253; &yacute; Latin small letter y with acute
254 376 FE 11111110 &#254; &thorn; Latin small letter thorn
255 377 FF 11111111 &#255; &yuml; Latin small letter y with diaeresis


 中文字常用字簡體約四千個,國標碼有6,763個;繁體字約七千個,台灣資策會頒佈的中文通用字集大五碼有萬多個。在八位keyboard layout元為資訊單位的電腦上如何編碼, 初期茫無頭緒。輸入也是問題,在七十年代微型個人電腦革命出現前,基本上電腦應用屬於高端客户的大型工具,普通人没有機會接觸,電腦鍵盤由打字機鍵盤(QWERTY Keyboard)加上 一些電腦專用符號改成,蘋果電腦將電腦帶入個人應用範圍後,隨著 IBM 的加入競爭,最通用是 XT 和AT 系列演變而來的101 及 104鍵盤,到 Wintel 成為個人電腦主流,鍵盤基本上是104鍵的視窗系統用鍵盤或它的愆生款式;但無論如何,鍵盤與中文輸入完全没有任何的關連,所以單是中文的輸入問題,便令 當時不少人更振振有詞地認為中文不能配合科技發展,那位數學講師隨口説出的話,便是在這様的背景下出現的。

- 未完 -


小傳 Biography

自小即獨鍾情科技,小學時已遍讀「十萬個為什麼」,初中物理課講授古典力學 F=ma 之時,私下卻神遊愛恩斯坦狹義相對論之 E=mcc  (即 E=mc2 ), 對經史子集,嗤之以鼻,以為古中國之科技無足稱道,豈料高中某日於圖書館中抱讀廣義相對論、正苦思不解時,偶翻老子道德經以解悶,驚為天書,繼而再閱莊 子, 易經,更嘆為觀止,近代科學之多個劃時代之理論,竟已為古人一一論述,諸如「太極生兩儀,兩儀生四象四象生八卦,八卦生萬物」,惋如將宇宙起源,正反物質 之誕生,基片粒子之結構以至元素周期之規律濃縮為密碼般,再翮閱雜書如周髀算經,以至小說神話如山海經,搜神記,乃知古中國之科技知識及國人之想像力,並 非如想像之不濟,不過為政者重文輕理,獨貴仕而輕農工商,寧務虛而不務實,上有好之者下必有甚然,故聰明才智之仕,盡委身於儒法之學,勤習治人之術,奇兵 利器能工巧藝皆目為形而下者之雕蟲小技,盡皆凐沒在民問,凡與實際生活及經濟生產有關之工藝技術,唯有賴師徒制口授耳聞,代代相傳,有系統整理立於文字 者僅聊聊可數如天工開物,凡涉抽像科學概念之理論,更混合超自然之想像, 化身為比形而上學更形而上之玄學如風水命理等,有見及比,從此自號無極,誓以課餘工餘時間,疏理古代文 獻, 還中國古代科技發展之本來面目

monopole