倉頡系統
维基百科,自由的百科全书
倉頡系統係朱邦復先生及沈紅蓮女士根據倉頡輸入法的設計原意而把倉頡輸入法應用於中文檢字方式,從而解決漢字現時的檢索困難問題。
目录 |
[编辑] 漢字基因
倉頡系統源自朱邦復過去對漢字基因的研究。漢字基因是朱邦復對倉頡輸入法字首字身研究,得出的漢字理論。他提出漢字構造蘊含古人的概念認知,稱為漢字基因,並以此深入探求漢字背後的精微意義。他將「變易之理」與漢字相對應,一一尋求其「根」,並分為若干「層次」,以作「絕對分類」,求出其「最大公約概念」、以及「最小公因象徵」,是稱「漢字基因」。
在「漢字」中有:字母、字形、字序、字音、字辨、字義六大要素,其「基因」中可以析出各要素之「因子」。
[编辑] 漢字檢索的問題
現時漢字的檢索,在絕大多數地區都是以讀音順序為主。例如:
- 日本的漢字檢索,以五十音順序而排列,
- 韓國的漢字,以韓語字母順序排列,
- 中國大陸的漢字,以漢語拼音順序排列。
台灣雖然亦有以注音符號序列作檢索,但日常應用仍以部首檢字法為主;香港的電話簿雖然亦有提供粵音姓名檢索,但日常使用,仍然以部首檢字法或純綷筆劃檢字法為主,這從現時香港小學的電腦認知課程主要教授九方輸入法及倉頡輸入法而可得知。
漢字檢索的最大問題,是不管用甚麼方法來實行,都要面對重碼的問題。而重碼的出現,亦使漢字檢索的順序產生一個疑問:有沒有辦法可以讓漢字像其他字母系統一樣,有一個絕對的檢索順序呢?
[编辑] 倉頡系統方案
朱邦復先生在發展倉頡輸入法時,原意是要發展出一套「中文檢索法」,使漢字俱有「序位觀念」,讓漢字都有一個序位,使中文如同拼音文字般,用少少數個「字根」找到所有漢字,而不是單單作輸入用途。因此,其26個倉頡輸入法的字根「日月金木水火土…止卜」,其實就好像拉丁字母的26個字母「ABCDE…XYZ」、日本語的五十音序等,是一個有序的排列,可用作漢字的檢索用途。
採用倉頡輸入法作檢索法,由於字根都依漢字「形音字」特性分析得來,故若在電腦上運用這套方法,不僅有具有只可作輸入漢字用「字碼」功能以外,還可以有下列用途:
- 字序︰「倉頡字根」有一定的排序,故漢字也可如同英語般,有順位的觀念。
- 字形︰「倉頡字根」可組合任何漢字,並顯示電腦螢幕;
- 字音︰「倉頡字根」所表示「漢字音符」,可作語音用;
- 字義︰「倉頡字根」所表示「漢字形符」,可供「電腦人」瞭解人類常識;
- 字辨︰可把「漢字圖檔」分析出「倉頡字根」,並組成漢字,可供電腦掃描辨識漢字。
把電腦依上列漢字之六大要素:字碼、字序、字辨、字形、字音、字義,綜合一體考慮,進而發展出「電腦系統」,稱為「倉頡系統」。
[编辑] 所解決的問題
倉頡系統可解決下列的各種問題:
- 字序的準確性問題:漢字字典依「部首」、「筆劃」檢索沒有效率,兼沒「序位」觀念,依以倉頡碼排序漢字,則漢字的字序分明,便於人及電腦程式的查找漢字。
- 缺字、收字不足及亂碼問題:若以倉頡碼為電腦內碼,則可解決「缺字」、及簡繁體間「亂碼」問題…,因可以隨時添加漢字,沒有大五碼和統一碼的收字不足,字序混亂的缺點。而且字形不同對應的倉頡碼也不同,不會有相異字形兼併為同一內碼而帶來麻煩。由於倉頡碼有字首字身的訊息,漢字字形產生器可以按倉頡碼把字根自動組合為字形,無需把每個字的字形逐一儲存,大大減少所需記憶空間。由於輸入輸出統一以倉頡處理,取碼與輸出字形相符。
[编辑] 實際應用
朱邦復先生依倉頡系統的概念,設計出以下幾套系統:
[编辑] 聚珍整合作業系統
聚珍整合作業系統於1989年推出巿場,使用第五代倉頡,提供符合漢字結構的字數百萬,有七萬為實際用字,整個系統連同各種程式只佔450KB。因此,當系統發售時,一個A4紙長寬、十厘米高的盒子裡,主要是使用手冊,而整個系統只佔用一片軟磁碟。即使是當時市面上功能最差的個人電腦,亦可以順暢地運行。
[编辑] 人文系統
「人文系統」是一套於1999年起發展的非作業系統,且不對外發售。其為建構在MS-DOS上的軟體系統,並由兩項系統組成:
- 俱圖文功能的「圖文系統」;
- 漢字處理功能的「倉頡系統」。
此系統是首套使用第六代倉頡(又稱蒼頡)的系統。由於有字序,即使資料庫巨大,查尋速度仍然很快。靈活的字庫,也讓生僻字能如常處理。倉頡系統的優點得到發揮。
這套系統現時有北京的欒貴明教授用來建構其收錄中國歷代文獻的,成品為漢文史資料庫。
[编辑] 明珠中文系統
脫胎自聚珍中文系統,含明珠中文小字庫。(待撰)