Skip to content

Commit

Permalink
其他
Browse files Browse the repository at this point in the history
  • Loading branch information
garywill committed Dec 3, 2023
1 parent e6f16ff commit f565ade
Show file tree
Hide file tree
Showing 3 changed files with 136 additions and 2 deletions.
Original file line number Diff line number Diff line change
@@ -0,0 +1,58 @@
----------------------------------------------------------------------------------------------------
「地政」資料夾中含25個縣市的對照表,其中每個對照表
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:Big5碼位(16進位)
PS:欄位之間以 Tab 隔開

----------------------------------------------------------------------------------------------------
「Big5」資料夾中含4個對照表
CNS2BIG5.txt為CNS對Big5的對照表
CNS2BIG5_Big5E.txt為CNS對Big5E的對照表
CNS2BIG5_七個倚天外字.txt為CNS對七個倚天外字集的對照表
CNS2BIG5(符號).txt為CNS對Big5符號及控制字元的對照表

其中每個對照表
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:Big5碼位(16進位)
PS:欄位之間以 Tab 隔開

-----------------------------------------------------------------------------------------------------
「CNS2DCI.txt」
為CNS對公路監理單位所使用的電信內碼的對照表,其中
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:電信內碼碼位(16進位)
PS:欄位之間以 Tab 隔開

-----------------------------------------------------------------------------------------------------
「CNS2FIN.txt」
為CNS對稅務內碼的對照表,其中
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:稅務內碼碼位(16進位)
PS:欄位之間以 Tab 隔開

----------------------------------------------------------------------------------------------------
「CNS2INC.txt」
為CNS對工商內碼的對照表,其中
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:工商內碼碼位(16進位)
PS:欄位之間以 Tab 隔開

----------------------------------------------------------------------------------------------------
「CNS2TAX.txt」
為CNS對財稅交換碼的對照表,其中
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:財稅交換碼碼位(16進位)
PS:欄位之間以 Tab 隔開

----------------------------------------------------------------------------------------------------
「Unicode」資料夾中含3個對照表
CNS2UNICODE_Unicode BMP.txt為CNS對Unicode 第0(BMP)字面的對照表
CNS2UNICODE_Unicode 2.txt為CNS對Unicode 第2字面的對照表
CNS2UNICODE_Unicode 15.txt為CNS對Unicode 第15字面的對照表

其中每個對照表
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:Unicode碼位(16進位),若是四位數則表示第0(BMP)字面,若是五位數則第一個數字表示第幾字面
PS:欄位之間以 Tab 隔開

-----------------------------------------------------------------------------------------------------
Original file line number Diff line number Diff line change
@@ -0,0 +1,77 @@
全字庫屬性資料說明文件

---------------------------------------------------
「CNS_phonetic.txt」為全字庫的注音資料表格
---------------------------------------------------
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:該CNS字碼的注音屬性(以注音符號表示)

---------------------------------------------------
「CNS_cangjie.txt」為全字庫的倉頡資料表格
---------------------------------------------------
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:該CNS字碼的倉頡屬性(以英文表示)

----------------------------------------------------
「CNS_stroke.txt」為全字庫的筆畫數資料表格
----------------------------------------------------
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:該CNS字碼的筆畫數(10進位)

------------------------------------------------------------------------------
「CNS_radical.txt」為全字庫的部首資料表格
------------------------------------------------------------------------------
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:該CNS字碼的部首代號(請參考下方的部首代號「CNS_radical_word.txt」)

------------------------------------------------------------
「CNS_radical_word.txt」為全字庫的部首代號資料表格
------------------------------------------------------------
第一個欄位:部首代號
第二個欄位:該部首所對應的EUC編碼(16進位)

---------------------------------------------------------------------
「CNS_pinyin_1.txt,CNS_pinyin_2.txt」為全字庫的拼音資料表格
---------------------------------------------------------------------
「CNS_pinyin_1」以調值(數字)呈現,「CNS_pinyin_2」以聲調符號呈現
第一個欄位:注音
第二個欄位:漢語(han)
第三個欄位:注音第二式(zuin2)
第四個欄位:耶魯(yale)
第五個欄位:韋式(wei)
第六個欄位:通用(general)

PS:若要利用拼音方式查詢字碼的話,依下列步驟進行
1. 首先,輸入漢語(han)、注音第二式(zuin2)、耶魯(yale)、韋式(wei)或通用(general)其中一種的查詢字串。
2. 利用第一步驟所輸入的查詢字串,在拼音資料表格(即CNS_pinyin_1.txt,CNS_pinyin_2.txt)找到相對應的注音資料(第一個欄位)。
3. 再利用此注音資料,至全字庫的注音資料表格(CNS_phonetic.txt)查詢符合其條件的CNS碼。

-----------------------------------------------------
「CNS_component.txt」為全字庫的部件資料表格
-----------------------------------------------------
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:該CNS字碼的部件代號(請參考下方的部件代號「CNS_component_word.txt」)

--------------------------------------------------------------
「CNS_component_word.txt」為全字庫的部件代號資料表格
--------------------------------------------------------------
第一個欄位:部件代號
第二個欄位:該部件的屬於哪個部件集合(10進位)
第三個欄位:該部件的筆畫數(10進位)

-------------------------------------------------------------
「CNS_component_word.zip」為全字庫的部件圖檔
-------------------------------------------------------------
內容包含517個部件圖檔(256x256),檔案名稱為部件代號,可用一般解壓縮軟體解開。

--------------------------------------------------
「CNS_strokes_sequence.txt」為全字庫的筆順資料表格
--------------------------------------------------
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:該CNS字碼的筆順資料(1表示「橫」、2表示「豎」、3表示「撇」、4表示「點」、5表示「折」)

--------------------------------------------------
「CNS_source.txt」為全字庫的字形來源資料表格
--------------------------------------------------
第一個欄位:CNS字碼(字面-編碼)
第二個欄位:該CNS字碼收錄編碼時之來源
3 changes: 1 addition & 2 deletions index.html
Original file line number Diff line number Diff line change
Expand Up @@ -31,8 +31,7 @@ <h1 style="text-align: center;">漢字! 关联及变体~ 字符文本(全文
<p style="color: grey; font-size: 80%;" >Licensed under MIT license</p>
<a href="https://github.com/garywill/cc-visualize">本工具源代码及说明 (本工具供试用参考研究勿直接用于商业或生产)</a>
| 其他工具推荐 <a href="https://github.com/garywill/BigSearch/blob/master/src/README_zh.md">大术专搜</a>(一个搜索、查询工具)中收集的汉语工具部分
<a target="_blank" href="https://acsearch.ga">网页版主站</a>
<a href="http://acsearch.tk">备用站</a>
<a target="_blank" href="http://acsearch.tk">网页版演示</a>
<a target="_blank" href="https://github.com/garywill/BigSearch">源代码</a>
<br /><br />
</div>
Expand Down

0 comments on commit f565ade

Please sign in to comment.