学科代码

香港电脑汉字楷体字形参考指引

(Version7)

(2001年5月11日)

主题内容:

1.1本指引的目的是提供一套适合香港使用的电脑用楷体汉字字形原则,供厂商参考.

1.2本指引适用於ISO/IEC10646国际标准中的基本多文种平面(BMP),A扩充集(ExtensionA)及《香港增补字符集》(HongKongSupplementaryCharacterSet)内的汉字,但不适用於ISO/IEC10646国际标准所包括的内地规范简化字及仅在日本,韩国,越南或新加坡使用的汉字.

本指引以国家语言文字工作委员会於一九九七年十二月一日发布的《信息处理用GB13000.1字符集汉字部件规范》(文件号:GF3001-1997)为基础,并参考《常用字字形表(二零零零年修订本)》(见下文2.2.1段)的字形规律,把组成本指引适用范围内所有汉字的部件一一列出(部件拆分原则见下文第4段),再列举合适的汉字作为例子,藉此阐明适合香港使用的字形原则.

本指引只描述汉字部件的笔画结构,并不对汉字或其部件的大小和比例构成限制.

参考标准与文献

2.1标准

ISO/IEC10646-1:2000(E),InternationalStandard:InformationTechnology-UniversalMultiple-OctetCodedCharacterSet(UCS)-Part1:ArchitectureandBasicMultilingualPlane,ISO/IEC,2000

GB/T12200.2-94《汉语信息处理词汇02部分:汉语和汉字》,国家技术监督局,中国标准出版社,1994年12月7日

GB13000.1-93《信息技术通用多八位编码字符集(UCS),第一部分体系结构与基本多文种平面》,国家技术监督局,中国标准出版社,1993年12月24日

GB/T13443-92《信息交换用汉字128X128点阵楷体字模集及数据集》,国家技术监督局,中国标准出版社,1992年4月21日

GB12200.1-90《汉语信息处理词汇01部分:基本术语》,国家技术监督局,中国标准出版社,1990年2月1日

2.2文献

《常用字字形表(二零零零年修订本)》,李学铭主编,香港教育学院,2000年

TheUnicodeConsortium,TheUnicodeStandardVersion3.0,TheUnicodeInc.,2000

《语文建设通讯(香港)第63期.汉字笔画定量研究》,马显彬,﹐2000年4月

《常用国字标准字体笔顺手册》,台湾教育部,1999年11月

《香港增补字符集》,香港特别行政区政府,1999年9月28日

《国字标准字体宋体母稿-教育部字序》,台湾教育部,1998年2月

GF3001-1997《国家语言文字工作委员会语言文字规范信息处理用GB13000.1字符集汉字部件规范》,国家语言文字工作委员会,1997年12月1日

《现代汉字学纲要》,苏培成,北京大学出版社﹐1994年10月

《现代汉语通用字─笔顺规范》,国家语言文字工作委员会,语文出版社,1987年8月

《简化字总表(新版)》,中国文字改革委员会,1986

《汉语大字典》,汉语大字典编辑委员会,湖北辞书出版社和四川辞书出版社,1986年10月

《电脑用中文字型与字码对照表》,《技术通报C-26》,财团法人工业策进会,1984年5月

《康熙字典》,中华书局,1958年1月第一版

术语

3.1汉字Chinesecharacter/Hanzi(GB12200.1—90)

书写汉语的符号系统.除中国外,其他一些国家或民族也用汉字作为书写符号.

3.2简化字simplifiedChinesecharacter(GB12200.1—90)

特指内地於1986年公布的《简化字总表(新版)》(见上文第2.2.10段)所收纳的2235字.

UCS-2编码UCS-2code

ISO/IEC10646国际标准中以二字节定义的编码系统.UCS-2编码以十六进制表示.UCS-2编码与Unicode编码一致.

统一的中日韩文字UnifiedCJKIdeographs(ISO/IEC10646《信息技术通用多八位编码字符集》)

ISO/IEC10646国际标准包括的中国,日本,韩国及其他国家和地区经认同规则整合後所采纳的汉字的统称.

3.5原字集CJKIdeographSources(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)

ISO/IEC10646国际标准基本多文种平面内的中日韩文字是在整合中国,日本,韩国及其他国家和地区原有的电脑文字标准後得出的.这些原有的电脑文字标准或规范称为原字集.原字集的颁布国家和地区均有代号,其中G,H,J,K,S,T,V分别代表中国内地,香港,日本,韩国,新加坡,台湾和越南.

3.6认同规则UnificationProcedure(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)

指ISO/IEC10646国际标准使用的一套汉字统一整合规则.根据认同规则被认同的汉字不会分别编码,而在不违反认同规则的原则下,ISO/IEC10646国际标准不限制某一码位汉字的具体字形.

3.7原字集分别编码原则SourceSeparationRule(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)

凡在原字集中具有各自的代码的异体字,不受认同规则限制,在ISO/IEC10646国际标准中予以保留和分别编码,以保证ISO/IEC10646与原字集之间的对映关系不受影响.

非同源汉字non-cognatecharacters(ISO/IEC10646AnnexS《信息技术通用多八位编码字符集》附件S)

ISO/IEC10646国际标准中之术语.指字形近似但无字源关系或意义,用法不同的汉字,因此分别编码,例如:"士"和"土".有些国家和地区认为是相同的汉字,在其他国家和地区可能属於非同源汉字,例如:""(UCS-2编码为"6723")和""(UCS-2编码为"81A7").ISO/IEC10646国际标准把一些容易混淆的非同源汉字载列於附件S.

3.9楷体KaiTi(GB/T12200.2—94)

汉字主要印刷体之一.由手写的正规楷书发展而来.

3.10笔画stroke(GB/T12200.2—94)

构成楷书汉字字形的最小连笔单位.

3.11笔形strokefeature(GF3001-1997)

笔画的具体形状.楷书汉字的笔形依据笔势和走向可以分为数十种,其基本的类别为"一"(横),""(竖),""(撇),","(点)(包括""(捺))和""(折).

3.12笔顺strokeorder(GF3001-1997)

书写每个汉字时笔画的次序和方向.

3.13笔数strokecount(GB/T12200.2—94)

构成一个汉字或汉字部件的笔画数目.

3.14汉字部件Chinesecharacterponent(GB/T12200.2—94)

由笔画组成的具有组配汉字功能的构字单位.简称"部件".

例如:"木,心,口,也".汉字的偏旁部首是部件的一种.

3.15基础部件basicponent(GF3001-1997)

最小的不再拆分的部件称为"基础部件".基础部件处於汉字结构的最低层,又称末级部件.例如"男"中的"田","力".

3.16主形部件与变体部件principalponentandvariantponent

某些部件的形状会受到位置影响而变化.该等部件的原形称为主形部件,受到位置影响而出现的变体称为变体部件.例如:"又"(见於"设& #34;字)与""(见於"灿"字)两者之中,"又"为主形部件,""为变体部件.主形部件具有代表和称说本组部件的作用.

3.17相关部件relatedponents

有字源关系的两个或多个部件,例如"手"和"".

3.18形似部件similarponents

形状相似,但无字源关系或主形与变体关系的两个或多个部件,例如:"士"和"土".

3.19部件拆分(GF3001-1997)ponentdeposition

将汉字拆分为部件称部件拆分.

3.20有理据拆分和无理据拆分etymology-baseddepositionandpromiseddeposition

根据汉字构成的结构理据所进行的部件拆分,称有理据拆分,当无法分析理据或理据与原始形成的字形不一致时,依照已定义之部件所进行的部件拆分,称无理据拆分.

部件拆分原则

本指引对适用范围内的汉字进行部件拆分.,拆分原则以《信息处理用GB13000.1字符集汉字部件规范》第5段《汉字基础部件表》使用规则所载的部件拆分原则为基础.具体的拆分原则如下:

4.1尽量延用《信息处理用GB13000.1字符集汉字部件规范》所载的部件.

4.2不违背形体的原则:

交重不拆,例如:"串"不会再拆分,"或"中的"戈"不会再拆分,

相离相接可拆,例如:"计"拆分成"言"和"十","页"拆分成""和"贝",

少数不影响结构和笔数的笔画搭挂,按相接处理,例如:"页"中的""和"贝"当作相接.

遵照结构规律的原则:

部件组成合乎汉字构件原理,进行有理据拆分,例如:计"拆分成"言"和"十".无法分析理据或与字形原始形成出现矛盾时,依形进行无理据拆分,例如:"丢"字原为""由""(撇)和"去"组成,而香港已习惯将撇变成横,且"王"与""已包括在《信息处理用GB13000.1字符集汉字部件规范》内,因此"丢"以无理据拆分成"王"与"".

在进行多部件的有理据拆分时,依汉字组合层次进行,例如:"蓓"的第一次拆分为""和"倍","倍"再拆分为""和"",""再拆分为"立"和"口".

合理控制下限的原则:

两个以上的相离或相接部分,若其中一个无构成其他字的能力,则不再拆分,例如:""不会再拆成""和"",因""不独立构字.

两个相离的对称部分,不独立构字,不再拆分,例如:"".

依笔形区分部件的原则:

主形部件和变体部件分别列出.

属於不同源的部件,笔形完全相同的,当作同一部件.

部件的大小和笔画的绝对长短粗细不作为区分部件的标准,例如:""部件作独体汉字""用和作部件时(如"匹"),"一"(横)长短的写法习惯会有所不同.


(3)综合衡量的原则:以上原则无法兼顾时,权衡利弊,综合处理.

5.《香港电脑汉字楷体字形基础部件表》

本表列载的基础部件合共621个,是对本指引适用范围内的汉字进行拆分的结果.

5.1部件排列方式

部件按笔画数从少到多顺序排列.

笔画数相同,则按起笔"横竖撇点折"顺序排列.

5.2栏目说明

5.2.1序号:列出部件的排列顺序号.

5.2.2部件:列出部件的基本形状和出处代码.

出处表示由该部件组成的汉字是否出现在以下四种参考文献中.出处代码以四个数字(ABCD)组成:

A:"大五码"(见2.2.12)

B:《康熙字典》

C:《汉语大字典》

D:《香港增补字符集》5.2.3笔画数:列出部件的实际书写笔画数目.

5.2.4例字:列出包含该部件的汉字楷体字形作为示例.

例字後面有"等"者,表示没有穷举,还有其他例字.

例字後面没有"等"者,表示已经穷举.

每个例字之下方均列出其UCS-2编码.有"*"者表示该字收录於《常用字字形表(二零零零年修订本)》.

UCS-2编码下方标明该例字的出处,代码与5.2.2段所述者相同.

5.2.5附注:与部件相关的补充说明. 例如标示主形部件,变体部件,相关部件和形似部件的序号,按原字集分别编码原则而分别编码的汉字,以及非同源汉字.

5.2.6GB组号和GB序号:如部件原来载列於《信息处理用GB13000.1字符集汉字部件规范》,该规范编予该部件的组号和序号也一并列出,以便检索.由於《信息处理用GB13000.1字符集汉字部件规范》不是字形规范,而且内地的书写习惯与香港不尽相同,因此该规范所列的部件形状可能与本指引所列的对等部件形状略有不同.

本指引建议厂商参照ISO/IEC10646标准中G列字形制造此类汉字.

台湾工业标准"大五码"之正式文献

认同规则原文见ISO/IEC10646AnnexS(Informative)ProcedurefortheUnificationandArrangementofCJKIdeographs.

由於本指引的适用范围不包括ISO/IEC10646国际标准中的内地规范简化字及仅在日本,韩国,越南,新加坡使用的汉字,因此拆分出来的部件不包括这批汉字独有的部件.

May11,2001DocumentNo.:DN46

1

类似论文

化学学科硕士生就业现状其

摘 要 :化学专业在国家、社会的发展进步中起到了举足轻重的作用 随着研究生招生规模的不断扩大,化学学科。
更新日期:2024-4-21 浏览量:57375 点赞量:13208

地理课堂教学应该体现地理学科的特点

目前高中地理教学中,常常发现这样的问题:很多学生不喜欢上地理课,大多数学生认为地理课原理晦涩、枯。
更新日期:2024-7-27 浏览量:96926 点赞量:21814

体育学一级学科生培养方案

宁研[2016]17号 关于举办2016年宁国市中小学体育教育 优秀论文评选的通知 各中小学: 为了推动全市中小学。
更新日期:2024-8-2 浏览量:15540 点赞量:4667

学科德育渗透方法点滴

本着教书育人的准则,学科德育渗透的根本目的是以德育人,要求寓德于教,寓教于乐 学科德育渗透的内容主。
更新日期:2024-1-14 浏览量:18720 点赞量:5089

物理学科课堂教学中法制教育的渗透

加强中小学法制教育,是落实依法治国基本方略,是引导和帮助青少年学生健康成长、预防未成年人违法犯罪、培养社会主义法治国家合。
更新日期:2024-12-23 浏览量:157464 点赞量:33981

学科教学中的德育渗透

新的课程标准把学校德育教育放在了首位,总体要求也是要把学生培养成为具有爱国主义,集体主义精神,热爱社会。
更新日期:2024-6-8 浏览量:13085 点赞量:3950

初中思品学科学习方法

【中图分类号】G631【文献标识码】A【文章编号】2095-3089(2012)08-0085-01“授人以鱼,不如授人以渔”,如何引导和。
更新日期:2024-11-4 浏览量:18743 点赞量:5100