自动化文翻译软件工程设计

论文格式要求

一,总的要求

全文一般不超过8000汉字(约4000英文单词),每篇论文均应有中英文两种文字的标题,作者,姓名,单位和不超过200字的摘 要 .全文电子邮件投稿,要求Word2003兼容的电子文档和PDF文档各一份.

二,中文编排格式:

大标题:居中,小二号,黑体,加粗,前空1行

作者:居中,小四号,仿宋,与题目之间间隔0.5行

作者地址:五号,楷体,单倍行距

中文摘 要 ,关 键 词 :小五号,楷体,与作者地址间隔1行,"摘 要 "和"关 键 词 "加黑

全文中出现的英文单词或字母一律采用Times New Roman字体

英文题目:居中,小二号,加黑,与前面中文"关 键 词 "行间隔1行

英文作者名:小四号,与英文题目之间间隔0.5行

英文作者地址:五号,单倍行距

英文Abstract和Keywords:小五号,斜体,与作者地址间隔1行,"Abstract"和"Keywords"加黑

正文:与前面的英文关 键 词 间隔1行,正文内容的汉字用五号字,宋体

一级标题:四号,黑体,加粗,前后空0.5行

二级标题:小四号,黑体,加粗

标题:五号,黑体,加粗

参考文献:小五号,宋体,具体请见参考文献编排格式,在正文中引用的汉语文献采用如下格式:[第一作者,年份],或者[第一作者等,年份1,年份2],或者[第一篇参考文献的第一作者,年份,第二篇参考文献的第一作者,年份,等],英文引用文献采用如下格式:[英文第一作者的姓,年份],或者[英文第一作者姓+ et al.,年份1,年份2]

行距:单倍行距

三,英文论文编排格式:

字体:Times New Roman

英文论文需有中文摘 要

大标题:居中,小二号,加粗

作者名字,通信地址,中英文摘 要 ,关 键 词 等分别参照上面对应的说明

正文:五号

一级标题:四号,加粗

二级标题:小四号,加粗

标题:五号,加粗

参考文献:小五号,具体请见参考文献编排格式

行距:单倍行距

四,参考文献编排格式:

编号:参考文献前不要加编号

排序:作者姓氏的发音顺序排列

格式:

专着:作者1,作者2.书名.出版社所在城市名:出版社,出版年.

刊物:作者1,作者2. 文章名. 期刊名. 发表年,卷或年(期):起讫页码.

论文集:作者.文章名. 论文集编者. 论文集名. 出版地:出版者,起讫页码.

翻译:原作者1,作者2.书名.译者名译.出版社所在城市名:出版社

外文第一作者姓在前,名字在后,姓与名中间用","分隔,除第一作者以外的姓名请按正常顺序书写

A Hierarchical Parsing Approach with Punctuation Processing for Long Chinese Sentences

Xing Li and Chengqing Zong

National Laboratory of Pattern Recognition, Institute of Automation,

Chinese Academy of Sciences, Beijing 100080, China

E-mail:{xli, cqzong}@nlpr.ia.ac.

Abstract: Based on the analysis of the usage and the syntactic function of Chinese punctuations, this paper proposes a new hierarchical approach to parsing the long Chinese sentences.

Keywords: artificial intelligence, natural language processing, parsing

1引言

句法分析算法的时间复杂度和句子长度密切相关,在不采用启发式策略处理的前提下,典型句法分析算法的时间复杂度都近似于句子长度的三次方[1].

2引入标点处理的层次化长句句法分析方法

2.1 层次句法分析方法

首先对包含"分割"标点的长句进行分割,然后对分割成的各个子句单元分别独立地进行句法分析,从而获得最终整句的最大概率的句法分析树.

2.1.1 长句分割

对这种类型的问题,我们提出了一种子树粘接操作的方法来处理,从而将并列的成分合并.图4显示了这种子树粘接的操作过程.

图4. 子树粘接操作

公式如下:

(1)

句子的分布情况如下表1所示:

表1. 测试句分布

文学11621~12336.06路甬祥.科学的历史经验与未来.自然科学史研究.1998,17(3):197—206.

Lafferty, J., A. McCallum and F. Pereira. Conditional random Fields: probabilistic models for segmenting and labeling sequence data [A]. Harry Q. Bovik. Proceedings of ICML. Massachusetts, USA. Pages 282-289.

Alshawi, Hiyan, Srnivas Bangalore, and Shona Douglas. 1998a. Automatic Acquisition of Hierarchical Transduction Models for Machine Translation. In Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics (ACL). Pages 41-47.

Alshawi, Hiyan, Srnivas Bangalore, and Shona Douglas. 1998b. Learning Phrase-based Head Transduction Models for Translation of Spoken Utterances. In Proceedings of the International Conference on Spoken Language Processing (ICSLP). Sydney, Australia. Pages 2767-2770.

Error-driven Combination Classifiers


Fang Xu, Chengqing Zong, Xia Wang

National Laboratory of Pattern Recognition, Institute of Automation,

Chinese Academy of Sciences, Beijing 100080, China

E-mail:{fxu, cqzong, xwang}@nlpr.ia.ac.

Abstract: This paper proposes a hybrid error-driven bination approach to chunking Chinese base noun phrase (Chinese base NP), which bines TBL (Tranormation-based Learning) model and CRF (Conditional Random Field) model.

Keywords: Chinese base NP chunking, hybrid classifier

错误驱动的组合分类器方法

徐方 宗成庆 王霞

中科院自动化化研究所模式识别国家重点实验室,北京,100080

E-mail:{fxu, cqzong, xwang}@nlpr.ia.ac.

摘 要:本文采用一种新的错误驱动的组合分类器方法来实现中文base NP识别.本文对中文和英文base NP识别技术现状进行了简要分析和概述.

关键字:中文base NP 识别,组合分类器

Chunking means extracting the non-overlapping segments from a stream of data. These segments are called chunks (Dirk and Satoshi, 2003).

2Task Description

2.1 Data Representation

Ramshaw and Marcus (1995) ge mainly two kinds of base NPs representation - the open/close bracketing and IOB tagging.

Figure 1: Fusion data flow

Equations should be placed on separate lines and numbered. Examples of equations are given below.

(1)

2.1.1 Results and A

The test corpus contains 50k words. Each word contains two Chinese characters in erage. Table 1 presents the best results for our experiments.

Table 1: the Best Experiment Results

method P R F1 SVM 88.68% 87.08% 87.87 CRF 89.42% 87.46% 88.43 Combination 90.58% 89.35% 89.96 References

Lafferty, J., A. McCallum and F. Pereira. Conditional random Fields: probabilistic models for segmenting and labeling sequence data [A]. Harry Q. Bovik. Proceedings of ICML. Massachusetts, USA, 2001. Pages 282-289.

Alshawi, Hiyan, Srnivas Bangalore, and Shona Douglas. 1998a. Automatic Acquisition of Hierarchical Transduction Models for Machine Translation. In Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics (ACL). Pages 41-47.

Alshawi, Hiyan, Srnivas Bangalore, and Shona Douglas. 1998b. Learning Phrase-based Head Transduction Models for Translation of Spoken Utterances. In Proceedings of the International Conference on Spoken Language Processing (ICSLP). Sydney, Australia. Pages 2767-2770.

类似论文

机械文英文翻译软件工程设计

一级学科名称及代码二级学科名称及代码招生院系及代码预计招生人数考试科目复试办法及内容备注0251金融025100金融硕士010经济学院56(46+。
更新日期:2024-9-6 浏览量:17827 点赞量:5288

英文机械文翻译软件工程设计

2016届毕业论文(设计)课题任务书院(系):机械工程学院专业:机械设计制造及其自动化指导教师学生姓名课题名称法兰盘。
更新日期:2024-11-8 浏览量:20556 点赞量:5849

建筑设计职文软件工程设计

软件工程设计(论文)题目:系部:专业:学号:学生姓名:指导教师:职称:二OO六年月日目录一 摘 要和关 键 词-。
更新日期:2024-3-6 浏览量:10000 点赞量:3566

英文文翻译报价软件工程设计

工商管理学院毕业论文(设计)规范一,实证调查报告内容组成报告应包括以下方面内容:题目,2摘 要(中文),3关 键 词,4正文,5。
更新日期:2024-11-24 浏览量:144133 点赞量:30922

工程类文格式软件工程硕士,软件工程硕士

软件工程硕士(双证)学位论文申请答辩操作指南一、学位论文答辩申请 1,修满规定学分并完成论文后,经导师同意方可进入论文答辩申请,2,以学生身。
更新日期:2024-12-6 浏览量:23487 点赞量:7024

科技文翻译软件成人

辽宁省重点培育学科——计算机软件与理论学科概况计算机软件与理论是辽宁省重点培育学科,自二十世纪八十年代初该学科即开展了。
更新日期:2024-8-9 浏览量:15454 点赞量:4357

自动化文翻译软件工程设计

论文格式要求一、总的要求 全文一般不超过8000汉字(约4000英文单词),每篇论文均应有中英文两种文字的标题,作者,姓名,单位和不超。
更新日期:2024-3-23 浏览量:45232 点赞量:10708