学术报告  
  NLP工具  
   
   
 

 

 

 

 

东北大学自然语言处理实验室

东北大学座落于美丽的沈阳南湖公园湖畔。著名爱国将领张学良将军曾兼任校长。东北大学自然语言处理实验室是高科技研究基地,该实验室成立于八十年代初,在姚天顺教授和朱靖波教授的领导下,主要从事计算语言学的研究,包括语言分析、文本信息智能处理技术、多国语机器翻译等领域的研究工作。

  • 实验室发展历程

1980年,姚天顺教授在香港中文大学Kongandao机器翻译研究中心做访问学者时,带领着实验室首次进入机器翻译的研究领域。

1984年,自然语言处理实验室在Schank的概念依存理论的基础上设计和实现了汉英机器翻译模型。

1987年到1994年,我们参加了由欧共体指导的中国国际金融有限公司亚洲多语种机器翻译系统(包括中国、日本、泰国、马来亚、印度尼西亚等)的研究。我们实验室负责对中文分析进行研究。1989年,在我们完成了上述工作后,我们也建立了我们自己的汉英翻译系统。

1990年到1994年,我们致力于电子工业部和国防科工委批准的“905 项目”。该项目被称之为CIPP,即中文信息处理平台的研究与实现。

1992年,我们与香港州立大学合作,使用我们的语言分析机,共同致力于“自动文本分类”的研究。从此,我们就一直保持着紧密的合作。

1992年,使用国家高科技智能计算机系统专家组,我们开始了“汉语及其它语言基础性研究(863-306-03-06-1)”项目。

1993年,由于我们实验室的出色工作,姚天顺教授被推举为国际东方语言计算机协会委员,并一直担任至今。

1992年11月,科技著作《自然语言处理》—— 一种让计算机懂得人类语言的研究,由清华大学出版社出版。

1995年到2000年,韩国浦项工科大学与我们合作开始研究中英韩多国语机器翻译系统,最终成功地完成了此项工作。

1997年,我们受美国BERLITZ翻译公司的委托,在计算机的帮助下将克莱斯勒的驾驶员手册翻译成很多种语言。最后,我们的翻译在美国得到了公开的发表。

1998年,我们参加了国家重点基础研究项目:图像、语音、自然语言理解和知识挖掘。我们负责汉英机器翻译评测系统(G19980305011)。这是在中国进行的首次全自动机器翻译评测项目。

1999年,摩托罗拉中国研究中心与我们合作,开始了对文本转语音的语言处理研究,并且给他们提供了我们的汉语翻译机。最后,我们按合同的规定完成了研究任务。

2002年,在征得科技部的同意后,我们与韩国浦项工科大学共同开发了“汉韩机器翻译系统(CK99-03)”。

2002年,我们开始了由国家高科技智能计算机系统专家组授权的“内容识别和文本信息过滤技术(863-301-7-7)”项目。

2001年,我们与美国普林斯顿松下信息网络技术实验室共同致力于网络OCR语言后处理。第二年,我们顺利地完成了该项目。

2002年5月,科技著作《自然语言处理》—— 一种让计算机懂得人类语言的研究,第二版由清华大学出版社出版。

2003年到2005年,我们接受国家自然科学基金与微软亚洲研究院联合资助的课题,主要从事基于领域知识的主题识别和文本结构的分析技术研究。

2004年,我们与日本富士施乐公司开展国际科研合作,主要从事的研究方向:汉日机器翻译系统,基于实例、基于模板、基于统计机器翻译理论和技术以及大规模双语语料库的构建。

2005年,与法国电信北京科研中心开展国际科研合作,主要研究信息抽取关键技术和基于语义的内容相关性计算研究。

2006年7月,与日本富士施乐公司开展国际科研合作项目:基于奥林匹克新闻的机器翻译系统第一期工作顺利完成,并继续第二期的工作。

由上述经历可见,经过二十多年的努力工作,我们已经发展成为拥有各种人才、具有较高国际信誉度、成熟理论、实践基地和进行工业开发能力的先进实验室。我们将继往开来,努力开创实验室的新篇章。

目前实验室已经形成了一支四十余人以姚天顺教授和朱靖波博士为首的稳定的研究队伍,其中包括两位教授、两位副教授、三位讲师、八位博士生、二十二位硕士生和一些本科生。

  • 研究方向

目前实验室的研究方向主要有:机器翻译、文本分类、话题检测与追踪(TDT)中文分词、 文本结构分析以及信息抽取。

  • 基础设施

有Dell服务器和SUN工作站各一台;PC机共四十多台;激光,彩色,针式,喷墨打印机七台, 扫描仪一台。500平方米(10间)的计算语言学实验室具有优越的网上工作环境与基础。实验室建设有微机局域网,通过东北大学校园网与国家教育和科研计算机网(CERNET)和Internet联网。

  • 一百万的汉语树库和五百万带标注的中文语料
  • 十七万词汇量的电子中文词典
  • 八万词汇量的电子英文词典
  • 二十六种专业的电子词典
  • 二十六万词汇量的英文词库及其操作软件
  • 三千中国人姓氏库
  • 四千基本姓氏库
  • 三十万特征库(动态语义库)
  • 中文名词和动词Wordnet
  • 合作开发的中-英-韩多国语言机器翻译系统
  • 中-英文双向机器翻译系统
  • 中间语言、规则描述语言及其编译器的完整设计
Top
 

 

版权所有: 东北大学自然语言处理实验室 2008 NEU NLP Lab | 关于我们 | 返回首页

更新时间: 2008年 3 月 1 日