经过实验室全体老师和同学的努力,我实验室为北京九瑞公司开发的合作项目日前顺利结束。
北京九瑞公司是一家在科技情报界颇有影响力的大公司,一直希望引进自然语言处理的最新研究成果,经过慎重比较最终选择了我们研究室作为合作对象。这次合作的内容涉及实验室在NLP(自然语言处理)和人工智能的多项最新研究成果。
这次项目开发共计分为7个部分,分别为
1.自动切词与词性标注模块(负责人:赵岩、赵健、姜维、李鹏)
2.基于内容的去重模块(负责人:孙承杰、孙柯)
3.自动分类模块(负责人:王强)
4.分类学习模块(负责人:王强)
5.相似度计算模块(负责人:关毅老师、赵玉茗)
6.文本自动摘要模块(负责人:徐永东)
7.聚类模块(负责人:刘远超老师)
其中文本分类在国家863评测中连续两次取得第一名的好成绩,而自动文摘、聚类、自动分词等模块曾经获得多项国家自然科学基金和863项目资助。
这次合作中每个模块都需要同时具备处理中、英文两个语种文档的能力。从香港归来的徐志明老师提供的英文处理平台加速了整个项目的进度。
该项目的另外一个特点是每个模块需要同时提供Windows、Linux两个版本。以硕士研究生孙晓山为首的研二同学(钟彬彬、刘寒磊、马毅、包刚、苑永生等人)攻克多项难关,顺利完成了向Linux平台的移植工作。
项目后期,孙建国同学利用其在Windows MFC编程上的优势,为整个项目作了一个非常漂亮的界面,从而为整个项目划上了完美的句号。
这次项目开发,标志着实验室多年的研究成果逐渐成熟,具备了走向实际应用的技术条件。另外也使研究队伍得到进一步的锻炼和提高。
(刘远超报导)