1.肖镜辉:“一种基于相似度的汉语语言模型平滑技术及在音字转换中的应用”
摘要:介绍数据稀疏问题和前人解决方法,在前人的基础上,提出一种基于汉语语义相似度的平滑方法,并提出一种计算模型参数的迭代算法。实验表明,本文方法是有效的。
2.姜维
摘要:一些用法复杂的兼类词,其词性通常需要复杂特征才能准确进行标注。而现有模型难以从语料库中提取复杂特征,以及难以在含有噪声和不一致标注的语料库中提取有效特征。本文采用粗糙集理论(Rough Sets),有效挖掘包括长距离特征在内的复杂特征。利用最大熵模型进行融合实验。