2008年9月12日,在计算机学院新技术楼618室,在刘秉权老师的主持下,张德园博士生进行了以 Support Vector Machines and LIBSVM Guide(svm原理与libsvm使用指南)为题目的学术报告。
SVM已经成为一种流行的机器学习方法,在各个领域中有着广泛的应用,各种工具包层出不穷,极大地降低了新手使用SVM的难度。然而,新手却总是在不知道svm的分类原理下滥用SVM的软件工具包,以至使用SVM得不到好的结果。针对这种问题,报告首先讲解了SVM分类的基本原理(svm的几何解释,最优化问题以及svm的求解方法)。通过SVM分类的基本原理,讲解了libsvm软件包各个参数的来源以及使用方法。最后结合个人经验,介绍了svm选取参数的一些问题以及一些经验技巧。
研究室的所有人员都参加了本次报告。张德园博士生的报告的内容丰富具体,每个环节都联系紧密,他的语言风趣幽默,却又严谨细腻。报告结束后,老师和同学们还对此报告内容进行了提问和讨论,现场气氛十分热烈。展现了我们研究室浓浓的学术气氛。
2008年9月17日,在计算机学院新技术楼618会议室,孙承杰博士生做了题为“基于判别式模型的生物医学文本挖掘相关问题研究”的学术报告。判别式模型是一类直接利用特征来预测目标变量的发生概率的机器学习模型。相对于产生式模型,判别式模型降低了特征之间的独立性假设的要求,并且与很多文本挖掘任务的需求相一致,因而更有可能取得好的效果。本报告主要阐述如何利用判别式模型(最大熵模型和条件随机域模型)来解决生物医学文献挖掘中的问题。具体地包含生物医学文本挖掘中的三个任务:生物医学名实体识别、生物医学实体规范化以及生物医学语义关系抽取。在这三个任务中,第二个任务是第一个任务在语义处理上的延伸,前两个任务是第三个任务的基础。
孙承杰博士生的报告内容涵盖面广,章节与章节间环环相扣,所举实例恰到好处,促进大家对报告内容的理解,加深记忆。此次报告使大家受益匪浅。