图书情报研究

2016, v.9;No.32(03) 79-86

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Past Issue) | 高级检索(Advanced Search)

基于机器学习的专利文本分类算法研究综述
A Review of Research on Patent Document Classification Algorithms Based On Machine Learning

刘红光;马双刚;刘桂锋;

摘要(Abstract):

总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的一般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程。将应用于专利文本分类的机器学习算法分为单一分类算法和组合分类算法着重探讨:单一分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法。指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望。

关键词(KeyWords): 专利文本;自动分类;机器学习;朴素贝叶斯;支持向量机

Abstract:

Keywords:

基金项目(Foundation):

作者(Author): 刘红光;马双刚;刘桂锋;

Email:

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享