版权说明 操作指南
首页 > 成果 > 详情

聚类加权和CS-LSSVM的文本分类

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
赵专政;李云翔
作者机构:
[赵专政; 李云翔] 湖南城市学院数学与计算科学学院
语种:
中文
关键词:
文本特征;聚类加权;最小二乘支持向量机;布谷鸟搜索算法
关键词(英文):
clustering weighted;least square support vector machine;cuckoo search algorithm
期刊:
计算机工程与应用
ISSN:
1002-8331
年:
2013
卷:
49
期:
16
页码:
124-128
基金类别:
湖南省教育厅青年项目(No.12804).
机构署名:
本校为第一机构
院系归属:
理学院
摘要:
文本特征提取和分类器优化是文本分类的两个关键问题,为了提高文本分类正确率,提出一种聚类加权(CW)和布谷鸟(CS)算法优化最小二乘支持向量机(LSSVM)的文本分类模型。采用TF-IDF算法计算特征词的权重,根据特征词的位置进行加权,经过特征聚类处理降低特征冗余度,采用LSSVM建立文本分类器,采用CS算法对LSSVM参数进行优化。采用复旦大学语料库对模型性能进行仿真测试,仿真结果表明,模型不仅提高了文本分类的正确率,而且提高了文本分类的效率。
摘要(英文):
Text feature extraction and classifier optimization are two key problems for text categorization, in order to improve correct rate of text classification, this paper proposes a text classification model based on Clustering Weighted (CW) and Least Square Support Vector Machine (LSSVM) optimized by the Cuckoo Search (CS) algorithm. TF-IDF algorithm is used to calcu- late the feature weights, the feature is weighted by words position and features are clustered to reduced feature redundancy, the LSSVM is used to build text classifier which is...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com