朴素贝叶斯文本分类器的特征向量是怎么定义的?

问题描述:

朴素贝叶斯文本分类器的特征向量是怎么定义的?
是统计词频吗?那维数起不是大的很?最近看的论文提到了这个分类方法,希望专家、学者、高手帮助,
1个回答 分类:综合 2014-12-15

问题解答:

我来补答
一般是先分词,然后用TFIDF方法来向量化,只用词频效果不是很好,然后可以用特征选择方法或特征抽取方法来降低维度,一般的方法有信息熵、信息增益等等很多种的.如果你的机器跑得动的话不降也可以,不过一般来说还是要降的
 
 
展开全文阅读
剩余:2000