一种MapReduce并行化大数据文本分类方法-智能制造技术成果-科易智造网

一种MapReduce并行化大数据文本分类方法

行业：互联网和相关服务

类型：发明

成熟度：正在研发

交易方式：完全转让

应用领域：电子信息

立即咨询

技术内容

一种MapReduce并行化大数据文本分类方法，包括如下步骤：第一步：建立用于文本分类的基准测试数据集，进行数据预处理，包括分词、去停用词、词根还原；将该基准测试数据集随机划分为训练文本和测试文本，将所述基准测试数据集采用向量空间模型建立文本表示模型；第二步：根据上述文本表示模型采用CDMT对所述基准测试数据集进行特征选择；第三步：采用贝叶斯分类器对所述基准测试数据集进行训练学习，得到分类结果。本发明提供一种分类性能良好、区分度较高的MapReduce并行化大数据文本分类方法。

一种MapReduce并行化大数据文本分类方法

UOEC_HEX对称加密算法

基于博弈的云计算资源分配方法和系统

一种基于开放网络和位置采集App信息的方法

企业微信智慧城市建设解决方案及所需智能硬件

数据处理方法

一种无损的概率模型变换方法