TY -的A2 -阿里,拉赫曼盟——刘、杨AU -李,香非盟- Chen Xianbang AU -王,Xi AU -李,华强PY - 2020 DA - 2020/05/18 TI -高性能机器学习对大规模数据分类考虑类失衡SP - 1953461六世- 2020 AB -目前,数据分类是最重要的一个分析数据的方法。然而,随着数据收集的发展,传输和存储技术,数据的规模大幅增加。此外,由于多个类和数据分布不平衡的数据集,类不平衡问题也逐渐突出。传统的机器学习算法缺乏能力来处理上述问题,这样分类的效率和精度可能显著影响。因此,本文提出一种改进的人工神经网络在使高性能大量不平衡数据的分类。首先,Borderline-SMOTE(合成少数过采样技术)算法是用来平衡训练数据集,可能旨在提高培训的反向传播神经网络(摘要),然后,零均值,batch-normalization,纠正线性单元(ReLU)进一步用来优化输入层和隐层的摘要。最后,总体上优于并行化的改进摘要使用Hadoop框架实现。积极的结论可以概括实验结果。得益于Borderline-SMOTE,可以平衡不平衡训练数据集,提高了训练的性能和分类精度。输入层和隐层的改进也收敛方面加强训练表演。 The parallelization and the ensemble learning techniques enable BPNN to implement the high-performance large-scale data classification. The experimental results show the effectiveness of the presented classification algorithm. SN - 1058-9244 UR - https://doi.org/10.1155/2020/1953461 DO - 10.1155/2020/1953461 JF - Scientific Programming PB - Hindawi KW - ER -