TY -的A2 -阿里,Shaukat AU -汗,爱迪盟-易卜拉欣,易卜拉欣AU - Uddin, m . iran AU -祖拜尔,默罕默德盟-艾哈迈德沙菲克AU -艾尔·菲尔多西,穆罕默德Dzulqarnain盟——Zaindin Mazen PY - 2020 DA - 2020/05/22 TI -机器学习方法检测论坛回答:一个应用程序的大数据分析SP - 4621196六世- 2020 AB -如今,数据涌入在线网络论坛,这是非常可取的巨大数量的数据转化为可操作的知识。在线网络论坛成为网络的一个组成部分,是知识的主要来源。人们用这个平台来发布他们的问题和从其他论坛成员得到答案。通常,最初的帖子(提问)得到不止一个回复帖子(答案),使得用户很难扫描所有的质量和最相关的答案。因此,如何自动提取最相关的回答的问题在一个线程是一个很重要的问题。在这个研究中,我们把答案提取的任务作为分类问题。回复帖子可以分为相关,部分相关,或与最初的职位无关。找到的相关性、相似性回复这个问题,词汇和使用nonlexical特性。我们建议使用LinearSVC,支持向量机(SVM)的变体,答案分类。两个选择技术,如卡方和单变量是用来降低特征空间的大小。 The experimental results showed that LinearSVC classifier outperformed the other state-of-the-art classifiers in the context of classification accuracy for both Ubuntu and TripAdvisor (NYC) discussion forum datasets. SN - 1058-9244 UR - https://doi.org/10.1155/2020/4621196 DO - 10.1155/2020/4621196 JF - Scientific Programming PB - Hindawi KW - ER -