TY -的A2 - Pena,安东尼奥·j . AU -肖,温家宝AU -胡,胡安PY - 2020 DA - 2020/09/01 TI -并行聚类算法基于一项调查火花SP - 8884926六世- 2020 AB -聚类是一种最重要的非监督机器学习的任务,这是广泛应用于信息检索、社会网络分析、图像处理等领域。随着数据的爆炸性增长,传统聚类算法不能满足大数据聚类的要求。火花是一个最流行的并行处理大数据平台,和许多研究者已经提出了很多基于火花并行聚类算法。摘要现有基于火花的并行聚类算法进行分类和总结,每一种算法的并行设计框架进行了探讨,并在比较各种不同的算法,讨论了未来研究的方向。SN - 1058 - 9244 UR - https://doi.org/10.1155/2020/8884926 - 10.1155 / 2020/8884926摩根富林明科学编程PB - Hindawi KW - ER