抽象性
上下文.教育数据挖掘是一个新兴研究领域数据挖掘技术用于教育领域提取雇员或学生进步行为实用信息最近学习数据增加使教育数据挖掘具有重要性和势头,以更好地了解和优化学习过程和学习环境目标.数据是组织最值钱的商品从如此大规模和大规模收集资料中提取有用信息非常困难。数据挖掘技术用于预测和评价学生学术成绩,依据他们的学术记录和参与论坛虽然已开展数项研究评价全世界学生的学术表现,但缺乏适当的研究评估可提高学生学术表现的因素方法论.当前研究试图权衡有助于提高巴基斯坦学生学术表现的因素本文应用并分析简单并行集群技术以指出最佳特征并行K-平均算法解决简单算法问题,并行算法结果总是不变的,提高集群质量、迭代数和过期时间结果.算法都测试并比较 数据集一万和五千整数项数据集评价十倍最小折叠时间变换K级值从1到10拟议的研究对科学研究数据排序更有用科学研究数据统计比较精确
开工导 言
生活在数据世界每天人们都发现大量数据并存储这些数据供进一步探索或分析大型数据集快速增长,因此使用传统技术提取和挖掘重要信息是一项极具挑战性的任务[一号..数据收集所有事实、数字和数字,计算机系统可按序处理商业组织正在积聚大容量数据 并存于各种搭建、格式和数据库包括[2事务数据还称运算数据,即成本、销售、账务、发薪和盘点和非运算数据,即预测数据、行业销售和宏观经济数据以及元数据,如数据词典定义或逻辑数据库设计高效高效数据挖掘法不同用于挖掘大数数据集中有用和重要信息集群分类最常用数据挖掘技巧从大数据集检索数据分类被称为监督学习现象,而集群为不受监督学习现象
分类也称监督学习技术3..为了理解新现象或学习新对象,人们总是试图将新对象与其他异异或异性比较4..比较后可作出决定机制分类技术数据挖掘5..集群还称无监督学习法6需要将数据项分组为高度相似但不同于其他集群数据项的集群7,8..集群法在许多领域使用,例如计算机科学、工程学、地球科学、生命医学、经济学、社会科学等实例应用语音识别九九图像分割 色识别10网页挖掘 文本挖掘 并分组病人 学生 客户和项目11..分治法将完整数据集拆分为子数据集整个数据集用n表示,而用n表示K级表示子数据集并称集群...N级表示数据集中数据项总数,而k即子数据集整体数据集必须大于集群总数,即高山市N级>k)数据集群项目相似,但不同于另一集群项目分治方法进一步划分为几大不同类别,即K-药类聚类K级海洋聚类 重定位算法 概率聚类12..分级聚类中,每个聚类节点都包含父类聚类、子类聚类和sibling聚类归为自下而上(聚合式)和自上而下(分聚类)。层次聚类法的基本缺陷是,一旦分解或合并决策执行后,即不可重定 [13..层次集群技术将相似对象归并到不同组类中14..尾端确定集群数,其中每个集群与另一集群不同,集群中数据项相似本研究侧重于简单并行两种集群技术K-平均策略
简单化K-常用技术是最受欢迎和最简单不受监督学习方法之一无监督学习技术使用输入向量从数据集推理而不参考标签结果初始简单K-平均值随机选择croid处理数据中心机器人是这些集群的起始点 优化位置使用迭代程序计算简单化K-平均值为分治方法之一,即最简单聚类技术简单化K-平均聚类算法分割全数据集分解到不同的子集群中,子集群由 " 表示k.简单化K-平均算法简单易实现,但仍有一些缺陷简单化方式K-平均初始美甲k)不规则偏向于每一集群运行或执行时简单K-平均算法产生不同的集群产生不同结果是因为初始子子机简单化K-平均聚类算法k表示用户专用参数来来来来k数组应预置初始子机器人应谨慎选择K-平均聚类算法因随机选择初始小机器人,结果将不同于前次运行因此缺陷,集群互不相同数据集群可能因集群而异简单化K-平均算法对噪声敏感,因为算术平均值可能受噪声数据极大影响中值用于解决简单问题K-平均聚类它可以应用过程数型数据,无法用于绝对型数据如果提供大数据集,则集群需要更多空间最关键问题简单K-平均聚类算法即空间处理速度需求,当数据集大时算法使用客户服务员架构解决处理速度和内存需求问题简单并行K-平均算法用于大数据集简单并行K-平均聚类算法,数据集分治子段沉浸,因此处理子段时需要少点空间和处理速度初始偏差随机选择简单化的劣势K-平均算法由初始小机器人随机选择 并行结果K-平均聚类算法因运行或执行而异数据项从一组移到另一组,影响集群质量仿佛简单化K-平均并行K-平均值并迭代集群变化
论文共由六节组成引言部分讨论了聚类的不同通用术语,并具体讨论了K-Mean和并行K-Mean聚类算法在本研究中应用聚类算法和不同类型的聚类法段内2展示简单化现有研究K-平均并行K-平均算法和基于研究的分析段内3讨论研究实施和评价段内4展示结果并讨论研究段内5专为Mess and future
二叉文献评论
J..b.MacQueen率先介绍K-表示集群算法(Semple)1967年15..多位研究者研究此简单K-平均聚类算法, 和一些最新研究工作在这里讨论程序持续到集群无差Min-max距离测量由Karthikeyani和seguna介绍16..输入数据集先归归并后归归归并范围内(0,1),初始小机器人随机选择使用微量相似度测量计算距离中3整数据集分块使用最小值和最大值限制变换后,数据集对象配方按距离排序,并划分成子集群k集合体)中值还计算出每组值,计算出中值测量为初始小机器人,然后集群设计使用初始集群设计17,18号..技术使用排序算法,这些算法有额外时间复杂性中心块计算成数据集最简单视图计算定型小机器人时使用减值数据集数据点移到适当的集群Fahim等[19号什叶秀明20码提交K-平均算法并存储所有迭代信息时使用数据结构并使用存储信息计算时间由技术保存需要数据结构初始类集基于随机选择初始类集洪阳和佳21号介绍动态K-平均聚类技术第一步服务器端从给定数据集生成子数据集变换后,数据集对象配方按距离排序并划分成子集群k集合体)中值还计算出每组值,计算出介质测量为初始小机器人,然后集群设计使用初始集群设计22号..技术使用排序算法 多时复杂连接服务器的所有客户系统接收子数据集K级数组和初始小机器人客户端系统计算集群并转发结果到服务器进程继续,集群内没有变化RBFNN辐射基础函数神经网络结构理论已经讨论过K-表示聚类动态法用于中心选择实验结果显示RBFNN近似性能良好K-平均聚类技术用于中心选择由所有客户系统组成集群后发送服务器系统服务器端所有集群编译计算编译集群的算法方式新计算算法方法比前算法方法新方式值等同前方法值,进程终止,否则会继续
算法由Jirong等介绍[23号中随机从大数据集选择子数据集分治聚类算法用于获取聚类对子集的每一部分分治算法用于收集中心集后最受欢迎小机器人集群分类最常用数据挖掘技巧从大数据集检索数据分类被称为监督学习现象,而集群为不受监督学习现象中值还计算出每组值计算介质测量初始小机组,然后集群设计使用初始集群设计22号..技术使用排序算法 多时复杂记录简单K-平均聚类算法解析24码-26..取自数据集k初始小机器人随机选择数据项中的每一项通过计算数据项与初始小行星之间的距离放入适当的集群程序持续到集群无差Min-max距离测量由Karthikeyani和seguna介绍16..输入数据集先归归并后归归归并范围内(0,1),初始小机器人随机选择使用微量相似度测量计算距离Santhi等引入算法,它能检验数据集中是否有负数27号..负数识别后,通过从数据集余下数中最小值减法操作转换成正数中间值为每组值计算,计算介质测为初始小机器人,然后集群设计使用初始集群设计28码..技术使用排序算法 多时复杂简单研究K-平均聚类算法由Chen和徐组织29中讨论利弊 和典型需求K-平均聚类程序Yujun等引入算法中,分片和合并是聚类的两个主要阶段30码..分级阶段中,每一集群使用小子集群划分K-平均聚类算法选择数据集,而在合并阶段平均距离工作合并Fahim等[7什叶秀明20码提交K-平均算法存储数据结构中所有迭代信息并使用存储信息计算时间由技术保存需要数据结构初始类集基于随机选择初始类集Chawan等引入算法,它能随机选择选定数据集中的初始近似31号集群由密钥组成 密钥设计 最大内最小内距离如果密钥距离小于最小值,则数据点分配到同一组数据中的另一组测试并观察选择小机器人 影响会议时间 他们的表扬算法
作者还介绍算法提高效率K-平均聚类32码数据集转换成正值时,从所有数据项中减去最小值,如果数据集识别负值距离计算数据项从常用子机中计算数据集的出处初始小机器人选择方式使数据集中第一个最接近常用小机器人选择为初始小机器人三十三..对象从数据集中除去Chenfei和Zhiyi15介绍K-平均聚类算法中选择数据集中的任何数据项并计算选定数据点与其他数据点之间的距离阈值计算法将数据点整片划分为100块距离值匹配阈值时,选择它为初始半机器人进程持续持续到s初始croid组成并数据点分配到适当的集群进程继续获取最终集群K-均值聚类算法混合数分数34号..Raed和Wasem13推荐算法选择K-平均聚类法...K级值随机选择数据集所选数据项与其他数据项之间的距离计算以检验随机选择初始近似值猜法是否有效数据集中数据点按计算距离排序基值最接近数据项选择子数值计算子数均值计算为首个首选子数子数准值计算以这种方式计算剩余初始近似Sanpawat和Alva2介绍并行版K-平均聚类算法算法使用主服务员法集群化,又称无监督学习方法,将数据项分组为高度相似性但与其他集群数据项不相容的集群集群法在许多领域使用,例如计算机科学、工程学、地球科学、生命医学、经济学、社会科学等应用实例有语音识别图像分割、颜色识别、网络挖掘、文本挖掘和对病人、学生、客户和项目分组
清等人[12介绍并行K-平均聚类算法基础选择初始近似计算数据项间距离距离最长数据项从数据集移出并放入新列表阈值为新列表选择集群分类最常用数据挖掘技巧从大数据集检索数据分类被称为监督学习现象,分组则称非监督学习现象等新链表项目达到阈值时,新链表值以初始子子机返回ParaMeans软件设计并行K-平均聚类算法35码..执行并行基础K-平均聚类算法使用普通实验室ParaMeans提供易控客户端应用动态负载平衡技术增强并行K-平均聚类算法36号..由所有客户系统组成集群后发送服务器系统服务器端所有集群编译计算编译集群的算法方式新计算算法方法比前算法方法新方式值等同前方法值,进程终止,否则会继续使用此技术,主系统向奴隶系统分配相同大小子数据集简单化K-平均聚类算法解析37号..数据项与初始近似值之间的距离计算,每一数据项放入适当位置多位研究者研究此简单K-平均聚类算法 并讨论一些最新研究程序持续到集群无差Min-max距离测量由Karthikeyani和seguna介绍38号..输入数据集先归归并后归归归并范围内(0,1),初始小机器人随机选择使用微量相似性测量法计算距离(0,1)三十九..Ran Vijay和Bhatia40码介绍K-平均算法,项目频率最小平均段计算并视之为croid服务器端所有集群编译计算编译集群的算法方式新建计算算法方法与前数法方法比较阈值距离计算并最后数据项移到适当的集群
Chenfei和Zhiyi41号记录数据集选择数据项并计算选定数据点与其他数据点之间的距离阈值计算法将数据点整片划分为100块距离值匹配阈值时,选择它为初始半机器人进程继续获取最终集群集群算法介绍K-均值混合数和绝对数42号..Raed和Wasem43号推荐算法选择初始小机器人选择数据项与其他数据项之间的距离计算以检验随机选择初选近似值是否有效最接近数据项基于阈值选择子集,子集算法平均值计算为首个首选子集以这种方式计算剩余初始近似13..Sanpawat和Alva44号介绍并行版简单K-平均聚类算法算法使用主从法(Server-Client)算法基于随机选择初始近似互为研究者应用并行K-平均算法使用农用数据45码..客户端服务器架构处理这些数据集并发简单K-中值技术还基于随机选择初始小机器人26,46号..并行集群技术基于消息传递接口M-K-方法组成MPI和顺序K-方法应用教育数据集47..临ΤK-平均传递界面和消息传递界面在同一实验中互用,实验还基于随机选择初始近似公元前子数据集公元前表示连接主计算机的节点数算法用脱氧核糖核酸数据集简单测试K-平均算法并行化,初始小机器人随机选择清等人[48号.... 调查相同性质研究时发现为新表选择阈值等新链表项目达到阈值时,新链表值以初始子子机返回ParaMeece软件设计并行K-平均聚类算法13,49号..执行并行简单K-平均聚类算法使用普通实验室ParaMeece提供易控客户端应用程序,用C#写三十九..
动态负载平衡技术K-平均聚类技术高效化和累进化42号..使用此技术,主系统向奴隶系统分配相同大小子数据集32码..K-平均并行K-平均聚类算法广知研究领域多研究简单K-平均并行K-平均算法单个化介绍不同的算法,这些算法在讨论中讨论第2节并没有明确概念或建议使用K-平均并行K-平均算法可进一步用于与其用法相关的任何领域集群分类最常用数据挖掘技巧从大数据集检索数据分类被称为监督学习现象,而集群为不受监督学习现象上头K-平均集群算法测试并比对并行K-平均聚类算法两种数据集一万元和五千元这两组数据一万和五千整数可能表示两科一万分和五千雇员两个月内出勤率
3级研究方法
图一号图形表示两种方法,即集群和分类
集群技术划分为四大基本类,图中显示2.
所讨论,并不清楚K-平均并行K-平均算法中哪位最优,在哪个领域和情况中应使用特定技术为了克服这些问题,研究实施并分析两个简单K-平均并行K-平均聚类以辨别性能属性和聚类质量泛泛应用目的为K-平均聚类算法评价测试并比对并行K-双类数据集平均10,000和5000项这两组数据一万和五千整数表示两科一万分和五千雇员两个月内出勤率本章详细讨论本简单研究方法K-平均并行K-平均聚类图3总体方法说明如下研究应用并分析简单并行技术组合质量和迭代数这两个不同参数分别测试和分析整型数据组10000和5000,显示集群质量提高和性能这项工作克服随机选择初始小机器人问题K-平均聚类
研究工具分析简单并行K-平均算法区分性能属性和总体集群质量目的为K-平均聚类算法测试并比对并行法K-平均聚类算法 两类数据集 10,000和5000数据项这两组数据一万和五千整数可能表示两科一万分和五千雇员两个月内出勤率表格显示这些学生通过两种技术在两个不同科目中典型表示一号上表显示雇员出勤2.
两种算法输入输出可按下文说明使用
来k表示分组数取自学生和雇员分数,分两个不同科目和数月台北市表示两套数据集包含10 000名学生和5000名雇员,而一套数据集则包含5 000名雇员k集群输出简单并行算法逐项应用UML标准符号(统一建模语言)用于构建基础流程图K-平均聚类算法实验结果都K-平均和并行算法评估分析这两种集群算法的不同这两种算法都使用Neat豆综合开发环境使用JAVA和C++platform操作不同迭代特定时间和特定数据范围简单化K-平均聚类算法取 "k初始子机随机第二步,欧几里得距离函数用于计算croid和数据项之间的距离
异距离函数引用24码,50码..数据项均移到空间较少的集群以这种方式组成初始集群并计算出每个集群的算术平均值距离算术平均值小数据项放入该类集数据点移到理想集群进程持续到数据点不从一个集群移到另一个集群改善并创建集群时停止提供迭代数完成集群成功化,即集群稳定化
3.1.算法简单步K-平均聚类算法
3.1.1流程简单图K-平均算法
UML标准表示法组成简单流程图K-平均算法图5显示简单流程图K-平均算法
3.2并行K-平均聚类算法
最关键问题简单K-平均聚类算法为空间处理速度需求,当数据集大时解决这些问题简单K-平均聚类算法并行化
3.2.1并行阶梯K-平均算法
三大步简单并行K-平均值分区化计算编译
第一步服务器端子数据集从给定数据集生成连接服务器的所有客户系统都接收子数据集并存集群数,即k和初始croid客户系统计算集群并转发结果服务器进程持续到集群不变Server活动分区数据集并随机选择初始小机器人C=C一号+C2+.N级发送初始croidsC=C1+C2+.从所有客户接收集群和机器人重算环形客户活动接收kCl+C2+计算距离所有croid移动数据项到适当的集群向服务器发送集群元素
3.2.2.2并行流程图K-平均聚类算法
上文描述的步骤显示图流程图6.UML标准表示法用于构建流程图
3cm3简单化K-平均实现
3.3.1初始中心计算
简单化K-平均聚类算法取决于初始小行星选择如果不同的数据项在同一数据集的不同运行中选择,则在每次运行中都发现不同结果。要克服这一问题,初始近似值按下列步骤计算:
3.3.2.初始集群
查找初始集群,全数据集分治k子数据集数使用 中位N级表示给定数据集中数据项总数,数据集分组和数据集k表示集群总数
底层值N级/k取并行技术,因为所有子数据集都相同数数据项,如果留任数据项,则置入上组
33.3.初始中心
获取初始类集后,初始子机计算
3.3.4距离计算
初始偏差和每个数据项之间的距离由欧几里得距离方程计算: 去哪儿C级一初初百分位值一≤k高山市k数集群)D级一数据项一≤N级中位N级表示数据集中数据项总数
3.3.5数据项分配适配集群
所有数据项和初始近似值之间的距离比较最小距离数据项从初始机器人分配到特定集群最小距离计算公式如下: 中位一变量和N级表示数据项数
相似或最接近数据项放入同一组
3.3.6.进程终止
算出集群的算法均值与前平均值(centroid)比较如果两种方法都相同(centroid值),进程将终止反之,它会持续到发现相同的子机(均值)
3.4.并行K-平均算法实现
基础K-平均聚类算法需要最大空间和处理速度大数据集换句话说K-平均值并行化上头K-平均算法随机选择初始近似简单问题K-均值算法还存在于简单并行K-平均聚类算法并行算法并行化解决上述问题客户端服务器结构设计高效并行K-平均聚类算法
3.4.1任务Sever系统
服务器或主系统的主要任务如下:分区数据面向所有客户系统客户端N级)分区数据计算初始小机器人C级=C级一号+C级2+.C级N级发送初始croidsC级=C级一号+C级2+.C级N级面向所有系统从所有连接系统接收集群和机器人
3.4.2.客户系统任务
客户系统的主要任务如下:接收k,初始小机器人C级=C级1+C级2+.C级服务器系统n和子数据集计算距离所有croid移动数据项到适当的集群集群元素发回主系统
3.5并行阶梯K-平均算法
下方为并行主步骤K-平均算法
3.5.1数据分割客户系统
并行第一步K-平均聚类算法是将输入数据集划分为所有客户系统子数据集数据集划分为X级子数据集数求全X级数个客户系统连接服务器系统值.X级计算成 中位N级表示给定数据集中数据项总数X级客户系统总数连接服务器系统
3.5.2.初始中心计算
初始子机分两步计算查找初始集群使用方程组成一号)使用方程计算初始极分解法2)和(b)3)
初始中值=初始集群等算法等2)
初始集群算法平均值=+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++3)
3.5.3距离计算客户系统
子数据集和初始机器人发送到所有客户只有一个子数据集发送到客户端距离使用方程计算4)
3.5.4.客户端系统集群
数据项与初始近似值之间的距离比较数据项最接近croid值分配到该集群数据项以这种方式放入适当的集群
3.5.5服务器系统编译客户系统结果并终止
由所有客户系统组成集群后发送服务器系统服务器端所有集群编译计算编译集群的算法方式新计算算法方法比前算法方法新方式值等同前方法值时进程即告终止反之,它会继续
3.6.时间复杂性K-平均算法
K-平均算法分两个阶段第一阶段计算初始集群,将数据集划分为 "k等分计算算法平均值时间复杂性分治数据集k等分查找算法表示ON级)时间复杂性为ON级)第二阶段并行K-平均聚类算法 数据项分配到适当的聚类本阶段取O(nkt)去哪儿N级数据项数k数集群t级表示迭代数整体时间复杂性K-平均聚类算法最大ON级和O(nkt)即ON级+O(nkt),总体时间复杂性为O(nkt),因为我们忽略无序标识中最小顺序和恒定值
4级结果与讨论
两种算法都测试并比较数据集10,000和5000整数数据项两种算法实验结果都令人满意并克服简单问题K-平均聚类算法简单比较K-平均并行K-平均算法从迭代数、过期时间和集群质量分解下节讨论简单并行算法对比的详细实际结果简单比较K-平均并行K-平均算法从迭代数、过期时间和集群质量分解
4.1.迭代数
异数集群K级性能简单K-平均并行K-平均聚类算法显示于下表和图表23表示迭代K级=3
表内3简单化K-平均算法并行K-平均程序比较相同数据集K级3组数单运行数据集相同,即输入数据点数观察并感知 简单K-Mean算法中每次迭代数不同迭代数相同(固定)K-平均算法,因为初始小机器人不随机选择图表3图中表示7.
并行复用数固定K-平均算法3k=3,但在简单例子中从一转换二K-平均聚类算法表24显示迭代K级=4
表24显示并行迭代数K-平均聚类算法小于简单迭代数K-平均聚类算法k=4图表4图中表示8.
表25显示迭代K级=4
表25显示并行迭代数K-平均聚类算法固定化小于简单迭代数K-平均聚类算法k=5图表5图中表示九九.
表26显示迭代K级=6
表26显示固定并减并行简单迭代数K-平均聚类算法k=6图表6图中表示10.
表27显示迭代K级=7
4.2折叠时间
异数集群K级简单并行集群算法的过期时间显示于下表和图中屏幕截图见附录表28显示过期时间K级=3
表内8简单并行集群算法比较K级=3逐次运行并发时间K-平均聚类算法小于简单时间K-平均聚类算法图表8图中表示12.
折叠并行时间K-平均算法小于简单时间K-平均算法不同运行或执行表2九九显示过期时间K级=4
表2九九显示并行简单时间K-平均聚类算法k=4图表九九图中表示13.
表210显示过期时间K级=5
表210显示并行集群算法和简单比较K-平均算法k=5过期时间图表10图中表示14.
表211显示过期时间K级=6
表211显示并行和简单时间相似性K-平均算法k=6图表11图中表示15.
表212显示过期时间K级=7
4.3集群质量
简单比较K-平均并行K-平均算法集群质量下文讨论表213表示简单集群质量K-平均聚类k=3
表内13显示同一数据集的不同结果 10,000数据项在不同运行或执行中显示图表13图中表示17.
表214表示集群质量并行K-平均聚类k=3
表内14显示相同数据集的相同结果 10,000数据项在不同运行或执行中显示图表14图中表示18号.
4.4.4简单并行比较K-平均算法
简单并行K-Mean算法迭代数和时间比较
4.4.1.迭代数
不同数组表显示简单K-Mean和并行K-Mean算法性能15.
表215显示异型k数集群数并行迭代少K-平均算法比简单K-平均算法图表15图中表示19号.
4.4.2.折叠时间
折叠时间简单K-平均并行K-平均算法k=2表显示16.
表216显示数据集10,000项分解成10个客户系统子数据集集群分2迭代组成(表内提及所有客户系统迭代时间折叠)。第一次迭代客户5时间最长,即8ms,第二次迭代时间最长为6ms,客户系统总延时12ms并行K-平均聚类算法表217显示简单时间K-平均值k=2
本节详细描述结果和详细讨论拟议研究实验设计证明并行算法显示简单化大有改进K-平均算法并行算法结果不变,简单算法结果不变K-平均算法为每次运行或执行提供不同结果并发算法总迭代时间提高下一节总结已完成的研究工作并显示未来研究方向
5级结业和未来工作
现有技术的主要问题是相同数据的不同结果在这次研究中,简单集群技术与并行集群技术都得到实施和分析,以指出最佳特征。并行K-平均算法解决简单算法问题,并行算法结果总是相同的,提高集群质量、迭代数和时间流逝同时,对不同的运行或执行,简单结果K-均值不同, 迭代数在每次运行或执行时也不同实验设计证明并行算法显示简单化大有改进K-平均算法并行算法结果不变,简单算法结果不变K-平均算法为每次运行或执行提供不同结果并发算法中迭代数和延时数提高实验设计证明并行算法显示简单算法大有改进未来研究中可扩展研究的其他一些领域如Bellow
a方法K-中值聚类应开发,对数据的不同性质有效举例说,方法应更好地处理绝对数据类型选择k数集群是一个开放研究区并行算法只是为了减少过期时间和迭代数,并开发过期时间质量增强框架内集群数应供用户输入可扩展其他增强算法选择组数k并行算法只为整数数据类型工作测试,数据类型也可以扩展至文本类型数据,如英语词类数据数据集包含不同词组和所有词组分组时,同字组或组组相同可使用增强式搜索引擎K-平均聚类算法查找文档中某些词
数据可用性
未使用数据支持此项研究
利益冲突
作者声明无利益冲突
感知感知
这项研究由海龙江知识产权局2019年大学专利开发项目资助