TY - Jour A2 - Fraguela,Basilio B. Au - Lee,Kyong-Ha Au - Kang,Woo Lam Au - Suh,Young-Kyoon Py - 2018 Da - 2018/12/02 TI - 提高Hadoop中的I / O效率 -基于大量数据分析程序SP - 2682085 VL - 2018年AB - Apache Hadoop是大数据时代的流行并行处理工具。虽然从业者已经重写了许多传统的分析算法,以使他们定制到Hadoop,基于Hadoop的计划中的低效I / O问题已经在文献中一再报告。在本文中,我们通过介绍Hadoop的有效修改,解决了基于Hadoop的大规模数据分析的I / O低效问题。我们首先将柱状数据布局合并到传统的Hadoop框架中,而无需任何修改Hadoop内部。我们还提供具有索引能力的Hadoop,以节省大量的I / O,同时不仅可以选择谓词,而且还可以在许多分析任务中使用的恒星加入查询。SN - 1058-9244 UR - https://doi.org/10.1155/2018/2682085 do - 10.1155 / 2018/2682085 jf - 科学编程pb - hindawi kw - er -