TY - JOUR A2 - Ayadi, Wassim AU - Jwo, Jung-Sing AU - Lin, Ching-Sheng AU - Lee, cheng - xiong AU - Lo,先前的研究表明,训练一个用于排序问题的强化模型需要很长的时间,即使是对小数据集。为了研究迁移学习能否改善强化学习的训练过程,我们将Q-learning作为强化学习算法的基础,将排序问题作为案例研究,并从时间花费和脑容量两个方面对其性能进行评估。我们比较了非迁移和迁移方法之间的训练步骤总数,以研究效率和评估它们在脑容量方面的差异(即更新的q值在q表中的百分比)。根据我们的实验结果,当待排序数的大小增加时,总的训练步数的差异会变小。我们的研究结果还表明,当迁移强化学习和非迁移强化学习达到相似的训练水平时,它们的大脑容量是相似的。SN - 1687-5265 UR - https://doi.org/10.1155/2020/8873057 DO - 10.1155/2020/8873057