手动调整慢，随机搜索浪费资源深层思维异步优化算法PBT解决神经网络痛点

作者： 1 来源：朗创seo公司发布日期： 2018-09-27 11:01:29

信息摘要：

雷锋。公共荣誉：雷锋。com)Press：在Go和ATA游戏、图像识别和语言翻译等领域，神经网络已经取得了巨大的成功。然而，人们常常忽视，神经网络在这些具体应用中的成功往往取决于在

雷锋。公共荣誉：雷锋。com)Press：在Go和ATA游戏、图像识别和语言翻译等领域，神经网络已经取得了巨大的成功。然而，人们常常忽视，神经网络在这些具体应用中的成功往往取决于在开始时所做的一系列选择。研究，包括使用什么类型的网络，用于训练的数据和方法等。目前，这些选择（也称为超参数）是通过经验、随机或计算密集的搜索过程选择的。如何选择参数和调整参数往往是关键。神经网络训练中的问题

     雷锋在更近的一篇名为基于人口的培训的深度思考论文中发现，这种技术可以同时训练和优化一系列网络，从而可以快速找到更佳设置。作为传统的技术，并且易于集成到现有的机器学习流水线中。

     这种技术是两种更常用的超参数优化方法：随机搜索和人工调试相结合。在随机搜索中同时训练一组神经网络，并在训练结束时选择更优性能模型。只有少数群体会获得良好的参数化训练，但较多的群体训练效果不理想，浪费了计算机资源。

     超参数的随机搜索意味着多个超参数同时且独立地训练。一些超参数会使模型运行良好，但大多数模型不会。

     如果使用手动调整超参数，研究人员必须猜测更佳超参数，使用它们来训练模型和评估性能，并且这个过程将继续重复，直到研究人员对网络的性能满意为止。为了获得更好的性能，缺点是需要很长的时间，有时是几周甚至几个月，才能找到完美的设置。虽然有贝叶斯优化等自动化方法，但是要找到更好的超参数仍然需要很长的时间和大量的连续训练。

     像随机搜索一样，PBT首先并行训练多个神经网络和随机超参数，但是每个网络不是独立训练的。该算法受遗传算法的启发，每个组成员被称为工作者，能够利用其他组成员的信息，如复制模型p。从另一个工人表现出更好的表现。此外，它可以通过随机改变当前值来探索新的超参数。

     随着神经网络组训练的不断深入，这种开发和探索的过程将定期进行，以确保所有组的工人都具有良好的基本性能水平，并在此基础上探索新的超参数。y利用好的超参数，为更有效的模型提供更多的训练时间，并在整个训练过程中调整超参数的值，从而自动学习更佳配置。

     实验表明PBT在所有任务和领域中都是非常有效的。Deepmind使用DeepMind实验室、Atari和StarCraft II中的更新方法来严格测试一组具有挑战性的强化学习问题。在所有情况下，PBT稳定的训练方法可以快速找到良好的超参数，并获得超出更新基线的结果。

     此外，PBT还改进了训练生成GAN。在深心测试中，使用PBT框架使初始得分更大化，结果从6.45显著提高到6.9。

     Deepmind还将PBT应用于Google更先进的机器翻译神经网络之一。这些神经网络通常用精心设计的超参数调度进行训练，通常需要几个月的时间来改进。在没有任何调整的情况下，VE超过现有性能，通常只需要一次培训。

     这幅图显示了在训练CPSAR-10和闭合网络（FuN）游戏过程中使用GAN对付Pacman女士的人口进化过程，粉色点代表初始代理，蓝色是更终代理。

     深知该技术还有很大的扩展空间，PBT对于训练引入新的超参数的新算法和神经网络结构特别有效。随着这一过程的不断完善，PBT有望更好地用于寻找和开发更复杂和强大的神经网络模型。

手动调整慢，随机搜索浪费资源深层思维异步优化算法PBT解决神经网络痛点

新闻资讯

营销型网站

公司新闻

行业资讯

常见问题

案例分享

在线留言

联系朗创

关注朗创网络