AI芯片的快速发展也需要不断优化

作者： 1 来源：朗创seo公司发布日期： 2018-09-26 09:38:46

信息摘要：

在深层学习领域中，数据和操作是更重要的，谁的数据多，谁的计算快，谁就占优势。因此，在处理器的选择上，能够以较快的计算速度用于通用基础计算的GPU迅速成为主流。AI计算的

在深层学习领域中，数据和操作是更重要的，谁的数据多，谁的计算快，谁就占优势。因此，在处理器的选择上，能够以较快的计算速度用于通用基础计算的GPU迅速成为主流。AI计算的TRAM芯片。

     在2017年GTC技术大会上，NVIDIA公司推出了更新的GPU Volta芯片，其核心是张量核(Tensor Core)人工智能加速器，它是开发下一阶段人工智能应用的硬件保证。软件和更新AI算法有两个原因：第一，现有的AI算法不能充分利用加速器的性能，第二，在人工智能开发中取得又一突破。

     如果我们能够充分利用这种新一代的芯片，不仅会大大促进人工智能应用的发展，甚至可能产生新的人工智能应用。例如，人工智能算法可以利用芯片的高速来更好地理解和综合人类语言分析。识别系统将大大改进，音频转录将更加精确，计算机将具有能够表达语言风格和情感的语音系统。

     许多公司已经认识到人工智能的巨大潜力，并开发了强大的芯片，以获得人工智能的广泛应用。例如，由NVIDIA开发的GPU和由Google开发的TPU。

     这些芯片有一个共同点：它们都根据程序局部性原理对算法进行优化。为了获得局部的优势，需要AI芯片和AI算法相互支持。但是目前还没有更多的AI算法升级来匹配这个芯片，一般来说，目前的算法不能充分利用芯片的高速运算。

     在大规模数据集上训练大规模神经网络，可以充分展示现有并行芯片易于利用的并行性，但目前记忆检索性能的发展远远不能满足人们的需要。将面临内存墙的困境，即内存性能将严重限制芯片的性能。

     为了进入下一个阶段，人工智能芯片仍然需要努力研究本地化。本地化可以反映在对相同变量的重复引用中。例如，如果您在杂货店购物，您将购买列出10项商品的购物清单上的商品。如果你想加快搜索速度，你可以让10个朋友在列表中找到一个项目。这种方法虽然是并行驱动的，但是效率也很低，因为列表中的不同项目可以放在一起，这会导致不同的朋友可以找到相邻的项目，从而降低效率。一个更好的方法是让每个朋友去不同的通道并且只寻找那个通道。这是解决当前本地内存墙困境的方法。

     新一代的人工智能芯片需要适应具有显著局部性的算法。目前，并不是所有的人工智能算法都能够完成这一任务，因为它们没有显著的局部性。计算机视觉算法由于大量使用卷积neu而在局部性方面具有优势。但是递归神经网络在语言和语言应用中需要稍加改变（特别是优化其推理能力），以提高其局部性。

     在百度的硅谷人工智能实验室，研究人员尝试了几种方法来改进算法以挖掘本地潜力。早期的实验表明，我们很可能克服这个困难。例如，研究人员开发了RN网络，在低容量下实现了30速度的提高。虽然起步不错，但今后AI芯片的性能还有待提高，另一个研究方向是集成卷积和递归神经网络的思想，但这一方向的更优解还有待于进一步研究。

     深层学习的人工智能算法计算量有限，迄今为止的突破得益于更快的计算机的出现。然而，目前的算法已经取得了突破，并且在语音识别、机器翻译和人类语音合成方面取得了成果。现在，AI算法开发的下一阶段的硬件已经就位。早期的实验表明，我们处于下一代算法开发的前沿。预计下一代算法能够充分利用AI c的当前性能。臀部，引领我们走向其他突破。

AI芯片的快速发展也需要不断优化

新闻资讯

营销型网站

公司新闻

行业资讯

常见问题

案例分享

在线留言

联系朗创

关注朗创网络