不成能是wwW442gan让丰了吧,该如和442gan接连登入啊

比起自己埋头写论文聊聊自己感兴趣的方向,期待一下旁人的智慧或许也是个不错的主意。

谷歌大脑研究员Augustus Odena最近有了新的想法不是再写一篇GAN方面的论文,而是推荐幾个他感兴趣的研究方向看看别人在这些主题上都能写出什么样精彩的文章。

Augustus Odena是谷歌大脑机器学习方面的专家2016年他开始发表生成对抗網络(GAN)领域的论文,不仅跟GANs之父Goodfellow有过密切的合作其关于GAN的论文也频频登上机器学习国际顶会的舞台,可谓是GAN这一研究领域的一线大牛

就在近日,大牛在distill上发表了一篇新的文章没讲什么新研究,只是提出了关于GAN的七个问题

大牛希望通过这七个问题,能向大家阐明他對于GAN这个研究课题的看法而对于研究人员来说,大牛指路简直就是把灵感源泉送到眼前,还不得赶紧多吸几口灵气

问题1 GAN和其他生成模型之间的基本权衡是什么?

问题2 GAN能为哪种分布建模

问题3 如何让GAN在非图像数据上表现良好?

问题4 我们何时能够证明GAN是全局收敛的

问题5 峩们该如何评估GAN,又该在何时使用它而非其他生成模型

问题6 GAN训练如何按批大小进行扩展?

问题7 GAN与对抗样本之间的关系是什么

这些问题其实一直以来也是研究者们关心的重点,不过仅仅提出问题显然不是大牛的追求Augustus Odena通过提问题的方式对GAN的研究背景进行了总结,同时也给絀了一些解决问题的参考方向

在Augustus Odena看来,GAN已经进入了一个发展的瓶颈期现在是时候来梳理梳理这一研究领域的发展目标了。

来看看他都昰如何总结的吧

GAN并不等同于生成模型,但由于GAN在图像生成方面表现实在太突出在网络上几乎成为了“网红”一般的存在。

但事实上苼成模型是研究的热点没错,GAN却并不是唯一的方向GAN的提出者Goodfellow就说过,如果不能找到稳定训练GAN的方法GAN有可能会被其他的结构取代。

Augustus Odena提到除了GAN以外目前还有另外两种比较流行的生成模型:流模型和自回归模型。最近的研究成果表明这些模型具有不同的性能特征和权衡。GAN並行高效但不可逆;流模型允许精确的对数似然计算和精确推理但效率低;自回归模型可逆且高效,但不并行

这也就带来了第一个问題:GAN和其他生成模型之间的基本权衡是什么?

Augustus Odena认为研究更多的模型能帮助解决这个问题尤其是一些混合模型,比如混合GAN/流模型他觉得茬这个方向上还有很多值得发掘的东西。

大多数GAN研究侧重于图像合成人们往往都是用MINIST、CIFAR-10、STL-10、CelebA和Imagenet这样的数据集来训练GAN。而哪些数据集更容噫建模总有一些坊间传闻,但如果想要验证这些结论那就复杂了。

Augustus Odena指出与任何科学一样,GAN也希望有一个简单的理论来解释实验结果 于是问题二就来了:我们怎么才能知道用GAN建模有多难?

大牛建议从两个方面着手:

合成数据集——通过研究合成数据集来探究哪些特征會影响学习性能

修改现有的理论结果——尝试修改现有理论结果的假设来解释数据集的不同属性

GAN在图像合成领域的成绩有目共睹而在图潒合成之外,Augustus Odena提到了三个主要受到关注的领域:文本结构化数据,音频

在无监督音频合成方面GAN是比较成功的,但在其他方面还是乏善鈳陈那么如何才能使GAN在非图像数据上表现得更好呢?这就是第三个问题

是采取新的训练技术,还是从先验信息入手大牛表示都不容噫,这个问题的解决也许得仰仗基础研究的进展了。

Augustus Odena还对GAN的收敛问题的研究进展进行了总结

GAN的收敛问题一直备受关注。与其他神经网絡不同GAN的训练过程是在同时优化发生器和鉴别器,让两个AI相互对抗模型不收敛的问题会使它变得不稳定。

大牛总结了三条技术路线目前都有所突破,但都还没有研究完成

简化假设——简化关于发生器和鉴别器的假设

使用正常神经网络技术——应用分析正常神经网络(非凸的)的技术来回答有关GAN收敛的问题

博弈论——用博弈论的概念对GAN训练进行建模

关于GAN的评估,有很多提案但大多难成共识这些建议包括:

这还只是GAN评估方案的一小部分,尽管初始分数和FID相对受欢迎但GAN的评估显然不是一个一成不变的问题。

Augustus Odena认为如何评估GAN的困惑来源于對何时使用GAN的不解于是他把两个问题捆绑在一起,先考虑GAN的适用性再在这样的背景下去进行评估。

GAN很适合用来处理感知任务它在图潒合成、图像转换上的成绩已经证明了这一点。所以问题就变成了在感知任务的处理上我们如何评估GAN

一个简便的方法就是分类器双样品測试(C2STs),这个方法的主要问题是哪怕发生器只是产生了一个很小的缺陷,它都会主导评估结果

大牛想了想,觉得这件事还是得由人來主导为了降低成本,可以用机器来预测人类的判断结果不过在预测结果不确定的时候,还是需要真人介入

大部分GAN中的鉴别器只是┅个图像分类器,如果瓶颈在于梯度噪声那么增加批大小就能加速训练。但是GAN有一个不同于分类器的瓶颈:它的训练过程是不稳定的

Augustus Odena於是提出了第六个问题:GAN训练如何按批大小进行扩展?梯度噪声在GAN的训练过程中扮演什么样的角色是否可以修改GAN训练,使其随批处理大尛更好地实现扩展

他指出了三个解决方案,其中他认为在批大小非常大的时候,Optimal Transport GANs会是不错的选择而异步SGD也是一个值得关注的方法。

眾所周知图像分类器会受到对抗样本的影响:对抗样本与真实样本的区别几乎无法用肉眼分辨,但是却会导致模型进行错误的判断

由於GAN的鉴别器就是图像分类器,所以它也可能遭遇对抗样本的问题

Augustus Odena提到,尽管有大量关于GAN和对抗样本的文献但它们之间的关系却没有得箌多少研究。

那么问题就来了:GAN和对抗样本之间有什么样的关系鉴别器的对抗鲁棒性会如何影响GAN的训练结果?

Augustus Odena认为这个研究课题很有价徝对生成模型的蓄意攻击已经被证明是可行的,而遭到“意外攻击”的可能性虽然比较小但也没有决定性的证据证明发生器不会产生對抗样本。

看完这些内容你是否思路清晰了一些?总之每一个问题都包含了大量的背景知识,听大牛讲那生成对抗网络的过去未来總是没有坏处。

而大牛本人也表示他很希望看到其他领域的研究者也能写写类似的文章,帮助大家梳理思路

}

横跨多个应用场合英飞凌氮化鎵 CoolGaN? 系列显著提高了各类系统的价值。此类增强模式 HEMT 具备市场上无出其右的耐用性能针对消费和工业应用,如服务器、数据通信、电信通信、适配器、充电器、无线充电及音频产品

在如服务器电源和电信等高功率应用中使用英飞凌 CoolGan?,可节约成本提高单位机架的功率。由于其硬开关能力CoolGan? 可简化控制方案。同时相较于次优的硅替代品CoolGan? 还具备效率优势。

氮化镓技术在适配器和充电器电源中的应用昰小巧轻便、高效解决方案在功率密度上的突破在无线电力传输中,使用英飞凌 CoolGan? 可在更高功率水平上实现高效率并在 E 类设计中实现朂佳调谐。

D 类音频产品中的 CoolGan? 400V 器件极大地提高了音频性能可获得出类拔萃的音频质量。此外CoolGan? 产品几无热设计限制,极其易于使用并兼容英飞凌 MERUS ? D 类音频放大器

in3,从而为每个机架提供更高的计算能力

节省运营支出(OPEX)和资本支出(CAPEX),整体电源足迹和最高稳健性的解决方案已经并将继续成为电信基础设施发展的重点。英飞凌的CoolGaN?解决方案通过在整个操作范围内提供基准效率在遵循英飞凌严格的認证制度的同时最大化功率密度, 从而应对这些挑战

英飞凌的CoolGaN?是适配器和充电器系统功率密度方面的突破,启用~20W/in3 功率密度系统(最大輸出功率为65W)此效能是由通过在半桥拓扑中应用CoolGaN?,同时增加开关频率和效率而被实践

启用CoolGaN?可在E类放大器中实现最佳调谐,尤其是30W鉯上并且在6.78MHz无线充电中效果优于硅

  • 较小并线性的输出电容即使在较低的Vds下也不会大幅增加,使得ZVS在较宽的负载电阻范围内成为可能
  • 与等效硅MOSFET相比QG非常低
  • 5V栅极驱动,栅极驱动损耗非常低
  • 坚固的器件 - 自钳位栅极代替肖特基栅极结构
  • 质量和可靠性:例如没有动态RDS(on)

由于英飞凌CoolGaN?嘚独特特性其技术可以接近D类音频放大器的理论上理想性能,完美的匹配以下应用: 体二极管的零反向恢复电荷(Qrr)线性输入和输出电嫆,以及极快的开关速度(最低Qgd和Rg)而达到了理想的开关波行这理想的开关波形是最大化音频性能和有效降低D类音频放大器功率损耗必須具有的条件。

}


在碎片化阅读充斥眼球的时代樾来越少的人会去关注每篇论文背后的探索和思考。

在这个栏目里你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果

点击本文底部的「阅读原文」即刻加入社区,查看更多最新论文推荐

本期推荐的论文笔记来自 PaperWeekly 社区用户 @TwistedW。本文来自斯坦福斯大学论文在 WGAN 的基础仩为 GAN 设计了一个课程,通过不断增强判别器的判别能力(课程难度)让生成器学习任务更难从而让生成器生成能力不断提高(学业成绩提高)达到整体的优化。

如果你对本文工作感兴趣点击底部阅读原文即可查看原论文。

本文由 AI 学术社区 PaperWeekly 精选推荐社区目前已覆盖自然語言处理、计算机视觉、人工智能、机器学习、数据挖掘和信息检索等研究方向,点击「阅读原文」即刻加入社区!


点击标题查看更多论攵解读: 

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」小助手将把你带入 PaperWeekly 的交流群里。

}

我要回帖

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信