新闻首页 / 标签为“GAN”的新闻

0

图像生成王者不是GAN?扩散模型最近有点火,效果直达SOTA

博雯发自凹非寺 量子位报道公众号 QbitAI OpenAI 刚刚推出的年末新作 GLIDE,又让扩散模型小火了一把。 这个基于扩散模型的文本图像生成大模型参数规模更小,但生成的图像质量却更高。 于是,依旧是 OpenAI 出品,论文标题就直接号称“在图像生成上打败 GAN”的ADM-G 模型也重新
0

万物皆可JOJO:这个GAN直接让马斯克不做人啦 | Demo可玩

博雯发自凹非寺 量子位报道公众号 QbitAI 这下真的是万物皆可 JOJO 化了! 本来就神采飞扬的马斯克,下一刻更是仿佛要直接“我不做人啦!” 世界名画蒙娜丽莎神秘优雅的微笑,似乎也变得 JO 灼了起来…… 再来个同一次元的……团长你在做什么啊团长! 而上面这些效果只要打开网页 Demo,点击上
0

最新3D GAN可生成三维几何数据了!速度提升7倍 | 英伟达&斯坦福

明敏发自凹非寺 量子位报道公众号 QbitAI 2D 图片变 3D,还能给出 3D 几何数据? 英伟达和斯坦福大学联合推出的这个 GAN,真是刷新了 3D GAN 的新高度。 而且生成画质也更高,视角随便摇,面部都没有变形。 与过去传统的方法相比,它在速度上能快出7 倍,而占用的内存却不到其十六分之
2

朱俊彦团队最新论文:GAN监督学习给晃动猫狗加表情,丝滑又贴合

丰色发自凹非寺量子位报道公众号 QbitAI GAN 又被开发出一项“不正经”用途。 给猫狗加表情: 给马斯克加胡子: 不管视频中的脑袋怎么左晃右晃,这些表情都能始终如一地贴合面部,且每一帧都表现得非常丝滑。 这就是朱俊彦等人的最新研究成果: 一种利用GAN 监督学习实现的密集视觉对齐(Visual
0

GAN靠「伪造思维」登上Nature子刊:首次合成神经活动数据

博雯梦晨发自凹非寺 量子位报道公众号 QbitAI GAN 这回玩了票大的,把手伸向了“人脑思维”。 没错,直接就是一个“合成思维”——生成用来喂给脑机接口的那种大脑活动数据。 作者表示,这是 AI 首次在该领域被应用。 并且这项技术一举把训练脑机接口系统提取、分析大脑信号的时间,提高了整整20 倍
0

第一个GAN驱动的图像编辑框架!多伦多大学华人博士提出EditGAN,最注重细节的GAN模型

编辑:LRS 【新智元导读】如何能随心所欲改变图像一向是一个有挑战性的问题!以往借助 GAN 模型的图像编辑有这样那样的问题,英伟达的一个华人博士提出了一个新模型 EditGAN,第一个 GAN 驱动的图像编辑框架,对 out-of-domain 图像的效果也很好! 图像编辑(image editi
1

一键cosplay各路动漫人物!快手的这个BlendGAN火了|NeurIPS 2021

金磊发自凹非寺 量子位报道公众号 QbitAI 动漫、艺术作品里的人物,他们极具张力的形象往往给人们留下深刻的印象。 但如果说现在,你也可拥有他们的同款造型呢? 没错,依旧来自是“无所不能”的GAN。 只要把你 pick 好的形象“投喂”进去,接下来妆发的工作交给它就行了: 红的、黄的、蓝的、白的…
0

用GAN也可以P图,效果还不输PS | 英伟达出品

把人的眼睛变大、把闭着的嘴合上、转动眼珠: 质量如此逼真、一点糊图的痕迹都没出现—— 如果我不说,你知道这其实是 GAN 自己P的吗? 除了人脸,汽车啊鸟啊猫啊也都可以,比如改改车轮大小、换个车轴样式: 把小鸟的喙部变长、头抬高、胸脯变壮: 用动图展示就更炫酷了: 大点大点,圆点圆点,头发再多一点…
1

现在,用音频也能指挥GAN生成图像了

CLIP 大家都不陌生吧? 由 OpenAI 于今年 1 月份推出,能够实现文本描述与图片的精准匹配。 现在,有人“灵机一动”,从 CLIP 中学习了一种音频表示方法。 用这个方法搭配 VQGAN-CLIP,就能实现声音到图像的转变! 比如给它听 4 种不同的青蛙叫,它就能生成 4 种青蛙的照片:
0

最会造假的GAN模型,雪地里都能有骆驼!FB发布IC-GAN,迁移能力史上最强

新智元报道 来源:Facebook AI 编辑:LRS 【新智元导读】GAN 模型好是好,但就是对训练数据的要求太高,并且在场景和物体的语义组合时容易出现不合常理的生成图像,导致一眼假!最近 Facebook 发布了一个 IC-GAN 模型,迁移能力号称史上最强,能把各种场景和物体组合起来,训练集中
0

GAN如何异常检测?最新《生成式对抗网络异常检测》综述论文,概述异常检测的典型GAN模型

新智元报道 作者:专知 【新智元导读】异常检测是许多研究领域所面临的重要问题。生成对抗网络(GANs)和对抗训练过程最近被用来面对这一任务,产生了显著的结果。本文综述了主要的基于 GAN 的异常检测方法,并突出了它们的优缺点。 异常是数据中不符合正常行为的定义(Chandola et al., 20
0

LSTM之父再称ResNet、GAN等五大网络都有他的功劳,网友却说:自负大于引用数

“现在引用最多的几个神经网络都是建立在我的实验室成果之上的!” 能说出此话的不是别人,正是在深度学习领域作出了巨大贡献的 LSTM 之父——Jürgen Schmidhube。 但这也不是他第一次为“自己的开创性工作没得到足够的尊重”而公开发声。 在这篇“直抒胸臆”的推文里,他还专门链出了个博客,里
0

定「睛」一看,果然是GAN生成的!华人团队利用瞳孔形状判断「真假」人像

新智元报道 来源:arXiv 编辑:好困 【新智元导读】定「睛」一看,就能区分照片真假?近日,来自纽约州立大学的华人研究员提出了一种全新的检测方法,可以根据眼睛形状判断人像的真假。不过,前提是你能把图放得了这么大才行。 现在,利用 GAN 生成的人脸几乎真实到让「肉眼」检测都达到了瓶颈 。 比如说,
1

皮克斯技术指导辞职读博:研究AI设计怪物,从《游戏王》卡牌开始

让 AI 画人脸见得多了,要是让 AI 画个幻想中的怪物又如何? 来看几个,先是人形的: 再来个兽形的: 还有诡异到说不出来属于什么型的: 你可能会问,这很难吗? 毕竟现在用 GAN 生成人脸都能以假乱真,生成怪物只要“瞎画”就行了,又不需要像谁。 一位从皮克斯辞职又跑去读博的小哥 Vavilala
1

抖音出现大量“三岁用户”,马化腾李彦宏都被还童

金磊发自凹非寺 量子位报道公众号 QbitAI 互联网大佬们小时候,会长什么样子? 嗯,是个有趣的问题。 不妨上手试一试,先来看下马化腾。 虽然年纪变小了不少,但依旧保持着他的神貌,只是多了些婴儿肥和稚气。 接下来,是李彦宏。 嗯,是英气少年没错了! 这就是最近在抖音大火的 AI 特效——重返三岁/
0

这个AI“大师级”简笔画水平,惊艳到了网友:竟然不用GAN

来源:量子位 金磊发自凹非寺 量子位报道公众号 QbitAI AI 画的简笔画能到什么水平? 给一张美国演员 Rami Malek 的照片,效果是这样的。 是不是和原图很逼近了? 再来看下输入《老友记》合影的效果。 虽然人物众多,但出来的简笔画效果,依旧还是能分清剧中的人物。 如果毛发特别浓密的人物
0

基于GAN的“真人捏脸”已上线,照片逼真无死角:脸型、五官、表情等均可控制

来源:量子位 萧箫发自凹非寺 量子位报道公众号 QbitAI 使用 GAN 生成的 2D 人脸模型很美丽,然而却终究缺了点什么? 没错,虽然 GAN 能生成逼真的人脸,但距离自己理想的人脸,总有那么一点不完美——面部表情、脸上皱纹、发质…… 由于 GAN 没办法进行参数调控,即使人脸再逼真,也没办法
0

当专业动画师用GAN帮自己“偷懒”,几分钟就完成了几周的工作

萧箫发自凹非寺 量子位报道公众号 QbitAI 当视觉特效师与 GAN 强强联手,做出来的动画会不会更好看? 答案是 YES。 这是一位视觉特效师,用海外版抖音上超火的小姐姐 Bella Poarch 的视频,生成的奥巴马 TikTok 版动画,不仅动画效果逼真,表情生动,GAN 生成的人物也不会出
0

我为什么弃用GAN?

贾浩楠发自凹非寺 量子位报道公众号 QbitAI 输出单一、调参麻烦、损失函数不能收敛、稳定性差。 苏黎世理工大学的博士 Andreas Lugmayr 历数了各种 GAN 的“罪状”,说出了今后弃用 GAN的话。 说出“弃用”,当然是已经有了B计划。 Andreas Lugmayr 博士和他的团队
0

GaN路线之争:再起波澜

凭借高功率、高频工作环境下的优良性能,氮化镓(GaN)正在快速崛起,无论是在功率,还是射频应用领域,GaN 都代表着高功率和高性能应用场景的未来,将在很大程度上替代砷化镓(GaAs)和 LDMOS。 而在 GaN 外延片方面,主要有两种衬底技术,分别是 GaN-on-Si(硅基氮化镓)和 GaN-o

最新评论