研究表明,AI系统可以更好地控制图像合成和布局
研究表明,AI系统可以更好地控制图像合成和布局
一种新的AI 系统可以创建图像以适用于自主机器人和 AI 训练。该方法建立在条件图像生成技术(或 AI 任务)的基础上,让用户可以更好地控制生成的图像和布局。
这项新技术由北卡罗来纳州立大学 (NC State) 的研究人员开发,专门训练 AI 系统控制一系列显示运动或其他变化的图片中的某些图像特征。
在条件图像生成中,人工智能系统被训练来创建满足一组特定条件的图像,例如,系统可以被训练来创建猫或狗的原始图像,这取决于用户请求的动物。这项技术的进步允许对 AI 系统进行训练,以满足指定图像布局的条件,例如,应该在屏幕上放置树图像的位置。
在新工作中,NC State 团队进一步采用了这些技术,让用户可以通过可重构的结构化输入控制图像合成。
与以前的方法一样,新方法允许用户让系统根据一组特定条件生成图像。例如,用户可以让人工智能创建一个山景。然后,用户可以让系统将滑雪者添加到该场景中,这种方法是高度可重构的。
新的 AI 方法使系统能够创建和保留背景图像,同时还可以创建从图片到图片一致但显示变化或运动的图形。
NC State 技术允许用户训练 AI 系统来操纵特定的图像特征,以便图像即使移动或以其他方式发生变化也能保持其身份。例如,人工智能系统可以创建一系列图像,显示相同的滑雪者在穿越景观时转向观众。
研究人员为布局到蒙版到图像的任务创建了一个模型,并模拟了 AI 系统如何根据输入布局和对象样式代码以弱监督方式学习展开对象蒙版。
研究人员创建了一种基于生成对抗网络 (GAN) 的布局到掩码到图像合成方法。该方法允许在图像和对象级别进行布局和样式控制。研究人员引入了一种实例敏感和布局感知归一化 (ISLA-Norm) 方案,以确保可控性。
该团队使用 COCO-stuff 数据集和视觉基因组数据集测试了其新方法。基于图像质量的标准测量,新方法优于以前的图像创建技术。尽管研究人员需要一个 4-GPU 工作站来训练 AI 系统,但他们表示部署该系统的计算成本较低。
研究人员说,该方法的一个应用可能是帮助自主机器人在开始分配的任务之前“想象”最终结果可能是什么样子。还可以使用该系统为 AI 训练生成图像。因此,您可以使用该系统来创建用于训练其他 AI 系统的图像,而不是从外部来源编译图像。
接下来,研究人员计划扩展他们的方法以适用于视频和 3D 图像。
上一篇:人工智能革新专业服务的三种方式
下一篇:AI在数控加工领域如何发挥应用