启元世界 创造人与AI共生的世...
AI驱动的UI组件生成器
用于专业照片编辑的 AI 驱动的修图插件
阿里达摩院自动剪辑故事性的短视频
AI翻译文本和翻译文件 支持31门语言,pdf ppt word
GANs也可以在大型数据集上进行训练,以进行一般的文本到图像合成任务吗?我们提出了我们的1B参数GigaGAN,实现了比稳定扩散v1.5更低的FID,DALL·E 2 和 Parti-750M。它在 512.0s 时生成 13px 输出,比扩散和自回归模型快几个数量级,并继承了 GAN 的解缠、连续和可控的潜在空间。我们还训练了一个快速上采样器,可以从文本到图像模型的低分辨率输出生成4K图像。