Google AI公司发布了一篇关于名为Muse的新技术的研究论文。Muse是一种文本到图像生成技术,能够快速生成与竞争对手相媲美的高质量照片。 Muse被训练成使用已经训练过的大型语言模型的文本嵌入来预测随机蒙版图像令牌。 Muse使用了一个9亿参数的模型,称为蒙版生成变换器来创建视觉效果。 Google声称,使用TPUv4芯片,可以在0.5秒内创建256x256的图像,而使用Imagen的扩散模型需要9.1秒,他们称这种模型提供了"照片级真实度的前所未有程度"和"深度语言理解"。