阿里巴巴将于月底逐步开放文字生成图像产品“通义万相”

PA一线｜2023-04-12 16:31

PANews 4月12日消息，在今日举行的Web3香港嘉年华峰会上，阿里巴巴达摩院基础视觉团队总监赵德丽表示，我们的路线图在Text-to-Image方面先后经历过Foundation Models（Composer 1.0）、Customized Generation与Controllable Generation（Composer 2.0）三个阶段，今年已发布ControlNet、Composer 2.0以及T2I-Adapter。我们的模型有两个创新，分别为视觉数据的使用方式和算法架构的创新。Composer 2.0的可控生成模型加入可控条件，通过对条件的控制达到图像生成和编辑的结果，只要能想象到，都能生成为现实的模型，可以容易地生成与包括NFT在内的原始图像整体语义相似但完全不一样的图像。基于阿里云我们构建了一个“通义万相”产品，将于月底开放给大家。