🤗关注公众号 funNLPer 快乐白嫖🤗
论文:GLIGEN: Open-Set Grounded Text-to-Image Generation
代码:gligen/GLIGEN
项目地址:GLIGEN
demo地址:gligen demo
文章目录
- 1. 动机
- 2. 模型结构及原理
-
- 2.1 输入处理
-
- 2.1.1 Caption Tokens
- 2.1.2 Grounding Tokens
- 2.2 Gated Self-Attention
- 2.3 损失函数