AI大模型:majicmixRealistic_v7 - 知乎(https://zhuanlan.zhihu.com/p/691493776)
SD是不是很糊:一文搞懂Stable Diffusion的各种模型及用户操作界面 - 知乎(https://zhuanlan.zhihu.com/p/671895456)
AI大模型:majicmixRealistic_v7 - 知乎:https://zhuanlan.zhihu.com/p/691493776
【AI绘画神器】探索Stable Diffusion、Midjourney与DALL-E 3:让创意无限飞扬! - 知乎(https://zhuanlan.zhihu.com/p/669649442)
模型介绍
majicMIX realistic:专门用于生成唯美的人像图片,目前已更新至第七版。融合了多种模型,能够生成具有吸引力的面部特征,并能有效地处理暗部细节。
ChilloutMix:专为生成逼真的亚洲人物形象而设计。与majicMIX realistic类似,ChilloutMix在生成高质量人物图像方面表现出色。
AnythingElse V4:主要生成高质量的二次元和动漫图像。虽然它的风格相对较为单一,但在动漫领域表现出色。
GuoFeng3:主要用于生成具有中国华丽古风风格的图像。它在古风游戏角色和场景生成方面具有优势。
RongHua:这是另一个国风系列模型,专注于生成具有中国特色的服装、道具和化妆元素。它在国风创作领域具有较高的评价。
Dreamlike-photoreal-2.0:用于生成逼真的场景和物品。它在生成高质量的现实世界图像方面具有优势。
模型格式介绍
通常看到的就两种:safetensors和ckpt,此外还有.pt 或 .pth。
1、safetensors是一种模型文件格式,这种格式是专门为Stable Diffusion模型设计的,具有较小的文件体积和较快的加载速度。safetensors文件只包含模型的权重,而不包含优化器状态或其他信息,通常用于模型的最终版本,当我们只关心模型的性能,而不需要了解训练过程中的详细信息时,这种格式是一个很好的选择。
2、.ckpt:这是一种Checkpoint(检查点)格式的模型文件,用于保存模型的权重和优化器的状态。这种文件格式在训练过程中生成,可以用来恢复训练或调整模型。ckpt模型文件通常较大,因为它们包含了训练过程中的中间状态。
3、.pt 或 .pth:这些文件格式通常用于PyTorch模型,其中.pt表示PyTorch张量(Tensor),而.pth表示PyTorch模型参数。这些文件包含了模型的权重和结构信息,但不包含优化器状态。
在选择模型的存储格式时,需要根据使用场景来决定。例如,如果你需要进行模型微调,或者需要在训练过程中获得详细的信息,Checkpoint格式(.ckpt)可能是更好的选择。而对于那些仅需要快速加载和执行模型的场景,safetensors可能是更好的选择。
LCM模型介绍
Latent Consistency Models(潜一致性模型)是一个以生成速度为主要亮点的图像生成架构。和需要多步迭代传统的扩散模型(如Stable Diffusion)不同,LCM仅用1 - 4步即可达到传统模型30步左右的效果。由清华大学交叉信息研究院研究生骆思勉和谭亦钦发明,LCM将文生图生成速度提升了5-10倍。(其刚出来,就被上文提到的SDXL Turbo直接碾压,以后有机会再详细说)。
LCM的一个关键特点是它能在非常短的推理时间内生成图像,使其成为需要快速处理的应用场景中的宝贵工具。
stable-diffusion-webui
SD WebUI是一个基于Web的界面,用于运行Stable Diffusion模型。它允许用户在浏览器中输入文本提示,然后生成相应的图像。SD WebUI支持多种功能,如调整模型、图像尺寸、采样步数等。用户可以在WebUI中方便地调整这些参数,以获得满意的图像生成效果。SD WebUI的一个优点是其易于使用,用户无需安装任何额外的软件,只需在浏览器中打开WebUI页面即可开始使用。
GitHub发布页面:https://github.com/AUTOMATIC1111/stable-diffusion-webui
ComfyUI:
ComfyUI是一个功能强大的节点编辑工具,支持Stable Diffusion模型的双模型计算。与SD WebUI相比,ComfyUI提供了更多的自定义选项和灵活性。用户可以通过连接不同的节点来创建工作流,从而实现对图像生成过程的精细控制。ComfyUI支持多种插件,如ADetailer、Controlnet和AnimateDIFF等,这些插件可以进一步扩展ComfyUI的功能。值得注意的是,ComfyUI可以在MacBook Pro M1的16GB内存上运行双模型计算,这使得它在一定程度上具有竞争优势。
GitHub发布页面:https://github.com/comfyanonymous/ComfyUI
Fooocus
Fooocus:Fooocus的主要特点是简单易用,用户只需关注提示词的书写,就可以生成高质量的图片。Fooocus的作者是斯坦福大学博士生张吕敏,他对Fooocus进行了大量的优化,使得用户可以忘记所有那些困难的技术参数,只享受人与计算机之间的交互。
常用模型下载网站
- https://civitai.com/ 俗称C站,处于被墙的状态,需要科学上网
- https://huggingface.co/ 俗称抱脸,处于被墙的状态,需要科学上网,无需注册就可下载模型
- https://www.liblib.art/ 这个是国内比较火的模型网站
发表评论