文章 – MioMio

教程 2023 年 9 月 26 日

Stable Diffusion绘世整合版安装使用教程

一、概述本文使用秋叶大佬发布的【绘世整合包】作为软件，它是目前市面上最易于使用的整合包之一，无需对网络和Python有太多的前置知识，已经为AI绘画的普及做出了巨大贡献。绘世启动器整合包于2023年…

资讯 2024 年 1 月 6 日

Rodin Gen-1：3D原生生成模型

– Rodin Gen-1拥有1.5B参数，是目前最大的3D原生生成大模型。它的功能类似于SD（Stable Diffusion）。 – 3D-to-3D：除了传统的3D建模，…

教程 2023 年 9 月 27 日

StableDiffusion教程！用好这2个插件，小显存也能高效批量放大

一、关于教程我最近的工作中经常会用SD批量生图并且放大，所以今天打算分享一下Tiled Diffusion和Tiled VAE插件结合ControlNet进行批量放大的流程。需要提醒大家的是，这个…

资讯 2024 年 5 月 29 日

揭秘ChatTTS：高可控语音合成神器上手实录带你玩转ChatTTS！

该视频介绍了ChatTTS的核心功能，包括文本转语音、与LLM对话集成及韵律调整等。如何使用ChatTTS生成自然流畅的对话语音，并分享了调整韵律和生成多样化说话人向量的方法。 colab在线体验：h…

教程 2023 年 10 月 29 日

重磅更新！地表最强 AI 视频增强工具 Topaz Video AI v4.0.0 中文汉化版，详细使用教程

Topaz全家桶（Win系统和Mac系统），特别注意：不要直接点击下载全部（999+警告），建议是进入链接对应文件夹里边保存所需安装包进行下载。阿里云盘：https://www.aliyundriv…

教程 2023 年 10 月 22 日

AI视频去动态水印开源工具propainter整合包v2，自动生成蒙版，只需要点击即可

propainter 原项目地址 https://github.com/sczhou/ProPainter propainter 整合包第二版下载地址链接：https://pan.baidu.com…

资讯 2024 年 1 月 13 日

LEGO：一个由字节跳动和复旦大学研发的多模态理解和图像定位模型

LEGO能够处理和理解多种类型的输入，支持图像、音频和视频输入，并对这些信息进行分析和理解。模型还具备精准定位的能力。例如在图像中标识出物体的具体位置，在视频中指出特定事件发生的时间点，在音频中识别…

资讯 2024 年 1 月 3 日

M2UGen：多模态音乐理解和生成模型

该模型由腾讯与新加坡国立大学开发，M2UGen能够理解各种音乐，包括风格、演奏乐器、表达的情绪情感等，并进行音乐问答。而且还能根据文本、图像、视频和音频生成各种音乐，同时对生成的音乐也能理解并根据文…

资讯 2023 年 12 月 21 日

Text-to-CAD ：通过文本提示生成 CAD文件

只需要输入自然语言描述，它就能根据这些描述创建相应的 B-Rep CAD 文件和网格模型。生成的模型可以导入到用户选择的任何 CAD 程序中。 Text-to-CAD 背后的基础设施利用了 Zoo …

资讯 2024 年 1 月 5 日

AnyText：解决图像生成中，文字无法和图融合、变形、乱码的问题

该项目由阿里巴巴开发，AnyText支持在图像中生成和编辑多种语言的文本，使其与背景无缝融合。该模型还解决了合成文本中模糊、不可读或错误字符的问题。 AnyText可以与现有的扩散模型集成，用于准确…

教程 2023 年 10 月 22 日

Fooocus汉化中文版，10月22日2.1.724版，重大更新，中英双语启动，在线升级

Fooocus，10月22日2.1.724版本。本版本包含图生图的控制和融合，线稿上色，无损放大，内部重绘，外部扩展等等多项功能，已经比较完善了。官方重大更新对动漫和现实的高度支持，直接用启动器即…

资讯 2024 年 5 月 23 日

TRANSAGENTS：一个专门用于进行文学翻译的多智能体虚拟翻译出版公司

腾讯 AI 实验室开发出一种名为“TRANSAGENTS”的新型多智能体框架，用于超长文学内容翻译。它使用虚拟角色模拟真实的翻译公司，包含多个角色，比如高级编辑、初级编辑、翻译员等。每个角色负责不…

教程 2023 年 9 月 26 日

Stable Diffusion A卡专用整合包（DirectML）资源下载

基于 lshqqytiger 分支制作，功能与 v4.4 版本整合包相同仅经过朋友一台电脑测试，不保证完全可用，若发现无法使用请及时评论区反馈使用方法和普通整合包完全一致，首次使用打开启启动器后，…

教程 2023 年 10 月 22 日

Bert-VITS2 本地可视化懒人整合包(1017最终版)

临时Q群：875965154 ※※更新已放出 https://github.com/AnyaCoder/Bert-VITS2/tree/v1.1.1-new 1014-加入多人多语言合成 1013-加…

教程 2023 年 11 月 13 日

【ChatGLM3】最强的离线开源版ChatGPT，一键部署，解压即用

本期视频所涉及的程序： CUDA下载安装：https://developer.nvidia.com/cuda-downloads ChatGLM3 一键部署包： https://pan.baidu….

教程 2023 年 10 月 17 日

AI图片无损放大器，模糊图片秒变清晰，一键修图

【下载地址】：https://pan.quark.cn/s/9f0fec66c8b7 国外爆火出圈！极品AI图片无损放大器，模糊图片秒变清晰，一键修图

教程 2023 年 9 月 30 日

【开源发布】以太流转绘工具&新单帧脚本及使用教程 | 文生图动画教程

【视频附件】以太转绘工具包（@胡里胡涂大哥）： https://github.com/huchang47/AetherConverTools isnetpro(单帧/文生图/图生图/动态倍率脚本@…

教程 2023 年 9 月 29 日

在 SDXL 上用 T2I-Adapter 实现高效可控的文生图教程

T2I-Adapter 是一种高效的即插即用模型，其能对冻结的预训练大型文生图模型提供额外引导。T2I-Adapter 将 T2I 模型中的内部知识与外部控制信号结合起来。我们可以根据不同的情况训练各…

教程 2023 年 10 月 8 日

Stable Diffusion EasyPhoto扩展插件教程

EasyPhoto扩展地址：https://github.com/aigc-apps/sd-webui-EasyPhoto 提示词模版和插件模型下载：https://nenly.notion.site…

资讯 2024 年 6 月 5 日

MiGPT：将小爱音箱接入 ChatGPT 和豆包，改造成专属语音助手

让小爱音箱和其他米家智能设备能更好地理解和响应用户指令，并且还可以直接和智能家居联动！主要功能： 1. 小爱音箱可以使用 ChatGPT 等大模型来回答问题。 2.角色扮演：小爱音箱可快速切换角色，…

教程 2023 年 10 月 5 日

Midjourney自建私人服务器教程

Midjourney进阶教程｜私人服务器的使用与创建自建服务器首先我们点击Discord中最左侧的绿色添加服务器按钮，如下图所示：在弹出的创建服务器界面内，点击亲自创建按钮。左图中选择仅供我和…

资讯 2024 年 1 月 5 日

CoMoSVC：一种高效、高质量的歌声转换方法

它可以将一个人的歌声转换成另一个人的歌声。同时能够保持了声音的自然度和真实感。最牛P的是CoMoSVC实现了一步采样。意思是它可以在单次操作中即可完成声音的转换，大大加快了处理速度。该项目由香港大…

教程 2023 年 9 月 26 日

COMFYUI启动器发布！支持COMFYUI更新/配置/一键优化/中英切换等

专为COMFYUI使用者设计，无论是在原生WEB还是Blender中使用，均可实现稳定且高效的对COMFYUI维护升级、一键优化和参数配置等功能。遵循免费和非广告使用原则，你可以在制作视频、讲演、授课…

资讯 2024 年 5 月 29 日

ChatTTS：专门为对话场景设计的文本到语音TTS模型

这个语音专文本TTS模型应该是目前对中文支持最好的了该模型经过超过10万小时的训练，公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。专为对话任务优化，能够支持多种说话人语音…

教程 2023 年 10 月 3 日

在comfyUI中使用IP-Adapter的演示教程

工作流分享：https://pan.baidu.com/s/1P-OBYCs54acZ_AiSzLWJ6g?pwd=mxxz

资讯 2023 年 12 月 31 日

HandRefiner：解决AI图像生成中手部畸形的问题

目前的图像生成模型，再生成图像方面已经非常出色，但在生成人类手部的图像时却常常出现问题，比如手指数量不对或者手形怪异。 HandRefiner提出一种方法，在不改变图片其他部分的情况下，修正那些形状不…

教程 2023 年 10 月 11 日

Recolor 一键修复老照片+漫画上色也太自然了吧！不用LoRa就能重新上色！

今天我们来介绍一款一键上色神器 Recolor，也是最近 ControlNet 上新的一款新模型。Recolor，顾名思义，是给图片重新上色。我们不仅可以用它来给漫画上色，还能给图片随机改颜色。小捏…

资讯 2024 年 1 月 10 日

Luma AI发布：Genie 1.0版本

Genie是一个文本到3D模型的转换工具，能够在不到10秒内根据文本描述创建任何想象中的3D对象。生成的3D模型不仅包含形状，还包含了表面材料的细节，比如颜色、纹理或反光性，这使得模型更加逼真和详细…