介绍hallo是一个用于人像图像动画的分层音频驱动视觉合成的项目,在使用语音音频输入的驱动下,人像图像动画领域在生成逼真和动态的人像。它采用了端到端扩散范式,并引入了分层音频驱动的视觉合成模块,以提高音频输入和视觉输出之间的对齐精度,包括嘴唇、表情和姿势运动。无缝集成了基于扩散的生成模型、基于UNet的降噪器、时间对齐技术和参考网络。所提出的分层音频驱动的视觉合成提供了对表情和姿势多样性的自适应控制,从而实现了针对不同身份的更有效的个性化。在图像和视频质量、唇形同步精度和运动多样性方面取得了明显的提高
此外,该项目支持与 ComfyUI 工具集成
官网:https://fudan-generative-vision.github.io/hallo/
github:https://github.com/fudan-generative-vision/hallo
启动整合包下载:https://pan.quark.cn/s/455b24f79fc6
演示
启动包说明启动整合包不包含训练模型,适用于WIN系统,大小6.8g,要求最低内存需要8G,训练模型可从 HuggingFace 存储库 ...
IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国科学技术院和OMNIOUS.AI的研究人员提出的一种先进的AI虚拟试穿技术,通过改进扩散模型来生成逼真的人物穿戴图像,实现更真实的虚拟试穿效果。该技术包含两个关键组件:一是视觉编码器,用于提取服装图像的高级语义信息;二是GarmentNet,一个并行UNet网络,用于捕捉服装的低级细节特征。IDM-VTON还引入了详细的文本提示,以增强模型对服装特征的理解,从而提升生成图像的真实度。,同时支持Win和Mac,
下载:https://pan.quark.cn/s/9a3abbca0ad7
功能特色
虚拟试穿图像生成:根据用户和服装的图像,生成用户穿戴特定服装的虚拟图像。
服装细节保留:通过GarmentNet提取服装的低级特征,确保服装的图案、纹理等细节在生成的图像中得到准确反映。
支持文本提示理解:利用视觉编码器和文本提示,使模型能够理解服装的高级语义信息,如款式、类型等。
个性化定制:允许用户通过提供自己的图像和服装图像,定制化生成更符合个人特征的试穿效果。
逼真的 ...
介绍该SD启动器是由GetAI出品,具有一键安装下载启动的使用特性,你可以快速调用大模型及插件
下载:https://pan.quark.cn/s/38bcedb8162a
介绍这是一款集成 Dreambooth 和 LoRA 模型训练的Stable Diffusion WebUI 启动器,包含丰富的模型、插件,随时更新、内置丰富精选AI课程、内置丰富的AI工具导航站,轻松找到、海量AI工具
官网:https://www.easyartx.com/landing
下载:https://pan.quark.cn/s/e78b277bc1da
特征丰富的模型、插件随时更新支持丰富模型快速下载
支持丰富插件管理,即插即用
Dreambooth、LoRA模型训练针对新手、专家设置不同的模式,满足不同用户模型训练需求
一键快速安装,完全无忧
介绍
Srt-AI-Voice-Assistant是利用多个AI-TTS为你的字幕或文本文件配音。 并提供包括字幕识别、翻译在内的多种便捷的辅助功能。
项目地址:https://github.com/YYuX-1145/Srt-AI-Voice-Assistant
体验:srt-ai-voice-assistant-onlinedemo.work特性
✅ 代码开源,界面友好,本地运行,可局域网访问
✅ 支持多个TTS项目:BV2,GSV,CosyVoice2,AzureTTS,以及你可以自定义API!
✅ 保存个性化设置和预设
✅ 批量模式
✅ 字幕编辑
✅ 字幕批量翻译
✅ 单句重新抽卡
✅ 支持多角色配音
✅ 字幕重新导出
✅ 扩展功能:音视频字幕转录
✅ I18n
打包版:https://github.com/YYuX-1145/Srt-AI-Voice-Assistant/releases
网盘:https://pan.quark.cn/s/01e0362d9a23
当依赖冲突或无法正常安装时使用此版本
下载配合GPT-SoVITS的整合包(Hugging Face)
...
前言:这次是在上次发布过的抖音自动化关键词点赞视频的基础上增加的的AI调用,上篇文章请查看https://www.noiseblogs.top/posts/8f0120ea/ 或 https://mp.weixin.qq.com/s/mOYPecfs4ck7lxhx9S81tw
这次我们依然使用影刀来完成
自动化运行简单演示视频:
由于上次已将步骤分享过,所以这次只讲AI模块,此模块主要是将python调用模型引入到流程中,我们可以看到主要是占用符调用HTTP 请求的 http.client 模块来完成json块的请求和转换,这里我调用的是自己搭建的one api使用gpt3.5模型来请求的,你可以替换为自己的api
使用:右侧流程中新建python模块写入代码,然后在左侧指令中搜索你新建的模块并拖入工作流中!
重点是ai请求什么元素来完成评论!
在演示中我使用的是选取视频标题部分来读取文本,然后扔给ai
AI读取文本后进行问题提问,如下
最后点击到评论区输入ai输出后的文本信息即可:
整个流程下来其实用不了多少时间,重点看你怎么调用模块
由于我不是影刀企业用户无法分享整个 ...
资源分享
未读
介绍这是包含了上百个CG相关的课程相关资源,我已将链接整理为txt及excel文件,其中包括文件目录
大小:约3.6T
云:百度
下载:夸克:https://pan.quark.cn/s/5992b9fb0689
百度链接: https://pan.baidu.com/s/1aAUCh6wGKV-LCE36H8wCmw 提取码: dt8g
蓝奏云:https://noise.lanzoul.com/iaiPV21mz19g
预览
批量转存根据可参考:https://github.com/hxz393/BaiduPanFilesTransfers
WIN打包程序下载:https://pan.quark.cn/s/55338a74cb3e
介绍TuneFree是一款基于Splayer进行二次开发的音乐播放器,可解析并播放网易云音乐中所有的付费资源
Github:https://github.com/GSQZ/TuneFree
官方页面:https://pt.sayqz.com
下载:https://sayqz.lanpv.com/s/tunefree
也可以通过远嘛进行自己编译
预览
🎉 功能
🎵 支持播放网易云音乐所有的付费资源
🆕 软件内检查更新
🤳 独立Android客户端
✨ 支持扫码登录
📱 支持手机号登录
📅 自动进行每日签到及云贝签到
🎨 封面主题色自适应
📁 本地歌曲管理及分类(建议先使用 音乐标签 进行匹配后再使用)
⬇️ 下载歌曲(最高支持 超清母带)
➕ 新建歌单及歌单编辑
❤️ 收藏 / 取消收藏歌单或歌手
🎶 每日推荐歌曲
📻 私人 FM
☁️ 云盘音乐上传
📂 云盘内歌曲播放
🔄 云盘内歌曲纠正
🗑️ 云盘歌曲删除
📝 支持逐字歌词
🔄 歌词滚动以及歌词翻译
📹 MV 与视频播放
🎶 音乐频谱显示
⏭️ 音乐渐入渐出
🔄 支持 PWA
💬 支持评论区及 ...