DragGAN的在线演示和非官方实现-“拖拽你的GAN:生成图像歧管上的交互式基于点的操作”(DragGAN 全功能实现,在线Demo,本地部署试用,代码、模型已全部开源,支持Windows, mac...
BuboGPT是一种先进的大型语言模型 (LLM),它结合了文本、图像和音频等多模式输入,具有将其对视觉对象的响应作为基础的独特能力。无论是对齐还是未对齐,它在理解任意图像和音频数据方面都表现出卓越的...
- bubo-gpt.github.io
- 2024-07-21
Danswer是一款开源企业答疑工具。你所说的问答是什么意思直接QA允许您用简单的语言提问,并获得即时、准确的回答解锁来自私人数据源的知识,无论是公司内部文档还是您要添加的个人数据源每一个答案都有引用...
- docs.danswer.dev
- 2024-07-21
tts-vue微软语音合成工具,使用 Electron + Vue + ElementPlus + Vite 构建.tts-vue软件以及代码仅为个人学习测试使用,请在下载后24小时内删除,不得用于商...
DNA-RENDERING DNA渲染一种用于高保真以人为本绘制的多样化神经数字人库
- dna-rendering.github.io
- 2024-07-21
Audiocraft是一个基于深度学习的音频处理和生成库。它具有最先进的编码器音频压缩器/标记器,以及MusicGen,一个简单而可控的音乐生成LM,具有文本和旋律调节。
我们介绍的 DeepFloyd IF 是一种新颖、先进的开源文本到图像模型,具有高度的逼真性和语言理解能力。DeepFloyd IF 是一个模块,由一个冻结文本编码器和三个级联像素扩散模块组成:一个基...
ChatGPT提示生成器是一个人工智能工具,可以生成创意写作和角色扮演提示。
- kosuket-dev.github.io
- 2024-07-21