#

audio-generation

Here are 61 public repositories matching this topic...

Bai-YT / ConsistencyTTA

ConsistencyTTA: Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation

audio-processing ldm diffusion-models consistency-models audio-generation

Updated Jun 6, 2024
Python

mudler / LocalAI

🤖 The free, Open Source OpenAI alternative. Self-hosted, community-driven and local-first. Drop-in replacement for OpenAI running on consumer-grade hardware. No GPU required. Runs gguf, transformers, diffusers and many more models architectures. It allows to generate Text, Audio, Video, Images. Also with voice cloning capabilities.

Updated Jun 6, 2024
C++

sony / soundctm

Pytorch implementation of SoundCTM

pytorch diffusion-models text-to-audio audio-generation

Updated Jun 6, 2024
Python

Consistency-TTA / consistency-tta.github.io

Accelerating Diffusion-Based Text-to-Audio Generation with Consistency Distillation

audio diffusion-models text-to-audio audio-generation audio-diffusion

Updated Jun 5, 2024
HTML

metame-ai / awesome-audio-plaza

Daily tracking of awesome audio papers, including music generation, zero-shot tts, asr, audio generation

awesome tts music-generation asr audio-generation zero-shot-tts awesome-music-generation

Updated Jun 5, 2024

researchmm / MM-Diffusion

[CVPR'23] MM-Diffusion: Learning Multi-Modal Diffusion Models for Joint Audio and Video Generation

video-generation multi-modality diffusion-models content-creation audio-generation

Updated Jun 5, 2024
Python

haoheliu / AudioLDM2

Text-to-Audio/Music Generation

audio-generation

Updated Jun 2, 2024
Python

haoheliu / AudioLDM

AudioLDM: Generate speech, sound effects, music and beyond, with text.

audio-generation

Updated Jun 2, 2024
Python

Amphion

open-mmlab / Amphion

Amphion (/æmˈfaɪən/) is a toolkit for Audio, Music, and Speech Generation. Its purpose is to support reproducible research and help junior researchers and engineers get started in the field of audio, music, and speech generation research and development.

text-to-speech audit speech-synthesis audio-synthesis music-generation voice-conversion text-to-audio fastspeech2 vits hifi-gan audio-generation singing-voice-conversion vall-e audioldm naturalspeech2

Updated May 24, 2024
Python

langchain-tech / Musicgen-Text-to-Music

Turn your words into music! Describe a sound (e.g., happy, spooky) and this app generates a short piece based on your text.

background-music streamlit text-to-music audio-generation musicgen audiocraft

Updated May 21, 2024
Python

tts-generation-webui

rsxdalv / tts-generation-webui

TTS Generation Web UI (Bark, MusicGen + AudioGen, Tortoise, RVC, Vocos, Demucs, SeamlessM4T, MAGNet, StyleTTS2, MMS)

Updated May 16, 2024
TypeScript

lucidrains / soundstorm-pytorch

Implementation of SoundStorm, Efficient Parallel Audio Generation from Google Deepmind, in Pytorch

deep-learning transformers artificial-intelligence attention-mechanism non-autoregressive audio-generation

Updated May 4, 2024
Python

tango

declare-lab / tango

A family of diffusion models for text-to-audio generation.

language-models diffusion diffusion-models text-to-audio audio-generation large-language-models

Updated May 2, 2024
Python

soham97 / awesome-sound_event_detection

Reading list for research topics in Sound AI

representation-learning audio-processing zero-shot-learning icassp sound-event-detection interspeech acoustic-scene-classification audio-captioning audio-generation audio-retrieval

Updated Apr 28, 2024

swiss-ai-center / hugging-face-text-to-audio-service

The service is used to query text-to-audio AI models from the Hugging Face inference API.

image-processing audio-generation

Updated Apr 28, 2024
Python

mesudepolat / generative-ai

Various projects utilizing diverse generative AI techniques to produce audio, code, images, text, and Streamlit applications.

gemini openai image-generation command-api streamlit audio-generation assemblyai claude-ai

Updated Apr 19, 2024
Python

danielprinceD / AI-ToolKit

chatbot artificial-intelligence llama text-processing music-generation final-year-project final-project video-generation text-audio audio-generation large-language-models llm text-video-retrieval

Updated Apr 11, 2024
Python

Yuan-ManX / audio-development-tools

This is a list of sound, audio and music development tools which contains machine learning, audio generation, audio signal processing, sound synthesis, spatial audio, music information retrieval, music generation, speech recognition, speech synthesis, singing voice synthesis and more.

audio music machine-learning deep-learning signal-processing dsp speech artificial-intelligence speech-synthesis music-generation speech-processing audio-processing audio-generation

Updated Apr 8, 2024

galgreshler / Catch-A-Waveform

Official pytorch implementation of the paper: "Catch-A-Waveform: Learning to Generate Audio from a Single Short Example" (NeurIPS 2021)

speech-synthesis gan music-generation raw-waveforms audio-inpainting audio-denoising audio-generation single-example bandwidth-extension audio-super-resolution

Updated Apr 2, 2024
Python

Yuan-ManX / ai-audio-datasets

AI Audio Datasets 🎵. A list of datasets consisting of speech, music, and sound effects, which can provide training data for Generative AI, AIGC, AI model training, intelligent audio tool development, and audio applications.

audio machine-learning deep-learning audio-effect artificial-intelligence datasets music-generation audio-generation aigc

Updated Apr 1, 2024

Improve this page

Add a description, image, and links to the audio-generation topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the audio-generation topic, visit your repo's landing page and select "manage topics."