fal-ai/stable-audio-3/medium/audio-to-audio

Stable Audio 3 Medium audio-to-audio is a 1.4 billion parameter latent diffusion model that transforms an input audio clip into new stereo variations up to 6 minutes guided by a text prompt.

Inference

Commercial use

Schema

LLMs

Playground API Examples

Input

Prompt*

Audio Url*

Hint: Drag and drop audio files from your computer, audio from web pages, paste from clipboard (Ctrl/Cmd+V), or provide a URL. Accepted file types: mp3, ogg, wav, m4a, aac

Additional Settings

Customize your input with more control.

Result

Idle

What would you like to do next?

Download

{
  "audio": {
    "url": "https://v3b.fal.media/files/b/0a9ba32b/FqNccuoqJNFIm-kZWv12g_tmp1kskqn1h.mp3",
    "content_type": "application/octet-stream",
    "file_name": "tmp1kskqn1h.mp3",
    "file_size": 529806
  },
  "seed": 730910,
  "prompt": "arcade funk slap bass sparkle"
}

Your request will cost $0.0417 per audio.

fal-ai/stable-audio-3/medium/audio-to-audio

Input

Result

What would you like to do next?

Logs