Spaces:

marcosremar2
/

wavlm-large-demo

Sleeping

wavlm-large-demo / README.md

Use stable Gradio 3.50.2 and ultra-simple interface

1b99dff 5 months ago

1.88 kB

A newer version of the Gradio SDK is available: 5.49.1

Upgrade

metadata

title: WavLM-Large Demo
emoji: 🎵
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 3.50.2
app_file: app.py
pinned: false
license: mit

🎵 WavLM-Large Demo

Este é uma demonstração interativa do modelo WavLM-Large da Microsoft, disponibilizado através do repositório marcosremar2/wavlm-large-deploy.

Processamento de Áudio: Carregue arquivos de áudio e veja as features extraídas
Visualizações: Forma de onda e mapa de calor das features
Informações Detalhadas: Estatísticas do áudio e saída do modelo
Interface Amigável: Interface web intuitiva com Gradio

O WavLM-Large é um modelo de aprendizado auto-supervisionado para processamento de fala com:

317M parâmetros
Treinado em 94k horas de áudio de múltiplas fontes
Arquitetura: 24 camadas transformer
Aplicações: Reconhecimento de fala, classificação de áudio, verificação de locutor

Paper: WavLM: Large-Scale Self-Supervised Pre-Training for Full Stack Speech Processing
Repositório Original: microsoft/unilm/wavlm
Modelo: marcosremar2/wavlm-large-deploy