Una aplicación web desarrollada con Streamlit que permite transcribir archivos de audio localmente y realizar consultas sobre el texto transcrito utilizando un modelo de lenguaje de Inteligencia Artificial (LLM), asegurando total privacidad ya que todo se ejecuta en tu propia máquina.
- Transcripción de Audio Local: Utiliza
faster-whisperpara transcribir audios con alta precisión y de forma rápida. - Reproductor de Audio Sincronizado: El texto transcrito se resalta automáticamente mientras se reproduce el audio.
- Navegación Interactiva: Haz clic en cualquier frase de la transcripción para saltar directamente a ese momento del audio.
- Chat con IA Local: Integra el modelo
microsoft/phi-2para que puedas hacer preguntas específicas sobre el contenido del audio. - Privacidad Total: No se requiere conexión a internet para procesar los audios ni enviar consultas; todos los datos se procesan localmente.
- Python 3.8 o superior.
- Recomendado: GPU compatible con CUDA para acelerar la transcripción y el procesamiento de la IA.
- Clona este repositorio o descarga los archivos.
- Crea un entorno virtual (opcional pero recomendado):
python -m venv venv source venv/bin/activate # En Linux/Mac venv\Scripts\activate # En Windows
- Instala las dependencias necesarias:
pip install -r requirements.txt
Nota: Asegúrate de tener instalado PyTorch con soporte para CUDA si deseas utilizar la aceleración por hardware.
Para iniciar la aplicación, ejecuta el siguiente comando en tu terminal:
streamlit run app.pyEsto abrirá automáticamente una pestaña en tu navegador web con la interfaz de la aplicación.
- Sube un archivo de audio (soporta mp3, wav, m4a, ogg, flac) desde la barra lateral.
- Selecciona el idioma o déjalo en "Auto-detectado".
- Haz clic en 🎯 Transcribir Audio.
- Una vez finalizada la transcripción, podrás reproducir el audio sincronizado con el texto.
- Utiliza la sección 💬 Consultar a la IA para hacer preguntas sobre la transcripción obtenida.
- Streamlit: Para la interfaz web.
- Faster-Whisper: Modelo de transcripción (STT).
- Transformers / Hugging Face: Para cargar el modelo
microsoft/phi-2(LLM). - PyTorch: Framework subyacente para el procesamiento de IA.