🎙️ Audio Transcriber + Chat IA Local

Una aplicación web desarrollada con Streamlit que permite transcribir archivos de audio localmente y realizar consultas sobre el texto transcrito utilizando un modelo de lenguaje de Inteligencia Artificial (LLM), asegurando total privacidad ya que todo se ejecuta en tu propia máquina.

🎯 Características Principales

Transcripción de Audio Local: Utiliza faster-whisper para transcribir audios con alta precisión y de forma rápida.
Reproductor de Audio Sincronizado: El texto transcrito se resalta automáticamente mientras se reproduce el audio.
Navegación Interactiva: Haz clic en cualquier frase de la transcripción para saltar directamente a ese momento del audio.
Chat con IA Local: Integra el modelo microsoft/phi-2 para que puedas hacer preguntas específicas sobre el contenido del audio.
Privacidad Total: No se requiere conexión a internet para procesar los audios ni enviar consultas; todos los datos se procesan localmente.

🛠️ Requisitos del Sistema

Python 3.8 o superior.
Recomendado: GPU compatible con CUDA para acelerar la transcripción y el procesamiento de la IA.

🚀 Instalación

Clona este repositorio o descarga los archivos.

Crea un entorno virtual (opcional pero recomendado):

python -m venv venv
source venv/bin/activate  # En Linux/Mac
venv\Scripts\activate     # En Windows

Instala las dependencias necesarias:
```
pip install -r requirements.txt
```

Nota: Asegúrate de tener instalado PyTorch con soporte para CUDA si deseas utilizar la aceleración por hardware.

💻 Uso

Para iniciar la aplicación, ejecuta el siguiente comando en tu terminal:

streamlit run app.py

Esto abrirá automáticamente una pestaña en tu navegador web con la interfaz de la aplicación.

¿Cómo usar la app?

Sube un archivo de audio (soporta mp3, wav, m4a, ogg, flac) desde la barra lateral.
Selecciona el idioma o déjalo en "Auto-detectado".
Haz clic en 🎯 Transcribir Audio.
Una vez finalizada la transcripción, podrás reproducir el audio sincronizado con el texto.
Utiliza la sección 💬 Consultar a la IA para hacer preguntas sobre la transcripción obtenida.

📚 Tecnologías Utilizadas

Streamlit: Para la interfaz web.
Faster-Whisper: Modelo de transcripción (STT).
Transformers / Hugging Face: Para cargar el modelo microsoft/phi-2 (LLM).
PyTorch: Framework subyacente para el procesamiento de IA.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

🎙️ Audio Transcriber + Chat IA Local

🎯 Características Principales

🛠️ Requisitos del Sistema

🚀 Instalación

💻 Uso

¿Cómo usar la app?

📚 Tecnologías Utilizadas

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

🎙️ Audio Transcriber + Chat IA Local

🎯 Características Principales

🛠️ Requisitos del Sistema

🚀 Instalación

💻 Uso

¿Cómo usar la app?

📚 Tecnologías Utilizadas

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages