DIABOLIC Baleares es una herramienta OSINT pasiva y analítica diseñada para monitorizar automáticamente 18 periódicos digitales de las Islas Baleares, extrayendo y procesando noticias de sucesos para detectar patrones delictivos, tendencias geográficas y conexiones entre incidentes.
Nace con una filosofía clara: “Un gran poder conlleva una gran responsabilidad”. Por eso su diseño prioriza la transparencia, la ética y el respeto a la privacidad.
- 🔍 ¿Qué hace DIABOLIC?
- ⚙️ Características clave
- 🛠️ Tecnología y arquitectura
- ⚖️ Web Scraping: marco legal
- 📥 Instalación y uso
- 🖥️ Modo terminal (10 comandos)
- 🌐 Modo web interactivo
- 📰 Fuentes monitorizadas
- 🧠 Tipo de OSINT y metodología
- ⚖️ Ética, legalidad y protección de datos
- 🤝 Contribuciones y futuro
- 📜 Licencia
DIABOLIC automatiza el proceso de scraping de noticias de sucesos de medios locales de Baleares. En lugar de leer decenas de periódicos cada día, la herramienta:
- Extrae automáticamente titulares, fechas, fuentes y ubicaciones geográficas de noticias relacionadas con delitos.
- Clasifica los incidentes en categorías (robo, estafa, narcotráfico, violencia, asesinato, intrusismo turístico, etc.).
- Almacena los datos localmente en formato JSON, sin guardar ningún dato personal.
- Analiza tendencias temporales (7, 30, 90 días) y distribuciones por isla y tipo de delito.
- Detecta conexiones entre incidentes: misma zona, fechas cercanas, mismo modus operandi (alunicero, butrón, escalo…) que pueden indicar una misma banda.
- Visualiza los resultados mediante una interfaz web interactiva con gráficos de barras y filtros dinámicos.
- Exporta los datos a CSV o JSON para análisis externos.
| Característica | Descripción |
|---|---|
| 🔁 Rotación de User‑Agent | Evita bloqueos simulando diferentes navegadores y versiones. |
| 🧠 Paginación inteligente | Prueba 12 formatos de paginación y recuerda el que funciona. |
| 🔎 Detector automático de URLs | Si falla, busca rutas alternativas (/sucesos, /local, /tribunales...). |
| 📊 Clasificación avanzada | Léxico balear: peta, falcon, vuelco, alunicero, butrón, intrusismo... |
| 🔗 Conexiones entre incidentes | Por tipo/isla, modus operandi, frecuencia temporal. |
| 🌐 Interfaz web interactiva | Gráficos, filtros, exportación. |
| 🖥️ Menú terminal completo | 10 comandos. |
- Lenguaje: Python 3.8+
- Framework web: Flask
- Scraping: Requests + BeautifulSoup4
- Almacenamiento: JSON local
- Estructura modular:
DetectorURLs: verifica y corrige URLs.GestorDatos: carga, guarda y procesa incidentes.ExtractorNoticias: scraping con rotación de User‑Agent y paginación inteligente.
- Colores en terminal: Códigos ANSI.
El web scraping que realiza DIABOLIC Baleares es completamente legal y ético por las siguientes razones:
- Fuentes públicas: Solo accede a contenido indexado y accesible sin autenticación. No vulnera sistemas de pago ni áreas restringidas.
- Cumplimiento del RGPD / LOPDGDD: No extrae, almacena ni procesa datos personales (nombres, direcciones, teléfonos, emails, IPs, cookies). Solo almacena metadatos anónimos: titular de la noticia, fecha, isla aproximada, tipo de delito y fuente.
- Respeto a los términos de uso: La herramienta respeta el archivo
robots.txtde cada sitio (se puede configurar) y no sobrecarga los servidores con peticiones (limita la frecuencia y número de páginas). - Sin republicación de contenido: No copia íntegramente los artículos, solo extrae titulares y metadatos para análisis, citando siempre la fuente original.
- Uso legítimo: La finalidad es exclusivamente académica, periodística, criminológica o de prevención comunitaria, sin ánimo de lucro ni vigilancia masiva.
- Transparencia total: El código es abierto y auditable, lo que permite verificar que no se realizan prácticas lesivas.
Nota: El scraping masivo o con fines de venta/redistribución de contenido puede vulnerar derechos de autor. Este proyecto se acoge al uso justo (fair use) y al derecho a la información.
pkg update && pkg upgrade -y
pkg install python git -y
pip install requests beautifulsoup4 flask
git clone https://github.com/Condor2026/Diabolic_v17
cd Diabolic_v17
python Diabolic_v17.pyEn Linux (Debian/Ubuntu)
sudo apt update
sudo apt install python3 python3-pip git -y
pip3 install requests beautifulsoup4 flask
git clone https://github.com/Condor2026/Diabolic_v17
cd Diabolic_v17
python3 Diabolic_v17.py🖥️ Modo terminal (10 comandos)
Al ejecutar Diabolic_v17.py aparece un menú con las siguientes opciones:
╔════════════════════════════════════════════════════╗
║ M E N Ú P R I N C I P A L ║
╚════════════════════════════════════════════════════╝
[1] 🔍 Buscar noticias
[2] 📊 Ver análisis completo
[3] 🔗 Ver conexiones entre incidentes
[4] 📈 Ver evolución mensual
[5] 🌐 Iniciar servidor web
[6] 📰 Ver últimos 20 incidentes
[7] 📥 Exportar datos (JSON/CSV)
[8] 🔍 Verificar periódicos
[9] 📊 Ver distribución por tipo
[0] 🗑️ Salir
Cada opción ejecuta la acción correspondiente y muestra los resultados en la terminal.
🌐 Modo web interactivo
La opción [5] lanza un servidor Flask local (por defecto en http://localhost:5013). Desde el navegador podrás:
· Ver gráficos de barras interactivos por isla y tipo de delito. · Filtrar por período (7, 30, 90 días). · Consultar la lista de incidentes. · Exportar los datos a CSV o JSON con un clic.
📰 Fuentes monitorizadas
La herramienta rastrea 18 periódicos digitales de las Islas Baleares, incluyendo:
· Mallorca: Diario de Mallorca, Última Hora, Mallorca Diario, Crónica Balear, Noticias Mallorca, Mallorca Confidencial, El Mundo – Baleares, El País – Baleares. · Menorca: Menorca Info, Menorca Al Día, Es Diari Menorca, Menorca Esportiu. · Ibiza: Diario de Ibiza, Periódico de Ibiza, Noudiari, La Voz de Ibiza. · Formentera: Formentera Avui, Formentera Digital.
La lista completa se puede consultar/editando dentro del script (PERIODICOS_BASE).
🧠 Tipo de OSINT y metodología
· OSINT Pasivo: No interactúa con los sistemas de los periódicos más allá de lo que un usuario normal haría. · Extracción selectiva: Solo recoge información de sucesos (policial, judicial, seguridad ciudadana). · Anonimización: No almacena datos personales de los implicados, solo el lugar, fecha y tipo de delito. · Enfoque analítico: Busca patrones para entender la delincuencia en Baleares, especialmente el intrusismo turístico, robos y narcotráfico.
⚖️ Ética, legalidad y protección de datos
DIABOLIC Baleares respeta estrictamente la legalidad española y europea:
· Solo accede a contenido público y no requiere autenticación. · No almacena información personal (nombres, DNI, direcciones, IPs, cookies). · El código es abierto y transparente. · Se recomienda utilizar la herramienta únicamente con fines académicos, periodísticos o de investigación criminal legítima.
🤝 Contribuciones y futuro
Las contribuciones son bienvenidas. Puedes:
· Reportar errores en Issues. · Ampliar la lista de periódicos o islas. · Mejorar el detector automático de URLs. · Añadir nuevas categorías de delitos. · Optimizar el análisis de conexiones.
Este proyecto está bajo la GNU General Public License v3.0 (GPLv3).
Consulta el archivo LICENSE para el texto completo de la licencia.
🙏 Agradecimientos
· BeautifulSoup4 – scraping. · Flask – interfaz web. · Inspiración: proyectos OSINT como Sherlock, Maigret. · Comunidad de investigación OSINT en Baleares.
⭐ ¡Si te gusta el proyecto, no olvides darle una estrella en GitHub!