Notebooks para la descarga y visualización con la librería TweetScraperR
- Ejecutar los requerimientos de la librería TweetScraperR.
- Descargar los cuadernos
- Crear un proyecto en Rstudio
Estos cuadernos utilizan la librería TweetScraperR que es una alternativa para la descarga de datos de Twitter tras el cierra de las APIs con acceso gratuito. La librería utiliza técnicas de scraping lo que implica, por un lado, restricciones en algunos tipos de mensajes y por otro una mayor necesidad de recursos de computación con descargas más lentas. No obstante, a pesar de estas dificultades es el único medio actualmente para descargar tweets de forma gratuita.
Con las técnicas de scraping podemos descargar todo lo que podemos acceder por la interfaz Web de Twiter/X. Las limitaciones más importantes afectan al análisis de red, ya que los RTs no aparecerán en una búsqueda y la descarga de seguidores /seguidos está limitada a un número.
root ----+----data-+---- dataset_1
| |
| +---- dataset_n
|
+---notebooks-+---- utils
|
+---- TweetScraperR_notebook.Rmd
|
+---- TweetScraperR_notebook_charts.Rmd
El dataset es el directorio donde se almacenan los datos. Las capturas se distinguen por su prefijo. En un dataset puede haber ficheros con distintos prefijos, todo depende de cómo se organice el trabajo. Para cada prefijo se generan dos ficheros: uno con los datos básicos de los tweets y otro con los metadatos.
En este cuaderno se han adaptado las librerías TweetScraperR a la forma de trabajar con t_hoarder_R.
Funcionalidades:
- Se especifica el rango de fechas inicial y final de la captura y la frecuencia de la descarga. La frecuencia se debe ajustar para que el número de tweets que se obtienen en cada petición no supere los 600 mensajes.
- Los datos se almacenan en formato csv
- Guarda contexto de la descarga. Si se interrumpe, se reanudará en el punto que lo dejó
Tipos de descargas:
- Get Tweets Historical Search: descarga una consulta en un periodo definido con una frecuencia establecida
- Get Tweets Historical Timeline: descarga el timeline de una lista de usuarios en un periodo definido con una frecuencia establecida. No se obtienen los RTs porque equivale a una consulta del tipo from:usuario
- Get Tweets Timeline: descarga el timeline de un usuario, incluidos RTs. El formato de los datos es diferente a las opciones 1 y 2
- Get Tweets Replies: descarga las respuestas de los tuits de un dataset. El formato de los datos es similar a las opciones 1 y 2, pero tiene dos columnas adicionales para identificar el origen de la respuesta.
- Get Tweets Cites: descarga las citas de los tuits de un dataset. El formato de los datos es igual a las opciones 1 y 2
- Get Retweets: descarga los usuarios que han hecho RT a los tweets de un dataset. El formato de los datos es diferente a las opciones 1 y 2
- Get Tweets images: obtiene las imágenes de una descarga ya realizada
Genera un conjunto de gráficas para el análisis de tuits descargados con el chunk Get-Tweets-Historical-Search del cuaderno TweetScraperR_notebook.Rmd
- Impacto
- Tuits vs. alcance con influencers (con o sin zoom)
- Tuits vs. alcance
- Tuits vs. RTs con influencers
- Tuits vs. RTs
- comments vs. RTs
- Palabras más frecuentes
- Sin amplificación
- Con amplificación
- Menciones
- Nube de usuarios citados
- Evolución acumulada de sitios web
- Emoticonos
- Nube
- Evolución acumulada con con amplificación
- Topics
- Evolución acumulada
- Evolución acumulada con amplificación
Genera un conjunto de gráficas para el análisis de usuarios descargados con el chunk Get-Tweets-Historical-Timeline del cuaderno TweetScraperR_notebook.Rmd
- Ritmo de publicación
- Rutina diaria
- Ritmo semanal
- Ritmo anual
- Impacto
- Tuits vs. favoritos
- Tuits vs. Rts
- Tuits vs. comentarios
- Tuits vs. impresiones
- Tuits vs. engagement
- Comentarios vs. RTs
- Palabras más frecuentes
- Menciones
- Nube de usuarios citados
- Evolución acumulada de sitios web
- Emoticonos
- Nube
- Evolución acumulada
- Topics
- Evolución acumulada
Genera un grafo de replies, quotes o RTs en formato gdf con los tuits descargados con el chunk Get-Tweets-Replies o Get-Tweets-Cites o Get Retweets del cuaderno TweetScraperR_notebook.Rmd