Twitter: fuentes de datos

Recientemente alguien me preguntó cómo obtener datos de Twitter para una investigación. Como pensé que podía servirle a otras personas, aquí mi respuesta.

Hay tres casos, que dependen de la fecha de creación de los tweets que te interesan.

A. Sólo tweets nuevos. En este caso, tienes que usar la API de streaming de Twitter, que permite especificar algunas palabras clave que son usadas para filtrar los nuevos tweets.

B. Tweets de los últimos días. En este caso, tienes que usar la API de búsqueda (search) de Twitter, que permite especificar algunas palabras clave y encontrar los tweets, ordenados por fecha o relevancia, que contienen dichas palabras clave.

C. Tweets más antiguos que 1-2 semanas. En este caso, la única opción es pasar por un proveedor de datos de Twitter, al que se paga por volumen de tweets descargados.

Software para acceder a la API de Twitter:

Proveedores de datos de Twitter: GNIP, DataSift.

Imagen: OccupyStream.