Twitter’n’Català: explicar una altra història del #twitterencatala

Article publicat al bloc d'Escacc

L’agenda mediàtica i els tuitaires tenien marcat el 5 de juliol com el dia del llançament del Twitter en català. Va ser notícia, però més enllà de la constatació i de felicitar l’Albert Cuesta per liderar la iniciativa, què es podia fer? Era previsible que Twitter no donés dades -ja que la xarxa de microblogging no dóna mai la xifra d’usuaris- i des de Data’n’Press ens vam proposar donar un dada d’acceptació el més acurada possible.

Twitter indica la llengua que fan servir els seus usuaris, per tant, podem filtrar les cerques per idioma afegint l’operador “lang=” i les dues lletres d’identificació de llengua (“ca” pel català, “es” per l’espanyol, “en” per l’anglès…), gestors com SocialBro et mostren quina llengua usen els teus seguidors i també pots crear la teva pròpia consulta a través de l’API de Twitter. Falta determinar quins usuaris són catalans.

Vam identificar 100.000 usuaris potencialment catalans, i vam anar ampliant la base de dades amb els tuitaires que segueixen @encatala (el nostre compte) i mirant quins usuaris segueixen als usuaris que fan servir la nostra aplicació per canviar-se automàticament.

Per fer difusió fem servir només la xarxa social Twitter, cada hora donem el número total d’usuaris que s’han passat al català i tuitejem els usuaris amb més seguidors que es passen al Twitter en català, sempre afegint el hashtag que fa dies que segueix la comunitat #twitterencatala. Al cap de poques hores els mitjans es fan seva la nostra dada, publiquen la nostra gràfica a la versió online: Nació Digital, el Periodico, Escacc, l’Ara, la Vanguardia, Vilaweb, el Punt Avui i diversos blocs. Saltem d’Internet i ens menciona l’informatiu de Rac1, el programa de les 8 al dia i l’Albert Cuesta al seu article de l’Ara de dissabte (i a algun lloc més que no hem detectat).

La resposta de la comunitat és extraordinària, la pàgina web on hi ha la gràfica rep només el dia 6 de juliol 5.439 visites, 4.602 visitants únics i té 9.090 pàgines visites. Prop de 1.000 persones fan servir la nostra aplicació el primer dia i el nostre Twitter passa en poc més de 15 hores de 0 a més de 1.000 seguidors. Tant el compte de Twitter com la pàgina web han nascut aquesta setmana i no tenien cap rellevància ni posicionament. Imaginem que la mateixa iniciativa portada per un mitjà amb una audiència consolidada hagués rebut moltes més visites.

Nosaltres considerem que Twitter’n'Català és un projecte periodístic, hem respost a una pregunta d’actualitat, no és la tècnica més habitual però cada vegada més periodistes i programadors haurem de treballar més plegats per a fer bones històries. Fer periodisme digital és molt més que penjar els continguts a Internet.

Twitter’n’Català

Nervis a l’equip de Data’n’Press, avui llencem un nou projecte: Twitter’n’català, una eina per a quantificar els usuaris de twitter que fan el canvi al #twitteralcatala. Es tracta d’una vella reivindicació de la comunitat catalana, liderada en gran part per l’especialista en tecnologia Albert Cuesta.

L’aplicació, a més de fer el recompte de tots els tuitaires que es passen al català, permetrà a l’usuari canviar-se automàticament de llengua i comprovar quin idioma fan servir els usuaris que segueix. Esperem que la eina facilita el canvi a molts usuaris i que ajudi a fer encara més popular el twitter en català.

Presentació de @Resultados20N a MediaLab-Prado

L’Edu i el David van anar a Madrid per a explicar el projecte @Resultados20n en el Barcamp de Periodisme de Dades de MediaLab-Prado. Per a nosaltres va ser un honor poder estar en el fòrum de periodisme de dades més important de l’estat, i una experiència molt divertida sobretot per la fabulosa acollida de la organització i dels companys que ens van escoltar. Esperem poder tornar-hi aviat!

Concurs Innova UPC

Data'nPress es un dels 12 Finalistes del concurs Innova de emprendoría de la UPC:

Projectes Finalistes

  • Calima
  • Vidia
  • Detección prematura del cáncer de mama
  • Radiation Control
  • Biotech Energy Systems (BES)
  • Interfície holofònica d'usuari
  • Implantación de surtidores eléctricos inalámbricos
  • UFDRR Management
  • Turbinas en la red de pluviales
  • Fidelis Cloud Solution
  • Transductor per evitar accidents a gruïlles (TEAC)
  • Data 'N' Press

DebatPSC

DebatPSC va ser un projecte de monitorització social del debat sobre el 12é Congrès del PSC, va ser realitzar un mes i mig abans que el Whashington Post fes el MentionMachine. A la web del projecte explicàvem com funcionava tot plegat.

El compte @debatPSC té una bona part dels seus tweets automatizats, per evitar confusions deixem per escrit totes les regles que apliquem.

  • A traves del RSS twittejem els post que els membres de la executiva del PSC fan en els seus blocs. Sempre posem el nom de qui l’ha escrit i usem el hashtag #congresPSC, ja que és el proposat pels socialistes i el més usat.
  • Fem un seguiment diari quantitatiu dels candidats a twitter i extraiem algunes de les dades de l’API de twitter: número de followers, de tweets i de mencions/RT. Creiem que pot ser interessant veure com evolucionen dia a dia aquestes dades, ja que ens mostra quina activitat hi ha al voltant del candidat.
  • Extraiem els Trending Topics de diversos grups relacionats amb el debat, penalitzem les paraules buides (articles, pronoms, monosilabs) i premiem les paraules que estan començant a sortir respecte aquelles que ja fa dies que estan en boca de tots. Per extreure aquest TT treballem amb quatre univers#candidatsPSC que són els tweets dels quatre candidats, #executivaPSC tweets de la nostra llista diputats i executiva, #congresPSC tots aquells tweets que contenen el hashtag, i #universPSC que són tots els univers anteriors sumats i afegint-li altres hashtags que està usant la comunitat socialista.
  •  Els tweets d’artícles i el comunity managment són absolutament manuals.

El procés de construcció de @resultats20n

Article publicat al bloc d'Escacc

Dimecres 16 de novembre rebo un DM (missatge directe a Twitter) del David Martín-Borregón que diu:

#Terrassa 100% esc.
████████████PSOE:49.84%
█████░░░░░░░CiU:18.52%
███░░░░░░░░░PP:15.87%
██░░░░░░░░░░ERC:5.59%
██░░░░░░░░░░ICV-EUiA:5.51%

En missatges posteriors m’explica que vol donar informació electoral terrassenca i que està treballant en la visualització sobre Twitter. Fa un parell de dies que ha après a tuitejar des de Matlab, un software matemàtic amb llenguatge de programació propi, i que a través d’una API que ha obert El País pot piular els resultats electorals.

Ens trobem a primera hora de la tarda, fem pujar ràpidament la idea, passem del pla local a l’estatal i trobem lliures dos noms fantàstics: @resultats20n i @resultados20n. Els dos anem de feina fins a dalt, el David està a l’últim semestre d’Enginyeria Superior de Telecomunicacions i jo tinc diversos clients que em collen, però podem dedicar-hi les tardes de dijous, divendres, i tot el cap de setmana; tirem endavant el projecte.

L’endemà dediquem tota la tarda a la visualització, els caràcters unicode no és veuen igual en tots els dispositius i Twitter no té tecla de salt de línia. Descobrim que hi ha caràcters que trenquen paraules i d’altres que les mantenen unides i ens permeten maquetar. Aconseguim veure bé els nostres gràfics a gairebé tots els dispositiu, però Echofon mòbil i Internet Explorer trenquen les paraules per on volen. Creiem que els gràfics són el nostre gran punt a favor, preferim mantenir-los i perdre una mica de quota.

Dijous nit llanço els comptes i quedo sorprès de la ràpida acceptació que tenen, sembla que els usuaris ens estiguessin esperant. Només seguint a gent i amb la promesa a la nostre bio que donarem els “Resultats al minut del #20N” rebem moltes felicitacions i recomanacions, en tres dies ens seguiran 1.193 usuaris al compte català i 1.003 a l’espanyol. Sumant els dos comptes ens posaríem a la posició 47 del rànquing de mitjans a Twitter d’en Saül Gordillo, davant del Canal 3XL, la COMRàdio o e-noticies.

Divendres tarda, dissabte i diumenge matí són dies de treball en paral·lel, mentre jo posiciono el compte i creo una comunitat, el David millora l’algoritme, treballem amb l’skype permanentment obert i anem millorant la visualització conjuntament. Tot el gruix de la feina el fem separats físicament, fins diumenge tarda no ens reunirem per treballar plegats les últimes hores i passar la nit electoral junts. Arriben les nou de la nit, comença l’escrutini i els imprevistos.

Conceptualment el funcionament del programa és bastant simple, cada x segons consulta l’xml i si hi ha una determinada variació sobre l’escrutini tuiteja el resultat. El problema és que has de trobar la mesura justa de tweets, no saturar però no deixar de donar els resultats més rellevants, no hem tingut temps de testejar-ho correctament i anem rectificant mentre estem a l’aire.

Una de les grans virtuts de Matlab és que mentre el programa està funcionant pots veure el codi, retocar-lo i només has de reiniciar perquè s’apliquin els canvis. Això ens permet superar un altre imprevist, el nom dels partits. El País no ens ha donat els noms exactes del partits fins les 21h, hora de llançament, i algunes sigles són massa llargues i no respecten la nostra maquetació. La solució és molt ràpida però rebem crítiques per treure gràfics mal fets.

No voldríem apuntar cap al diari, de qui lloem la iniciativa, sinó cap al Ministeri de l’Interior. El propi govern ha de ser el primer interessat en que existeixin incitives com aquesta, però no és així. No dóna les seves dades a dos tuitaires, sinó només a grups mediàtics que s’han acreditat correctament. Urgeix un canvi de mentalitat governamental i començar a treballar amb criteris open data com fa l’Ajuntament de Barcelona.

En total vàrem tardar mitja hora a ajustar els dos comptes, però ja era massa tard. A les 21:45 ja estava tot dat i beneït, i començàvem a rebre els primers unfollows; hi ha qui tanca la tele i n’hi ha d’altres que deixen de seguir el Twitter electoral. Curiós veure com hi ha la mateixa reacció de l’audiència en dos mitjans tant diferents.

La nit acaba amb un regust estrany, molt contents per la feina feta però amb la sensació que amb una mica més de temps i el suport d’algun grup mediàtic podríem haver tingut molta més repercussió. Creiem que hem fet un projecte molt sòlid, innovador i creatiu, que tenim una bona eina entre mans i que hem fet un bon equip, llàstima que quedin tant lluny les properes eleccions!

El post-projecte és una incògnita, tenim dos comptes que èticament haurien de quedar inactius, un codi que ens debatem si fer lliure i un saber fer adquirit que ens agradaria poder aplicar en altres projectes. Estem pensant en fer-ne alguna adaptació (borsa, audiències de tv…) i estem oberts a noves idees, esperem que les pugueu descobriu ben aviat per Twitter.

Pàgines