5. No ho dic jo: ho diuen les dades

INTRODUCCIÓ

Si obrim un diari o mirem un informatiu un dia qualsevol és molt probable que hi trobem els resultats d’alguna enquesta o estudi amb dades, gràfics, etc. Els mitjans utilitzen l’estadística per a intentar explicar com és un determinat aspecte d’una societat (per exemple, a partir d’un estudi fet a Europa es diu “Els europeus pensen que…” o “Els europeus estan d’acord amb…”). De vegades els governs o els polítics també les fan servir per fonamentar les seves decisions.

De vegades es diu que l’estadística és aquella ciència segons la qual si de dues persones assegudes a taula una es menja un pollastre i l’altre es queda sense menjar, el resultat estadístic és que cadascun n’ha menjat una meitat. Però… aquest tipus de fals resultat és culpa de l’estadística o bé de la interpretació que se’n pugui fer? Fins a quin punt una enquesta o un estudi estadístic donen sempre una imatge exacta de la realitat?  És l’estadística qui menteix o és que sovint qui menteix fa servir estadístiques? Com és que de vegades dues enquestes sobre el mateix tema donen resultats oposats?

Aquestes són algunes de les preguntes que planteja aquesta unitat que és molt adequada per compartir amb l’àrea de Matemàtiques. Abans de començar a treballar, un enfocament del tema en clau d’humor:

DESENVOLUPAMENT

L’estadística és enormement útil en el nostre món (fins i tot pot arribar a salvar vides, com veurem al darrer apartat) i es fa servir en camps molt diferents: la utilitzen els meteoròlegs per fer la previsió del temps i també els jugadors de pòquer per preveure les jugades. La mateixa televisió en depèn enormement, ja que l’èxit d’un programa s’acostuma a mesurar únicament en audiència, i les dades d’audiència no són altra cosa que una extrapolació: a partir del que veuen algunes persones que tenen instal·lat un aparell de mesura, es dedueix què mira la totalitat de la població (a tot l’Estat, per exemple, hi ha unes 46.700.000 persones (2019) però només n’hi ha unes 12.000 que tinguin instal·lat un audímetre).

1. Una mateixa pregunta, un mateix públic, diferents resultats.

Al desembre de l’any 2013 el govern espanyol va aprovar una llei sobre l’avortament que havia aixecat molta polèmica i posicions molt enfrontades entre els que hi estaven a favor i en contra. El primer cap de setmana de gener del 2014 es van publicar dues enquestes per saber què pensaven els espanyols sobre aquella llei, és a dir, si donaven suport o no al que havia fet el govern. Fixeu-vos en els resultats:

avortament1 copia
avortament2

Més enllà dels jocs de paraules que fan els titulars (conscientment no fan ben bé la mateixa pregunta), hi ha preguntes concretes que són iguals en una enquesta i l’altra, com “està d’acord amb una llei de terminis com la que hi ha ara?” la resposta de la qual segons un diari és que el 73,3% dels espanyols està a favor de mantenir-la i segons l’altre diari que només el 24,3% dels espanyols hi està a favor.

A) Amb una mateixa pregunta i en un mateix país, com s’expliquen dos resultats tan diferents? Què pensaven els espanyols realment sobre aquesta llei; estaven a favor del ministre o no?

B) Ara plantejarem una situació en què hauràs de fer servir les paraules per fer que els mateixos números diguin coses diferents. En un país determinat, el pressupost nacional de defensa va ser de 30 milions (en la moneda del país) el 1980. El pressupost total d’aquell any va ser de 500 milions. A l’any següent, el pressupost de defensa va passar a 35 milions, mentre que el pressupost total va ser de 605 milions. La inflació del període comprès entre els dos pressupostos va arribar al 10 per cent. A partir de les mateixes dades, has d’aconseguir donar dues interpretacions molt diferents:

– Et conviden a donar una conferència en una associació pacifista. Intentes explicar que el pressupost de defensa ha disminuït en aquest període. Explica com ho faries.

– Et conviden a donar una conferència en una acadèmia militar. Intentes explicar que el pressupost de defensa ha augmentat en aquest període. Explica com ho faries

C) L’empresa encarregada de la selecció d’aspirants a un concurs de talents  ha estat acusada d’afavorir els aspirants masculins davant dels femenins. Com que hi havia molts aspirants se’n van fer dos grups per ser avaluats per dos jurats diferents. El primer jurat va avaluar 900 homes, dels quals en va admetre a 450, i a 100 dones, de les quals en va admetre a 20. El segon jurat va avaluar a 100 homes, dels quals en va admetre a 60, i a 900 dones, de les quals en va admetre a 500. En el judici, quines dades hauria de ressaltar l’acusació i quines la defensa davant d’aquesta denúncia?

2. Quina quantitat té la mostra?

La primera cosa que cal tenir en compte per valorar la representativitat d’una enquesta és la mostra utilitzada (la quantitat de persones a qui s’ha preguntat, per després fer una estimació de què pensa el total de la població). S’intenta que sigui representativa, és a dir, que representi bé els diferents pensaments que hi pugui haver en la població, que no passi que es pregunti només als que pensen una determinada cosa.

Normalment quan un mitjà fa servir una enquesta ens hauria de dir quina mostra ha fet servir. Fixem-nos en aquest cas:

mundo

D) En aquesta enquesta es tractava de saber què votarien els electors catalans si les eleccions es celebressin en aquell moment. Sou capaços de trobar en la notícia quina mostra s’ha fet servir per a aquesta enquesta?

El cens català (la quantitat de persones que viuen a Catalunya i tenen dret a vot) a les darreres eleccions era de 5.413.769 persones. Tal com haureu vist, la mostra és de 500 persones. Passat a percentatges, això vol dir que per saber l’opinió dels catalans es va preguntar a un 0,00009% dels catalans. O dit d’una altra manera, a 1 de cada 10.828 catalans.

E) Fem un càlcul fàcil per fer-nos-en una idea: sabeu quants alumnes hi ha a la vostra escola? Doncs imagineu-vos que es vol fer una enquesta per saber l’opinió dels alumnes de la vostra escola i calculeu a quants alumnes de l’escola els haurien demanat l’opinió si es seguís la mateixa proporció que a l’enquesta.

3. Quina qualitat té la mostra?

Reprenent l’exemple del primer apartat sobre la llei de l’avortament, una possible resposta a per què els resultats són tan diferents pot ser que dependrà de a qui se li faci la pregunta. Els sociòlegs saben bé que sovint la gent té punts de vista diferents depenent del lloc on viu i per exemple pensen diferent en molts temes la gent que viu a grans ciutats que la gent de poblacions rurals. O fins i tot dins d’una mateixa ciutat hi ha barris en què la gent comparteix idees diferents a les del barri del costat. Per tant, depenent d’on anem a preguntar és més probable que ens surti un resultat o un altre.

G) Ara imagineu que volem fer una enquesta per saber si als alumnes de la vostra classe els agrada més jugar a futbol, parlar amb els amics o llegir còmics en el seu temps lliure. Igual que es fa en les enquestes, del total d’alumnes n’agafarem només una mostra (per exemple 4 alumnes).

-Abans de fer-ho: fins a quin punt creieu que el resultat pot ser molt diferent depenent dels alumnes que trieu (pot, per exemple, arribar a ser totalment oposat?)?

-Ara ho farem malament expressament: a partir de la mateixa pregunta i fent bé els càlculs i la representació gràfica, intenteu aconseguir dues gràfiques sobre què pensen els alumnes del vostre curs que siguin el més diferents possibles.

-Pregunteu ara a tota la classe i feu el gràfic real de què pensa la totalitat d’alumnes. Compareu-lo amb els vostres resultats.

4. Diferents maneres de presentar unes mateixes dades

Aquestes gràfiques representen un creixement fictici de l’IPC (quant pugen els preus de les coses) de França i Itàlia durant 10 anys:

ipc

H) Compareu els dos creixements:

-En quin país les coses s’han posat més cares?

-Hi veieu alguna cosa que us cridi l’atenció? Potser mirar les mateixes dades però representades en forma de taula us pot ajudar:

ipc2

Aquest era un exemple fictici per demostrar com es poden manipular les gràfiques per fer que sembli una cosa o una altra. Aquest n’és un de real. Es tracta d’un fulletó en què un ajuntament presenta les dades de l’atur. Contraposen dues gràfiques per representar l’evolució de l’atur en dos períodes diferents: en vermell els anys en què governava el partit adversari i en blau els anys que ha governat el partit que fa el fulletó.

alcorcón

I) Si es mira només el gràfic, l’efecte que fa és que el “partit blau” ha fet baixar quasi bé tot l’atur que el “partit vermell” havia provocat. Però és així? On està la “trampa”? Podem dir que les gràfiques estiguin “mal fetes”?

J) Per comparar dues possibles representacions, feu una nova gràfica posant-ho tot a la mateixa escala. I, ja posats, una altra dada que pot ser interessant per complementar la gràfica és que el canvi de govern es va produir al 2011.

5. Manca de context

Un error habitual en la interpretació de les enquestes és no explicar el context de la situació estudiada. Veiem-ho amb un exemple. Imagineu que volem fer una notícia sobre quins són els carrers més perillosos d’una ciutat. Concretament volem saber si és més perillós (és a dir, si tenim més possibilitats de tenir un accident) passar pel carrer A o passar pel carrer B. Anem a la policia i demanem les dades de quants accidents hi ha hagut a cada carrer durant el darrer any. Ens diuen això:

Any 2014: Carrer A: 600 accidents / Carrer B: 15 accidents

A partir d’això podríem muntar la notícia amb una gràfica i un titular:

EL CARRER MÉS PERILLÓS

El carrer A té 40 vegades més d’accidents que el B

num accidents

K) És correcta la proporció del subtítol (“40 vegades més”)? Hi ha alguna cosa que us sembli incorrecta de la notícia?

L) Ara afegim-hi una altra dada: el número de cotxes que passen per un carrer i l’altre a l’any:

Carrer A: 600.000

Carrer B: 15.000

I torneu a respondre la pregunta de dalt: en quin carrer tenim més possibilitats de tenir un accident? Per què?

Creieu que podem dir que la gràfica ens enganya? Però la conclusió que treu el periodista és certa?

 6. Coincidència, correlació o causa-efecte?

Analitzar i creuar les dades de vegades ens pot ajudar a entendre millor la realitat i moltes vegades ha ajudat a fer descobriments molt importants. Un exemple clar és el cas del científic anglès John Snow, que al s. XIX va investigar les morts per còlera a la ciutat de Londres per intentar descobrir com es transmetia aquesta malaltia mortal. Va anar preguntant casa per casa quants casos havien patit i a sobre d’un plànol d’un barri va representar cada mort amb una línia a l’adreça on vivia:

snow cholera

Això li va permetre veure que hi havia un carrer (Broad Street) on hi havia molts morts, especialment en una casa. I va fixar-se que en aquell carrer hi havia un pou d’aigua (pump). Això li va fer pensar en una relació de causa-efecte entre el pou i la malaltia. Però va veure que també hi havia morts en altres cases que no eren a prop del pou. Va anar a preguntar-los i va resultar que els habitants d’aquelles cases passaven cada dia per Broad Street per anar a la feina o l’escola. Això li va permetre deduir que el focus de contagi era l’aigua d’aquell pou. Va recomanar que tanquessin aquell pou i quan ho van fer els casos van disminuir de cop. Es va demostrar, doncs, que hi havia una relació de causa-efecte entre els dos fenòmens.

Ara bé, que hi hagi una proporció en l’augment de dos variables vol dir sempre que hi hagi una relació de causa-efecte directa? Fixa’t en aquest altre exemple de correlació curiosa:

nobel i xocolata

Es tracta d’un gràfic on s’han creuat el nombre de premis Nobel que ha tingut un país i les dades de consum de xocolata d’aquell mateix país. Mirant el gràfic podem veure que hi ha una coincidència: els països que més nobels han guanyat són també els que consumeixen més xocolata. Fixa’t les interpretacions que se’n poden trobar a internet:

nobel1
nobel2
nobel3
nobel4
nobel5

a) Creieu que la corelació que hi ha entre les dues variables és casualitat o que hi ha una relació de causa-efecte? Quina?

 MÉS MATERIAL

Un altre exemple de diferents interpretacions a partir d’una mateixa enquesta:

http://www.vilaweb.cat/noticia/3991454/20120303/majoria-favorable-independencia-consolida-ceo.html

http://www.abc.es/20120302/espana/abci-catalanes-independencia-baja-201203021218.html

http://www.elsingular.cat/cat/notices/2012/03/la_independencia_ja_guanya_81755.php

http://elpais.com/diario/2011/06/30/espana/1309384810_850215.html

http://www.larazon.es/detalle_hemeroteca/noticias/LA_RAZON_439472/historico/6176-caen-los-partidarios-de-que-cataluna-sea-independiente#.Ttt1ENcvOqVDlpU

Alguns articles:

Com de fiables són realment les enquestes?

Matemàtiques creatives a les portades dels diaris

Storify sobre Sigma2, empresa d’enquestes

Podria ser que La Razón s’inventés les enquestes?

Un vídeo sobre enquestes mal fetes:

Un exemple flagrant de gràfica mal construïda:

enquesta el pais