1. EducationMathStatistics Estatístiques i Histogrames
Quadre de treball d’estadístiques de maniquins amb pràctica en línia, segona edició

Deborah J. Rumsey

Un histograma és un gràfic de barres creat per a dades quantitatives. Com que les dades són numèriques, les dividiu en grups sense deixar cap espai entre si (de manera que les barres estan connectades). L'eix Y mostra o freqüències (comptes) o freqüències relatives (percentatges) de les dades que es troben en cada grup.

Com crear un histograma

Per fer un histograma, primer dividiu les dades en un nombre raonable de grups d’igual longitud. Calcular el nombre de valors del conjunt de dades que formen part de cada grup (és a dir, fer una taula de freqüències). Si un punt de dades cau al límit, prengueu la decisió sobre quin grup cal integrar-lo, assegureu-vos de mantenir-vos coherent (poseu-lo sempre a la part superior dels dos o poseu-lo sempre a la part inferior dels dos). Feu un gràfic de barres, utilitzant els grups i les seves freqüències: un histograma de freqüències.

Si es divideixen les freqüències per la mida total de la mostra, s'obté el percentatge que inclou a cada grup. Una taula que mostra els grups i els seus percentatges és una taula de freqüències relatives. L’histograma corresponent és un histograma de freqüència relativa.

Podeu utilitzar Minitab o un paquet de programari diferent per fer histogrames, o bé podeu fer els vostres histogrames a mà. De qualsevol forma, la vostra elecció d'amplades d'interval (anomenades papereres per paquets informàtics) pot ser diferent de la que es veu a les figures, cosa que va bé, sempre que la vostra sembli similar. I ho faran, sempre que no utilitzeu un nombre inusualment baix o alt de barres i les barres siguin d’igual amplada.

També podeu triar diferents punts d’inici / final per a cada interval, i això també va bé. Si us plau, assegureu-vos d’etiquetar-ho tot clarament perquè l’instructor pugui veure què estàs intentant fer. I sigueu coherents amb els valors que acaben just a la vora; poseu-los sempre a l’agrupament inferior, o poseu-los sempre a l’agrupament superior. Si teniu cap opció, podeu fer els vostres histogrames mitjançant un paquet informàtic com Minitab. Fa que la vostra tasca sigui molt més fàcil.

Vegeu el següent per obtenir un exemple d’elaboració dels dos tipus d’histogrames.

A la taula següent es mostren les puntuacions de les proves per a una classe de 30 estudiants.

Els histogrames de freqüència i els histogrames de freqüència relativa semblen iguals; Acaben de fer servir diferents escales de l'eix Y.

L'histograma de freqüència de les dades de puntuació es mostra a la figura següent.

histograma de freqüència

Trobeu les freqüències relatives prenent cada freqüència i dividint per 30 (la mida total de la mostra). Les freqüències relatives d’aquests tres grups són del 8/30 = 0,27 o 27%; 16/30 = 0,53 o 53%; i 6/30 = 0,20 o 20%, respectivament.

Un histograma basat en freqüències relatives s’assembla igual a l’histograma (de les mateixes dades). L’única diferència és l’etiqueta de l’eix Y.

El sentit dels histogrames

Un histograma us proporciona informació general sobre tres característiques principals de les vostres dades quantitatives (numèriques): la forma, el centre i la difusió.

La forma d’un histograma es mostra pel seu patró general. Molts patrons són possibles, i alguns són comuns, entre ells els següents:

  • En forma de campana: sembla una campana: un gran pes al mig i les cues que baixen a cada costat aproximadament al mateix ritme. (Figura a) Esqueixa a la dreta: una gran part de les dades es desvia a l'esquerra, amb algunes observacions més grans que es mostren a la dreta. (Figura b) Esquerra inclinada: una gran part de les dades es desvia a la dreta, amb algunes observacions més petites que es mostren a l'esquerra. (Figura c) Uniforme: totes les barres tenen una alçada similar. (Figura d) Bimodal: dos pics o (figura e) En forma d’U: Bimodal amb els dos cims a l’extrem baix i alt, amb menys dades al centre. (Veure la Figura 4-1 (Figura f) Simètrica: es veu igual a cada costat quan el dividiu pel centre; Els histogrames en forma de campana, uniformes i en forma d’U són tots exemples de dades simètriques. (Figures a, d i f)
patrons d'histograma comuns

Podeu veure el centre d’un histograma de dues maneres. El primer és el punt de l’eix x on el gràfic s’equilibra tenint en compte els valors reals de les dades. Aquest punt s’anomena mitjana, i el podeu trobar situant el punt d’equilibri (imagineu que les dades es troben en un teeter-totter). L'altra manera de veure el centre és localitzar la línia en l'histograma on el 50% de les dades es troben a banda i banda. La línia s'anomena mediana i representa el centre físic del conjunt de dades. Imagineu tallar l’histograma per la meitat de manera que la meitat de la zona es troba a banda i banda de la línia.

La difusió es refereix a la distància que hi ha entre les dades, en relació amb les altres o en relació amb algun punt central. Una forma crua de mesurar la propagació és trobar el rang o la distància entre el valor més gran i el valor més petit. Una altra manera és buscar la distància mitjana del centre, altrament coneguda com la desviació estàndard. La desviació estàndard és difícil només mirar un histograma, però podeu tenir una idea aproximada si adopteu el rang dividit per 6. Si les altures de les barres properes al centre semblen molt altes, això significa que la majoria els valors són propers a la mitjana, cosa que indica una petita desviació estàndard. Si les barres apareixen curtes, és possible que tingueu una desviació estàndard més gran.

Podeu fer estadístiques de resum reals per calcular les dades quantitatives, però un histograma us pot donar una direcció general per trobar aquestes fites. I, com els gràfics de taules i gràfics de barres, no tots els histogrames són justos, complets i precisos. Heu de saber què heu de buscar per avaluar-los.

Com endreçar les dades variades amb histogrames

Heu de fer consideracions especials per als conjunts de dades variades, quant a quines estadístiques són les més adequades per utilitzar i quan. També heu de ser conscients de com utilitzar estadístiques errònies pot proporcionar respostes enganyoses.

Podeu relacionar la mitjana i la mitjana per obtenir informació sobre la forma de les vostres dades. Tenir la mitjana i la mitjana a ser iguals crearà una forma aproximadament simètrica

La mitjana es veu afectada pels valors superiors a les dades, però la mitjana no ho és. Si la mitjana i la mitjana són properes les unes a les altres, les dades no es diferencien i probablement no continguin nivells superiors d’un costat o de l’altre. Això significa que les dades semblen iguals a cada costat del centre, que és la definició de dades simètriques (vegeu a, d o f a la figura precedent).

El fet que la mitjana i la proximitat mediana us indiqui que les dades són aproximadament simètriques es pot utilitzar en un tipus de pregunta de prova diferent. Suposem que algú us pregunta si les dades són simètriques i no teniu un histograma, però sí que teniu la mitjana i la mediana. Compareu els dos valors de la mitjana i la mitjana i, si són propers, les dades són simètriques. Si no ho són, les dades no són simètriques.

Com detectar un histograma enganyós

Un histograma es pot confondre amb els lectors de maneres que no són possibles amb un gràfic de barres. Recordeu que un histograma tracta de dades numèriques, no categòriques, cosa que significa que heu de determinar com voleu que les dades numèriques es desglossen en grups que es mostrin a l'eix horitzontal. I la manera de determinar aquestes agrupacions pot fer que el gràfic sembli molt diferent. Vigileu els histogrames que utilitzin escala per enganyar els lectors. Com en els gràfics de barres, podeu exagerar diferències mitjançant una escala més petita a l’eix vertical d’un histograma i podeu reduir les diferències mitjançant una escala més gran.