lunes, 4 de enero de 2016

Estadística en los medios de comunicación


La estadística aparece frecuentemente en medios de comunicación. Son muy habituales en economía, deportes... Es importante saber interpretar correctamente las gráficas que nos encontramos para que no nos lleven a engaños. Además, también resulta conveniente consultar diferentes fuentes pues los resultados no tienen por qué coincidir. Esto pone de manifiesto la importancia de la selección de la población a estudiar.

Actualmente hemos vivido un proceso de elecciones. En todo el proceso previo y posterior se han empleado recursos estadísticos para mostrar a la población los resultados, intención de voto... Dar toda esa información de forma redactada es mucho más liosa y tediosa que con un simple gráfico.

Previo a las elecciones, diferentes medios realizan sus previsiones mediante encuestas realizadas a una determinada muestra de la población que debería ser lo más representativa posible. En la siguiente gráfica se puede observar una de las estimaciones que fue publicada en el diario "El País".



Con un simple gráfico podemos diferenciar por colores los diferentes partidos, los porcentajes de votos esperados y los escaños obtenidos por cada partido.

En el siguiente gráfico vemos la evolución con el tiempo del apoyo a cada partido:


El PP y el PSOE bajarían en número de votos desde el 2011 hasta el 2015. Podemos aumentaría desde su creación en 2014 hasta finales de año y bajaría en el inicio del 2015. Ciudadanos aumentaría desde enero de 2015, momento en el que dicen que se van a presentar a las elecciones generales.

Como ves, en un pequeño espacio se puede dar mucha información gracias a estos recursos.

Ahora veamos los resultados reales:


- ¿Cómo interpretas estos datos?
- Busca la estadística de los resultados en la liga de tu equipo de fútbol referido en los últimos 10 años.

Un repaso global

Vamos a repasar lo aprendido hasta ahora mediante un divertido juego.


En la siguiente aplicación vas a encontrar ejercicios relacionados con los contenidos vistos:



Selecciona a uno de los personajes y diviértete.




¡¡¡A jugar!!!

Medidas de tendencia central, media aritmética, mediana y moda.


Las medidas de tendencia central (media, moda y mediana), se calculan a partir de la tabla de frecuencias.

La MEDIA es el valor que se obtiene al sumar todos los datos y dividir el resultado entre el número total de datos.

La MODA es el valor que tiene mayor frecuencia absoluta. En una distribución puede haber una moda (unimodal), dos (bimodal), o más de dos (multimodal).

La MEDINA representa el valor de la variable que ocupa la posición central en un conjunto de datos ordenados. 

Veamos algún ejemplo: 

¿Recuerdas la tabla de las mascotas de clase? Vamos a calcular las medidas de tendencia central.




Para cada dato (peso, longitud, medidas de la cola, cuello, cintura, podemos calcular la media, moda, mediana).
vamos a calcular las medidas de tendencia central para el cuello.

MEDIA: (28+18+25+16+12+18)/6= 19,5 cm
MODA: 18 cm
MEDIANA: 18 cm

¡Inténtalo tu para la cola y la cintura!

Mas ejemplos en este vídeo




miércoles, 9 de diciembre de 2015

Histogramas, diagramas de barras y de sectores. Polígonos de frecuencias

Uno de los problemas más usuales de la estadística es la representación de los datos obtenidos. Este proceso no siempre es una tarea fácil, pero para dibujar los primeros gráficos tenemos que seguir unos pasos muy claros.

El primero de ellos es estudiar el tipo de variable: Si se trata de una variable cualitativa o cuantitativa, y dentro de ellas, si es nominal u ordinal ,o si por el contrario, es discreta o continua.

Cuando ya tenemos identificada la variable, el siguiente paso es observar qué gráficos son más convenientes para representarlos.

1. Para variables cualitativas:

1.1. Variables cualitativas nominales: La mejor forma de representar una variable de este tipo es utilizar un diagrama de barras, como el que vemos en esta imagen:



\includegraphics[angle=0, width=0.5\textwidth]{fig01-01.eps}


1.2. Variables cualitativas ordinales: Al igual que las variables cualitativas anteriores, la manera más recomendable de representar una variable cualitativa es el diagrama de barras. Vemos una imagen con este tipo: 





 1.3. Variables cuantitativas discretas. Al igual que las tres anteriores,  la mejor forma de representar las variables discretas es el diagrama de barras.


1.4. Variables cuantitativas ordinales. Este es el único caso en el que la forma más conveniente es un histograma. El histograma es un tipo de gráfico parecido al diagrama de barras, con la peculiaridad que en este caso, las barras o rectángulos describen un intervalo y no un número. Es decir, la base del rectángulo está entre dos cifras, como en esta imagen:





2. ¿Cómo construimos un diagrama de barras?
Imaginaros que queremos representar en un diagrama cómo es el estado civil de todas las personas que viven en nuestro edificio (variable cualitativa nominal).
PRIMER PASO: Formar los grupos
 Lo primero es tomar los datos, y hacer los grupos que nos podremos encontrar. En el caso del estado civil, las personas podrán estar solteras, casadas, divorciadas o viudas (podemos considerar más categorías, pero lo dejaremos en estas cuatro).
SEGUNDO PASO: Tomar los datos
Supongamos que, una vez que hemos preguntado a todas las personas del edificio, hemos obtenido los siguientes resultados: Hay 4 personas solteras, 6 personas casadas, 8 personas viudas y 2 personas divorciadas.
TERCER PASO: Dibujo de ejes
Para representar estos datos en un diagrama, podemos los grupos en el eje horizontal o de abscisas (eje X). Después, graduamos el eje vertical o de ordenadas (eje Y) con varios números. Podemos ir poniendo todos los números: 1, 2, 3, 4, 5, 6.... o poner sólo números pares, números impares, etc. En el caso de la imagen, se han ido poniendo todos los números pares. Da igual los números que pongamos siempre y cuando la distancia entre ellos sea igual, es decir, no podríamos mezclar números separados una unidad con números separados dos unidades o más.
Por ejemplo, esto no se podría hacer: 1,2,3,5,7,... (1,2 y 3 están separados entre sí una unidad, mientras que 3,5 y 7 están separados dos unidades).
CUARTO PASO: Representación de barras
Ahora, ya solo nos queda el último paso: Representar los datos. Para ello, construiremos rectángulos con unas medidas concretas. La anchura del rectángulo será la misma para los cuatro grupos (solteros, casados, viudos y divorciados). La altura será proporcional al número de personas de cada grupo.
Vamos a intentar considerar el caso de los solteros. Teníamos 4 personas. Pues ahora tendremos que dibujar un rectángulo cuya altura alcanzara las dos unidades del eje Y. El siguiente rectángulo, el de los casados, tendrá una altura de 6 unidades, igual que el número de personas.


3. ¿Cómo construimos un histograma?
En el siguiente vídeo vamos a estudiar la construcción de un histograma.
4. Representación de porcentajes
La mejor manera de representar porcentajes es mediante los diagramas de sectores. Para ello, tendremos que calcular previamente el porcentaje que ocupa cada grupo con respecto al total:


5. Polígono de frecuencias
El polígono de frecuencias es la línea de segmentos que une el punto medio de las sucesivas barras de un histograma.


Organización en tablas de datos recogidos en una experiencia.

Una encuesta es un procedimiento de investigación en la que vamos a obtener unos datos que tendremos que organizar.

¿Y cómo lo hacemos? 

En función de las preguntas que realicemos, haremos una tabla donde representaremos los datos.


Veamos un ejemplo. En la siguiente tabla analizamos determinadas características de los gatos que tienen de mascota los compañeros de clase.
Aquí podemos ver los resultados obtenidos.






Frecuencias Absoluta y Relativa


  • La FRECUENCIA ABSOLUTA de un dato estadístico es el número de veces que se repite ese dato y se representa por fi. Si sumamos todas las frecuencias absolutas obtendremos el número total de datos N.
igualdad

   Para indicar resumidamente estas sumas se utiliza la      letra griega Σ (sigma mayúscula) que se lee suma o        sumatoria.


igualdad
  • La FRECUENCIA RELATIVA de un dato estadístico es el cociente entre la frecuencia absoluta de ese dato y el número total de datos. Se representa por ni y se puede expresar en tantos por ciento. Si sumamos todas las frecuencias relativas obtendremos siempre la unidad.


frecuencia relativa

Ejemplo:

Esta profesora ha hecho una encuesta a veinte estudiantes de su clase.Fíjate en los datos de la encuesta:





Los números de la tabla son el resultado de realizar el recuento, son los datos estadísticos.






La FRECUENCIA ACUMULADA es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por Fi.

La FRECUENCIA RELATIVA ACUMULADA es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.







Variables cualitativas y cuantitativas

En este apartado vamos a definir algunas de las variables a las que nos enfrentamos en estadística. Fundamentalmente, hay dos tipos de variables: variables cuantitativas y cualitativas.

  • Las variables cuantitativas son las que se pueden expresar mediante número. Estas variables tienen la ventaja de que podemos hacer operaciones con ellas.
Por ejemplo: Notas de una clase ( un 7, un 10, un 9...),número de hermanos de mis amigos (2 hermanos, 1 hermano, ningún hermano, 5 hermanos...), las superficies de las casas de tu domicilio...

  • Las variables cualitativas, por el contrario, son aquellas que no se pueden expresar con números.
Por ejemplo: Color de ojos (azul, marrón, verde), estado civil (casado, soltero, divorciado,...), grupo sanguíneo(A, B, AB, 0...).



Las variables cualitativas y cuantitativas se dividen de nuevo en dos grupos. Las variables cualitativas pueden ser nominales u ordinales, mientras que las variables cuantitativas pueden ser discretas o continuas.

·Variables cuantitativas discretas: Son aquellas que se refieren a un grupo concreto de números.

Por ejemplo: el número de personas que vive en una casa. Podemos encontrarnos con 5 personas, 2 personas, 10 personas, 0 personas.... pero nunca podríamos decir "En una casa hay 3,5 personas". Número de ordenadores en una ciudad, número de animales en una granja...

·Variables cuantitativas continuas: Son aquellas que no se refieren a un número, como el caso de el número de individuos, sino que concentran multitud de datos en intervalos.

Por ejemplo: El tiempo que tarda una clase en hacer los 100 metros lisos, o la altura en centímetros de todos los alumnos de un instituto.