Documentos de Académico
Documentos de Profesional
Documentos de Cultura
“No se puede enseñar lo que no se sabe”, de eso estamos claro. Somos conscientes de que
sería un desastre impartir docencia de un tema que no dominamos. Por lo tanto, es
necesario adquirir las competencias propias del área de matemáticas para posteriormente,
enseñar de manera clara y coherente.
De hecho, en el currículo podemos leer que entre los aspectos a considerar en el perfil de
los maestros del nivel primario se hace énfasis en los conocimientos del contenido
curricular y por ello, debemos tener dominio sobre los temas que este comprende. En ese
sentido, podemos observar que dentro de las dimensiones del área de matemática de
primaria segundo ciclo se encuentra la estadística. Por lo que debemos tener buen dominio
sobre los cálculos estadísticos y todo lo relacionado a la recolección e interpretación de
datos.
Con este informe se espera abarcar los elementos mas importantes de la introducción a la
estadística, de igual manera, se confía en que a través del mismo se refleje un trabajo
autentico y bien elaborado que refleje los conocimientos adquiridos. De igual forma,
espero que el trabajo sea de gran agrado al público lector.
Introducción a la estadística descriptiva
Concepto de estadística
Origen
Romero y Zúnica (p.16) indican que problemas aparecidos en las áreas más dispares han
jugado papeles fundamentales motivando el desarrollo de la que hoy denominamos como
Estadística. Así:
El término Estadística, que se utilizó hasta el siglo XVIII como una abreviatura de la
ciencia descriptiva de los Estados, se identificó cada vez más, en el siglo XIX, con las
cifras cuantitativas. Hacia 1830, en Francia e Inglaterra, el término ya fue usado de forma
general como sinónimo de la ciencia numérica de la sociedad. Este cambio de significado
se debió a que, desde 1800, los gobiernos de Europa occidental y de Estados Unidos
comenzaron a recopilar y publicar sistemáticamente una gran cantidad de registros de
censos y de otros tipos de tablas.
Aunque a lo largo del siglo XIX la teoría de la probabilidad había sido desarrollada por
matemáticos tales como Jacob Bernoulli, Karl Friedrich Gauss y Pierre Simón Laplace,
su aplicación al estudio de hechos estadísticos fue casi inexistente, ya que la mayor parte
de los estadísticos sociales de la época se contentaban con dejar que los datos hablaran
por sí mis-mos. En particular, en esa época los estadísticos no estaban interesados en sacar
inferencias a partir de individuos, más bien se centraban en la sociedad en su totalidad.
Por consiguiente, no estaban preocupados por el muestreo, sino que intentaban obtener
censos de la población al completo. Como resultado, la inferencia probabilística sobre la
población a partir de muestras era prácticamente desconocida en las estadísticas sociales
del siglo XIX. No fue hasta finales de este siglo cuando los estadísticos empezaron a
preocuparse por inferir conclusiones a partir de los datos numéricos.
Importancia de la estadística
Es tan importante que casi no existe actividad humana en que no esté involucrada la
Estadística. Las decisiones más importantes de nuestra vida se toman con base en la
aplicación de la Estadística. Pongamos algunos ejemplos.
La estadística para su mejor estudio se ha dividido en dos ramas las cuales son: estadística
descriptiva y estadística inferencial.
Muestra representativa: Es una muestra que contiene las características más relevantes
de la población en la misma proporción que está incluida en esta.
Parámetros: Son medidas que ofrecen información sobre el centro de un conjunto de
datos (medidas de tendencia central), otras sobre la dispersión o variabilidad (medidas de
dispersión) y otras sobre la posición de un valor (medidas de posición como los
percentiles).
Experimento: Proceso o actividad llevada a cabo de forma intencional para obtener una
serie de datos o para ratificar o refutar una hipótesis.
Censo: El censo es el recuento de datos estadísticos sobre toda una población específica.
De ese modo, se pueden conocer sus características con precisión.
Datos experimentales: Representa conteos o revisiones (se representan mediante
números).
Ordenación de datos: Es una de las formas más sencillas de presentar los datos puede
ser de forma ascendente o descendente. La ordenación o arreglo de datos ofrece varias
ventajas con respecto a los datos. Por Ejemplo:
Una variable estadística es una característica de una muestra o población de datos que
puede adoptar diferentes valores.
También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300
dólares el último año. En este caso, la variable sería el beneficio y estaría medido en
dólares. Ambas variables son del tipo cuantitativo (se expresan con un número)
Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se
pueden (en principio) expresar en forma de número. Así, otra variable que podríamos
encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes
y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa.
Es decir, no se
Aunque hay decenas de tipos de variables estadísticas, por norma general podemos
encontrarnos dos tipos de variables:
Variable discreta: Toman un valor finito de valores entre un intervalo de datos. Número
de helados vendidos.
Variable cualitativa: Son variables que se expresan, por norma general, en palabras.
Variable ordinal: Expresa diferentes niveles y orden.
Para poder extraer conclusiones de las respuestas lo primero que tenemos que hacer es
recoger toda la información de una forma ordenada. Para ello se utiliza la Tabla de
Registros.
La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que
se presentan numéricamente las características de la distribución de un conjunto de datos
o muestra.
Es una tabla que muestra la distribución de los datos mediante sus frecuencias. Se utiliza
para variables cuantitativas o cualitativas ordinales. Las tablas de frecuencias son las que
organizan los datos para mostrar qué tan seguido ocurre algo (frecuencia), permite
organizar la información numérica recogida, por ejemplo, a través de una encuesta. Tanto
en las tablas como en los gráficos el número de veces que se repite un dato se denomina
frecuencia de ese dato.
Tipos de frecuencia:
* Número de Datos (n): Es la cantidad total de datos que hay en una distribución de
frecuencias
* Frecuencia Absoluta (f): Es el número de veces que cada variable aparece en una
distribución.
* Frecuencia Acumulada (fa): Es el resultado de copiar la primera frecuencia absoluta e
ir sumando las frecuencias absolutas posteriores.
Construya una tabla de frecuencia simple, incluyendo: frecuencia Absoluta (f), frecuencia
Acumulada (fa), frecuencia Relativa (fr) y frecuencia Porcentual (f%)
❖ Paso 1: ordenar
En la primera columna se ordenan de menor a mayor los diferentes valores que tiene la
variable en el conjunto de datos.
▪ Construcción de la tabla
Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos,
se debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando
la cantidad de datos cuyo valor está entre los extremos del intervalo.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos queramos establecer.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece
al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente
intervalo.
es la marca de clase que es el punto medio de cada intervalo.
Gráficos estadísticos
Los gráficos estadísticos son las distintas maneras de representar series de datos
estadísticos de diverso tipo y origen para mostrar de manera visual cómo evoluciona una
o más variables en comparación con otras. Por ejemplo, cómo ha evolucionado el precio
del carburante durante un año o el número de espectadores que recibe un cine y sus
elecciones por género cinematográfico durante una semana.
▪ Gráfico de barras
El título de la gráfica nos ayuda a saber cuál es la que información podemos encontrar en
la gráfica. El título de la gráfica se encuentra generalmente en la parte superior de la
misma. El título de nuestro ejemplo de gráfica de barras es Cereal favorito.
Los ejes son los dos lados de la gráfica. El eje vertical va de abajo para arriba. El eje
horizontal se extiende a lo largo de la parte inferior de la gráfica.
Las etiquetas de los ejes nos dicen la información que se presenta en cada eje. En nuestra
gráfica de ejemplo uno de los ejes es el tipo de Cereal. El otro es el número de votos.
La escala nos dice qué tanto o cuánto. En nuestro ejemplo, la escala utiliza los números
1, 2, 3.
La altura de la barra indica el valor de cada opción. En nuestro ejemplo, la altura de las
barras indica cuántas personas votaron por cada cereal.
Permite visualizar las partes de un todo a través de una circunferencia dividida en sectores
o porciones. Por ejemplo, el porcentaje de alumnos de una clase que realizan una
determinada actividad extraescolar: del 100 % de los alumnos, un 15 % juega al
baloncesto, un 10 % aprende programación, un 15 % estudia un idioma, un 40 % juega al
fútbol y el 20 % restante agrupa otras actividades.
A partir del punto inicial marcamos 83º + 55º = 138º que le corresponde a MSN. A partir
del punto inicial marcamos 83º+55º+55º = 193º para señalar la proporción que le
corresponde a Netscape. La proporción restante corresponde a la categoría de menor
importancia que en nuestro caso es Altavista. Siguiendo el procedimiento obtenemos la
gráfica de pastel que se muestra enseguida.
▪ Gráfico de líneas o diagrama de frecuencias
Este tipo de gráfico es similar al de barras —los datos se ordenan en base a los ejes
cartesianos— y es útil para observar la evolución de una variable. Por ejemplo: cómo ha
variado la temperatura mínima y máxima durante una semana. En uno de los ejes
tendremos la temperatura y en otro los días de la semana. Se marcan los valores de la
temperatura mínima y se unen con una línea mostrando la oscilación; con otro color se
representa de igual forma la temperatura máxima. De un vistazo, el lector puede ver cómo
han oscilado ambas variables en un periodo de siete días.
Paso 1: ¿Cuáles son los datos que se van a analizar? ¿Los tienes? Si es así, perfecto,
vamos al paso 2. Si no, procedemos a capturar los datos del fenómeno que se desea
analizar.
Paso 2: Cuando hablamos de clases o intervalos nos referimos a las barras verticales que
tendrá nuestro histograma. Normalmente se dice que un histograma debe tener barras del
mismo ancho, lo cual no es necesariamente cierto. Dependiendo de la situación que se
analiza, es más conveniente utilizar intervalos de diferente ancho.
Cuando los intervalos son del mismo ancho, la altura de cada barra será proporcional a su
área. Caso contrario cuando tenemos intervalos de ancho distinto, y en este caso resulta
conveniente analizar el área de la barra.
Paso 3: Existen diversas formas para definir cuántas clases considerar. K es el número de
clases.
La primera es considerar una tabla guía. La siguiente está basada en la publicación de
Roberto Behar y Pere Grima (abajo te dejo la referencia).
Otras referencias sugieren 4 clases si tenemos menos de 50 datos, 7 clases para menos de
100 datos, 10 clases para menos de 150 datos, 12 clases para menos de 200 datos y 14
clases para más de 200 datos.
Otra opción es la regla de Sturges. Propuesta por Hébert Sturges, nos da una regla práctica
para obtener el número de clases:
Hay otras formas, pero estas son las más difundidas. ¿Qué opción elegir? Como regla
general considera que, a mayor número de datos, más clases tendremos.
Lo realmente importante es la forma que va a tomar nuestro histograma, así que lo más
recomendable es que vayas probando con cada una de las opciones buscando la que te
permita hacer un mejor análisis final.
Paso 4: Determina la amplitud de clase o ancho del intervalo. Se define con la letra h.
Para ello divide el rango entre el número de clases definido en el paso 3. Si obtienes un
número decimal, redondea al entero más cercano. ¿Por qué? Porque la información debe
ser fácil de interpretar.
Tu primer intervalo será: [10 – 15], el segundo (15, 20], y así sucesivamente.
Si te encuentras con un dato que coincide con el límite de clase, como por ejemplo «15»,
simplemente define un criterio para todos los intervalos de clase. Define si se ubica en el
intervalo actual o el intervalo siguiente.
Por ejemplo, nosotros definimos que el primer intervalo sea todos los números mayores
o iguales a 10 y menores e iguales a 15. En consecuencia, el segundo intervalo será todos
los números mayores a 15 y menores iguales a 20.
Paso 6: Tabula los datos con base en los intervalos de clase definidos. En otras palabras,
agrupa los datos según su pertenencia a cada clase. Esto te dará la frecuencia de cada
clase.
Según la amplitud del intervalo, será el ancho de la barra. El paso a paso que venimos
tratando es para intervalos de clase del mismo ancho.
El punto de partida son también los ejes cartesianos que muestran todos los valores de la
variable dependiente y de la independiente, o de dos variables para comprobar si existe
relación. El resultado suele ser una nube de puntos que muestra una dispersión o una
concentración y ayuda a los estadistas a determinar la relación o no entre las variables.
Estas representaciones gráficas permiten combinaciones diversas, por ejemplo,
representar unas variables en barras y otras en línea, siempre que el tipo de datos a
representar lo permita.
Paso 3: Recolecta los datos de las variables: Si ya los tienes, perfecto. Si no, definimos
un período de tiempo para conseguir los datos de las variables antes definidas. Recuerda
que los datos de las dos variables deben estar dados en el mismo período de tiempo.
Paso 4: Ubica los valores en el eje respectivo. Por lo general, la variable independiente
es aquella que no está influenciada por la otra y se ubica en el eje x. La variable
dependiente que es la que se ve afectada por la otra variable se ubica en el eje y. Así pues,
procedemos a ubicar los valores en el plano cartesiano de acuerdo a su variable (x, y)
▪ Pictogramas
Otra variación son los pictogramas, gráficos donde las barras o las líneas se sustituyen
por dibujos que muestran la temática de los datos que se están expresando en los gráficos:
si se representa la variación del precio de distintas frutas, el pictograma puede elaborarse
con dibujos de esas frutas.
-Elige la fuente de los datos que va a representar tu pictograma. Puedes reunir tus propios
datos entrevistando personas, o contando elementos, o también puedes usar datos que
haya reunido otra persona.
-Haz una lista de todos los datos que reuniste. Compila en una lista todos los datos y
números que obtuviste.
-Revisa tus números. Asegúrate de haber reunido suficiente información como para
responder la pregunta o mostrar la información que quieras representar a través del
pictograma. Si vas a reunir información acerca de distintos estados, asegúrate de obtener
datos de muchos estados diferentes para poder representar tus datos con mayor exactitud
-Asígnale un valor a cada símbolo. Establece el valor numérico que va a representar cada
imagen en particular. Una buena idea es usar números enteros como 10, 100 o 1.000.
-Haz que tus datos coincidan con los símbolos. Revisa la lista de datos y determina qué
imágenes necesitas para representar cada grupo de datos. Escribe una nota indicando qué
vas a dibujar para cada dato que reuniste. Si sabes que en Georgia cosecharon 7,5 millones
de nueces, entonces podrías dibujar 7 nueces y media.
-Decide si vas a dibujar el pictograma o imprimirlo desde una computadora. Puedes hacer
pictogramas con la ayuda de programas de computadora como, por ejemplo, Excel.
-Dibuja los ejes del gráfico y etiquétalos. Los pictogramas son un tipo de gráfico y tienen
etiquetas a los costados y en la parte de abajo para indicar qué es lo que representan. Los
ejes del gráfico son las dos líneas (una vertical y la otra horizontal) que sirve como barrera
o margen del gráfico.
-Dibuja símbolos en el pictograma. Utiliza la tabla de datos que creaste y completa cada
categoría de datos con imágenes.
Debajo de cada columna de imágenes, escribe la fuente de los datos. Para cada estado
donde se cosecharon nueces, debes escribir el nombre del estado debajo de las imágenes.
Paso 5: Incluye referencias para el pictograma.
Son medidas estadísticas que se usan para describir como se puede resumir la localización
de los datos. Ubican e identifican el punto alrededor del cual se centran los datos. Las
medidas de tendencia central nos indican hacia donde se inclinan o se agrupan más los
datos. Las más utilizadas son: la media, la mediana y la moda.
2. Sirve como un método para comparar o interpretar cualquier valor en relación con el
puntaje central o típico.
3. Sirve como un método para comparar el valor adquirido por una misma variable en dos
diferentes ocasiones.
4. Sirve como un método para comparar los resultados medios obtenidos por dos o más
grupos.
La media
Donde
∑: signo de sumatoria.
Ejemplo de cómo se emplea la media o promedio con el siguiente ejemplo para datos no
agrupados:
70 90 95 74 58 70 98 72 75 85 95 74 80 85 90 65 90 75 90 69
La media para datos agrupados, ejemplo: Ejemplo: Para los gastos diarios en periódicos
del hotel agrupados en una tabla de frecuencia:
Propiedades de la Media:
1ª) La suma de las desviaciones de los valores o datos de una variable X, respecto
Ventajas e inconvenientes:
- Es única.
La Mediana
a) Por ejemplo, se tiene una muestra de tamaño 5 con los siguientes valores: 46, 54, 42,
48 y 32.
Como la cantidad de datos es impar (5 datos), la mediana es el valor del dato que se
encuentra ubicado en la posición (5+1)÷2=3, la mediana es: Me = 46.
b) Se ha obtenido una muestra con los valores de datos: 27, 25, 27, 30, 20 y 26.
Como el número de datos es par (6), la mediana es el promedio de los datos que se
encuentran en las posiciones (6+1) ÷1 = 3.5. Por lo tanto, la mediana es:
Donde:
n: tamaño de la muestra.
Para identificar la clase mediana se divide n/2 y la primera clase que contenga una
frecuencia acumulada mayor que n/2.
n = 32, entonces n/2 = 32/2 = 16. Buscar la primera frecuencia acumulada mayor que 16,
esa será la clase mediana.
Me = 6.95 + 0.79
Me = 7.75 ≈ 7.8
Ventajas e inconvenientes:
- Es fácil de calcular.
- En la mediana solo influyen los valores centrales y es insensible a los valores extremos
u “outlets”.
La Moda (Mo)
La moda es el dato que más se repite o el dato que ocurre con mayor frecuencia. Un grupo
de datos puede no tener moda, tener una moda (unimodal), dos modas (bimodal) o más
de dos modas (multimodal).
a) Se tiene una muestra con valores 20, 23, 24, 25, 25, 26 y 30.
Mo = 25 es unimodal
b) Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.
c) Se tiene una muestra con valores 20, 23, 24, 25, 25, 26, 30 y 30.
i es el intervalo de clase. La clase modal es aquella que contiene la mayor frecuencia absoluta.
d1 = 9 – 4 = 4
d2 = 9 – 7 = 2
Mo = 6.95 + 0.59
Mo = 7.55 ≈ 7.6
Ventajas e inconvenientes:
- Su cálculo es sencillo.
- Es de fácil interpretación.
de tipo cualitativo.
-Desde los tiempos más remotos siempre ha existido la necesidad de recolectar y analizar
datos. Las civilizaciones antiguas, como Egipto y Grecia, acudían a la estadística para
realizar censos. Del mismo modo, en la edad media se realizaban registros de
nacimientos, matrimonios y muertes.
Las variables son características de interés de los miembros de una población que toma
diferentes valores. Estas pueden ser cualitativas y cuantitativas. Dentro del primer grupo
encontramos las ordinales y nominales y dentro del segundo están las discretas y
continuas.
-Existen diferentes tipos de gráficos que nos permiten representar los datos estadísticos
mediante un organizador o imagen en donde se resumen los resultados arrojados en el
análisis de datos. Los principales gráficos son: de barra, de pastel, pictograma, de
frecuencia y de dispersión.
-Las medidas de tendencia central son tres: media, mediana y moda. La media es el valor
obtenido al sumar todos los datos y dividir el resultado entre el numero total de los datos.
La moda es el elemento que mas re repite; en un conjunto de datos puede haber más de
una moda, pero también puede que no existe ninguna. Por último, la mediana es el valor
de la variable que ocupa la posición central en un conjunto de datos ordenados.
Bibliografía
https://www.aulafacil.com/cursos/matematicas-primaria/matematicas-
cuartoprimaria/la-estadistica-l7678
Tablas de frecuencia y marcas de clase. (2020, January 13). Retrieved April 8, 2020,
from https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descripti
va/tablas-de-frecuencia.html
comunicacion/revista/graficos-estadisticos/
un-pictograma