Está en la página 1de 39

Introducción

“No se puede enseñar lo que no se sabe”, de eso estamos claro. Somos conscientes de que
sería un desastre impartir docencia de un tema que no dominamos. Por lo tanto, es
necesario adquirir las competencias propias del área de matemáticas para posteriormente,
enseñar de manera clara y coherente.

De hecho, en el currículo podemos leer que entre los aspectos a considerar en el perfil de
los maestros del nivel primario se hace énfasis en los conocimientos del contenido
curricular y por ello, debemos tener dominio sobre los temas que este comprende. En ese
sentido, podemos observar que dentro de las dimensiones del área de matemática de
primaria segundo ciclo se encuentra la estadística. Por lo que debemos tener buen dominio
sobre los cálculos estadísticos y todo lo relacionado a la recolección e interpretación de
datos.

En ese sentido, el presente material consiste en un informe de investigación sobre


elementos propios de la estadística. El propósito del mismo es indagar y aprender sobre
los componentes señalados en la tercera unidad de Matemática V, impartida por el
docente Alejandro Taveras. Esto con la finalidad de adquirir las siguientes competencias:
“Reconocer la importancia de la estadística aplicada en la educación” y “aplicar las
definiciones de los elementos estadísticos para resolver problemas de la vida cotidiana.”

Los contenidos que se van a trabajar son:

➢ Concepto, origen e importancia de la Estadística.


➢ Clasificación de la estadística.
➢ Conceptos básicos de estadística: población, muestra, censo, datos…
➢ Variables estadísticas y su clasificación
➢ Tablas de distribución de frecuencia para datos simples y agrupados.
➢ Gráficos estadísticos: clasificación, construcción t análisis.
➢ Medidas de tendencia central para datos simples y agrupados: media aritmética,
moda y mediana.

Con este informe se espera abarcar los elementos mas importantes de la introducción a la
estadística, de igual manera, se confía en que a través del mismo se refleje un trabajo
autentico y bien elaborado que refleje los conocimientos adquiridos. De igual forma,
espero que el trabajo sea de gran agrado al público lector.
Introducción a la estadística descriptiva

Concepto de estadística

La estadística es una disciplina científica que se ocupa


de la obtención, orden y análisis de un conjunto de
datos con el fin de obtener explicaciones y
predicciones sobre fenómenos observados. De otra
manera, se puede decir que la estadística es una
ciencia (un conjunto de técnicas) que se utiliza para manejar un volumen elevado de datos
y poder extraer conclusiones.

Origen

El origen de la palabra estadística se suele atribuir al economista


Gottfried Achenwall (prusiano, 1719-1772) que entendía la estadística
como “ciencia de las cosas que pertenecen al Estado”.

Conviene saber que la estadística NO es una rama de las matemáticas.


Utiliza herramientas de las matemáticas del mismo modo que lo hace
la física, la ingeniería o la economía, pero eso no las hace ser parte de
las matemáticas. Es cierto que tienen una relación estrecha, pero la estadística y las
matemáticas son disciplinas diferentes.

La historia de la estadística es bastante extensa. Se


conoce del uso de herramientas cuantitativas para el
tratamiento de datos en antiguas civilizaciones como
la egipcia, ya hace más de 5000 años, en donde se
empleaban en toda clase de censos.
También en La Biblia, en el Antiguo
Testamento, se menciona la realización de
censos. Además, se sabe que, en las
Antiguas China y Grecia, así como en el
Imperio Romano se hacían censos con
distintos fines: militares, tributarios y
sociales.

En la edad media en Europa se llevaban registros de nacimientos, muertes y matrimonios


y durante la época colonial en el nuevo continente se registraban datos sobre la población
y riquezas de los territorios conquistados. El constante uso de estas herramientas dio
origen al término estadística, que se refería a la información socioeconómica o a los datos
demográficos de los estados.

Romero y Zúnica (p.16) indican que problemas aparecidos en las áreas más dispares han
jugado papeles fundamentales motivando el desarrollo de la que hoy denominamos como
Estadística. Así:

▪ Las necesidades económicas y militares de los Estados incitaron, desde tiempos


muy remotos, la realización por éstos de censos de su población y de sus riquezas.
▪ Las piraterías berberiscas en el Mediterráneo motivaron el desarrollo de los
seguros marítimos, con sus problemas asociados de evaluación de riesgos.
▪ El gran interés por los juegos de azar motivó, sobre todo a partir del siglo XVII,
el desarrollo teórico del Cálculo de Probabilidades.
▪ La Teoría de Errores se desarrolló inicialmente en conexión con problemas
aparecidos en el área de la Astronomía.
▪ La Teoría de la Correlación surgió en el contexto del estudio de problemas
biológicos.
▪ La teoría del Análisis Factorial aparece en el campo de la Psicología.
▪ La de los Tests Guidos en el de la Sociología.
▪ La del Diseño de Experimentos en el de las Ciencias Agronómicas.
▪ La del Análisis de series temporales se desarrolla especialmente en el de la
Economía y Meteorología.
Podemos afirmar, en definitiva, que rara es el área del conocimiento humano que no haya
contribuido con su problemática al desarrollo de la Ciencia Estadística y que no se haya,
a su vez, aprovechado de dicho desarrollo.

De acuerdo con Ross (p.9):

El término Estadística, que se utilizó hasta el siglo XVIII como una abreviatura de la
ciencia descriptiva de los Estados, se identificó cada vez más, en el siglo XIX, con las
cifras cuantitativas. Hacia 1830, en Francia e Inglaterra, el término ya fue usado de forma
general como sinónimo de la ciencia numérica de la sociedad. Este cambio de significado
se debió a que, desde 1800, los gobiernos de Europa occidental y de Estados Unidos
comenzaron a recopilar y publicar sistemáticamente una gran cantidad de registros de
censos y de otros tipos de tablas.

Aunque a lo largo del siglo XIX la teoría de la probabilidad había sido desarrollada por
matemáticos tales como Jacob Bernoulli, Karl Friedrich Gauss y Pierre Simón Laplace,
su aplicación al estudio de hechos estadísticos fue casi inexistente, ya que la mayor parte
de los estadísticos sociales de la época se contentaban con dejar que los datos hablaran
por sí mis-mos. En particular, en esa época los estadísticos no estaban interesados en sacar
inferencias a partir de individuos, más bien se centraban en la sociedad en su totalidad.
Por consiguiente, no estaban preocupados por el muestreo, sino que intentaban obtener
censos de la población al completo. Como resultado, la inferencia probabilística sobre la
población a partir de muestras era prácticamente desconocida en las estadísticas sociales
del siglo XIX. No fue hasta finales de este siglo cuando los estadísticos empezaron a
preocuparse por inferir conclusiones a partir de los datos numéricos.
Importancia de la estadística

La estadística resulta fundamental para conocer el comportamiento de ciertos eventos,


por lo que ha adquirido un papel clave en la investigación. Se usa como un valioso auxiliar
y en los diferentes campos del conocimiento y en las variadas ciencias. Es un lenguaje
que permite comunicar información basada en datos cuantitativos.

Es tan importante que casi no existe actividad humana en que no esté involucrada la
Estadística. Las decisiones más importantes de nuestra vida se toman con base en la
aplicación de la Estadística. Pongamos algunos ejemplos.

La estadística es de gran importancia en la investigación científica debido a que:

• Permite una descripción más exacta.

• Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro pensar.

• Permite resumir los resultados de manera significativa y cómoda.

• Nos permite deducir conclusiones generales.

La evolución de la estadística ha llegado al punto en que su proyección se percibe en casi


todas las áreas de trabajo. También abarca la recolección, presentación y caracterización
de información para ayudar tanto en el análisis e interpretación de datos como en el
proceso de la toma de decisiones. La estadística es parte esencial de la forma profesional,
es hasta cierto punto una parte necesaria para toda profesión.
Clasificación de la estadística

La estadística para su mejor estudio se ha dividido en dos ramas las cuales son: estadística
descriptiva y estadística inferencial.

Estadística descriptiva: Consiste en la presentación de datos en forma de tablas y


gráficas. Esta comprende cualquier actividad para resumir o describir los mismos factores
pertinentes adicionales, esto se refiere a no intentar nada que vaya más allá de los datos.

Estadística inferencial: Se deriva de las observaciones hechas solo a una parte de un


conjunto numeroso de elementos; implicando así que su análisis requiera de
generalizaciones que van más allá de los datos, como consecuencia la característica más
importante del crecimiento de la estadística ha sido un cambio en el énfasis de los métodos
que sirven para generalizarlas. En otras palabras, la estadística inferencial investiga y
analiza una población partiendo de una muestra tomada.
Conceptos básicos de estadística

Los principales elementos de la estadística son:

Población: Grupo de individuos que presenta o podría presentar un rasgo característico


común que se desea investigar.

Muestra: Es un subgrupo de datos extraídos de una población que debe representar


adecuadamente la totalidad del grupo.

Muestra representativa: Es una muestra que contiene las características más relevantes
de la población en la misma proporción que está incluida en esta.
Parámetros: Son medidas que ofrecen información sobre el centro de un conjunto de
datos (medidas de tendencia central), otras sobre la dispersión o variabilidad (medidas de
dispersión) y otras sobre la posición de un valor (medidas de posición como los
percentiles).

Experimento: Proceso o actividad llevada a cabo de forma intencional para obtener una
serie de datos o para ratificar o refutar una hipótesis.

Variable: La característica o cualidad de una muestra o población a la cual se le puede


asignar un valor.

Censo: El censo es el recuento de datos estadísticos sobre toda una población específica.
De ese modo, se pueden conocer sus características con precisión.
Datos experimentales: Representa conteos o revisiones (se representan mediante
números).

Datos críticos: Se obtienen de acuerdo a un criterio o característica (color, brillo,


acabado, textura).

Ordenación de datos: Es una de las formas más sencillas de presentar los datos puede
ser de forma ascendente o descendente. La ordenación o arreglo de datos ofrece varias
ventajas con respecto a los datos. Por Ejemplo:

▪ Podemos nombrar rápidamente dos valores (mayor y menor de los datos).

▪ Podemos fácilmente dividir los datos en secciones.

▪ Podemos ver si alguno de los valores aparece más de una vez en el


ordenamiento.

▪ Podemos observar la distancia entre los valores sucesivos de los datos.


Variables estadísticas

Una variable estadística es una característica de una muestra o población de datos que
puede adoptar diferentes valores.

Cuando hablamos de variable estadística estamos hablando de una cualidad que,


generalmente adopta forma numérica. Por ejemplo, la altura de Juan es de 180
centímetros. La variable estadística es la altura y está medida en centímetros.

También podríamos, por ejemplo, decir que el beneficio de una empresa ha sido de 22.300
dólares el último año. En este caso, la variable sería el beneficio y estaría medido en
dólares. Ambas variables son del tipo cuantitativo (se expresan con un número)

Claro que no todas las variables estadísticas son iguales y, por supuesto, no todas se
pueden (en principio) expresar en forma de número. Así, otra variable que podríamos
encontrarnos es el color de ojos de una persona. Por ejemplo, Juan tiene los ojos verdes
y Andrés los tiene azules. La variable sería el color de ojos y sería una variable cualitativa.
Es decir, no se
Aunque hay decenas de tipos de variables estadísticas, por norma general podemos
encontrarnos dos tipos de variables:

Variable cuantitativa: Son variables que se expresan numéricamente.

Variable continua: Toman un valor infinito de valores entre un intervalo de datos. El


tiempo que tarda un corredor en completar los 100 metros lisos.

Variable discreta: Toman un valor finito de valores entre un intervalo de datos. Número
de helados vendidos.

Variable cualitativa: Son variables que se expresan, por norma general, en palabras.
Variable ordinal: Expresa diferentes niveles y orden.

Variable nominal: Expresa un nombre claramente diferenciado. Por ejemplo, el color de


ojos puede ser azul, negro, castaño, verde, etc.
Tablas de distribución de frecuencias para datos simple y agrupados

Para poder extraer conclusiones de las respuestas lo primero que tenemos que hacer es
recoger toda la información de una forma ordenada. Para ello se utiliza la Tabla de
Registros.

La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que
se presentan numéricamente las características de la distribución de un conjunto de datos
o muestra.

Tabla de frecuencia para datos simples

Es una tabla que muestra la distribución de los datos mediante sus frecuencias. Se utiliza
para variables cuantitativas o cualitativas ordinales. Las tablas de frecuencias son las que
organizan los datos para mostrar qué tan seguido ocurre algo (frecuencia), permite
organizar la información numérica recogida, por ejemplo, a través de una encuesta. Tanto
en las tablas como en los gráficos el número de veces que se repite un dato se denomina
frecuencia de ese dato.

Tipos de frecuencia:

* Número de Datos (n): Es la cantidad total de datos que hay en una distribución de
frecuencias

* Frecuencia Absoluta (f): Es el número de veces que cada variable aparece en una
distribución.
* Frecuencia Acumulada (fa): Es el resultado de copiar la primera frecuencia absoluta e
ir sumando las frecuencias absolutas posteriores.

* Frecuencia Relativa (fr): Es el cociente entre la frecuencia absoluta y el número de


datos. (fr=f/n)

* Frecuencia Porcentual (f%): Es el producto de la frecuencia relativa con 100.


(f%=fr*100)

Ejemplo: Al realizar una prueba de Matemática a un grupo de 30 estudiantes se obtienen


los siguientes resultados.

Construya una tabla de frecuencia simple, incluyendo: frecuencia Absoluta (f), frecuencia
Acumulada (fa), frecuencia Relativa (fr) y frecuencia Porcentual (f%)

❖ Paso 1: ordenar

❖ Paso 2: se elabora la tabla con la columna variable y f absoluta


❖ Paso 3: frecuencia absoluta

❖ Paso 4: frecuencia relativa

❖ Paso 5: frecuencia porcentual

En la primera columna se ordenan de menor a mayor los diferentes valores que tiene la
variable en el conjunto de datos.

1. En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas


y las frecuencias absolutas acumuladas.
2. Las columnas cuarta y quinta contienen las frecuencias relativas y las frecuencias
relativas acumuladas.
3. Adicionalmente se pueden incluir dos columnas (sexta y séptima), representando
la frecuencia relativa y la frecuencia relativa acumulada como tanto por cien.
Estos porcentajes se obtienen multiplicando las dos frecuencias por cien.

Tabla de frecuencia para datos agrupados

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las


variables toman un número grande de valores o la variable es continua. Se agrupan los
valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se
le asigna su frecuencia correspondiente. Límites de la clase.

▪ Construcción de la tabla

Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos,
se debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando
la cantidad de datos cuyo valor está entre los extremos del intervalo.

1º Se localizan los valores menor y mayor de la distribución. En este caso son y .

2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos queramos establecer.

Es conveniente que el número de intervalos oscile entre y .

En este caso, , incrementamos el número hasta


, intervalos.

Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece
al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente
intervalo.
es la marca de clase que es el punto medio de cada intervalo.

Gráficos estadísticos

Los gráficos estadísticos son las distintas maneras de representar series de datos
estadísticos de diverso tipo y origen para mostrar de manera visual cómo evoluciona una
o más variables en comparación con otras. Por ejemplo, cómo ha evolucionado el precio
del carburante durante un año o el número de espectadores que recibe un cine y sus
elecciones por género cinematográfico durante una semana.

Los gráficos estadísticos son potentes herramientas para la visualización de datos


que permiten representar de manera accesible información compleja. Consiguen
presentar la información al usuario o lector de manera clara y precisa, facilitando la
comparación y la comprensión de la evolución de distintas variables.
Además, pueden adaptarse al nivel del público al que van dirigido, convirtiéndolos en una
vía de gran utilidad para ofrecer información clara a cualquier persona: desde los lectores
de periódicos y revistas, hasta estudiantes, docentes, divulgadores científicos o directivos
de compañías que desean mostrar el avance de su negocio.

Clasificación de los gráficos estadísticos

▪ Gráfico de barras

Se utilizan para mostrar la evolución o comportamiento de una variable en el tiempo. Se


compone en un sistema de coordenadas de ejes cartesianos —eje X y eje Y— en el que
barras rectangulares horizontales o verticales representan gráficamente la variable
elegida. Este tipo de gráfico es habitual para representar, por ejemplo, los ingresos de una
compañía por trimestres de actividad o la evolución del PIB de un país bien sea anual,
semestral, trimestral… Permite introducir diversas variables y observar su evolución
paralela a lo largo del mismo período de tiempo: en uno de los ejes se establece el tiempo
y el otro se levantan las barras marcando el valor que corresponde a la variable.

¿Como se construye un gráfico de barras y como se analiza?

El título de la gráfica nos ayuda a saber cuál es la que información podemos encontrar en
la gráfica. El título de la gráfica se encuentra generalmente en la parte superior de la
misma. El título de nuestro ejemplo de gráfica de barras es Cereal favorito.

Los ejes son los dos lados de la gráfica. El eje vertical va de abajo para arriba. El eje
horizontal se extiende a lo largo de la parte inferior de la gráfica.

Las etiquetas de los ejes nos dicen la información que se presenta en cada eje. En nuestra
gráfica de ejemplo uno de los ejes es el tipo de Cereal. El otro es el número de votos.
La escala nos dice qué tanto o cuánto. En nuestro ejemplo, la escala utiliza los números
1, 2, 3.

La altura de la barra indica el valor de cada opción. En nuestro ejemplo, la altura de las
barras indica cuántas personas votaron por cada cereal.

▪ Gráfico de tarta o diagrama de sectores

Permite visualizar las partes de un todo a través de una circunferencia dividida en sectores
o porciones. Por ejemplo, el porcentaje de alumnos de una clase que realizan una
determinada actividad extraescolar: del 100 % de los alumnos, un 15 % juega al
baloncesto, un 10 % aprende programación, un 15 % estudia un idioma, un 40 % juega al
fútbol y el 20 % restante agrupa otras actividades.

¿Como se construye y se analiza?


Así como casi todos los tipos de gráficas, la de pastel se puede elaborar fácilmente con el
uso de software de uso general o especializado. Sin embargo, revisemos la forma de
construir una gráfica en forma manual.

Por ejemplo, suponga que se desea


representar con una gráfica de pastel los
datos que se muestran en la siguiente
Tabla, que se refieren a las preferencias
del buscador en Internet, que usan de un
grupo de estudiantes.

A la Tabla se le añade la columna correspondiente a la frecuencia relativa, es decir la


proporción de estudiantes que corresponde a cada categoría.

Se añade la columna de porcentajes simplemente multiplicando las frecuencias relativas


o proporciones por 100.

A fin de determinar cuántos grados le corresponden a cada categoría multiplicamos la


frecuencia relativa por 360 (ya que un círculo tiene 360°)
Se sabe que los lectores normalmente empiezan a leer la gráfica iniciando en la posición de las
doce horas y siguiendo el sentido de las manecillas del reloj. Entonces la categoría más
importante se debe de colocar extendiéndose en este sentido. El resto de las categorías se
colocan a partir de la posición de las doce horas en el sentido contrario a las manecillas del reloj,
empezando por la siguiente categoría con mayor proporción, así sucesivamente hasta terminar
con la categoría con menor proporción. Con esta forma de distribuir las categorías en el círculo,
la menos frecuente aparecerá cerca de la parte inferior de la gráfica, es decir, en la posición
menos importante.

Sobre un círculo y siguiendo las recomendaciones anteriores, colocamos el punto inicial


en la posición de las doce horas. A partir del punto inicial indicamos la categoría Google
marcando 138º con la ayuda de un transportador en sentido de las manecillas del reloj.
En seguida a partir del punto inicial marcamos 83º en sentido contrario a las manecillas
del reloj, que es la proporción que le corresponde a Yahoo!

A partir del punto inicial marcamos 83º + 55º = 138º que le corresponde a MSN. A partir
del punto inicial marcamos 83º+55º+55º = 193º para señalar la proporción que le
corresponde a Netscape. La proporción restante corresponde a la categoría de menor
importancia que en nuestro caso es Altavista. Siguiendo el procedimiento obtenemos la
gráfica de pastel que se muestra enseguida.
▪ Gráfico de líneas o diagrama de frecuencias

Este tipo de gráfico es similar al de barras —los datos se ordenan en base a los ejes
cartesianos— y es útil para observar la evolución de una variable. Por ejemplo: cómo ha
variado la temperatura mínima y máxima durante una semana. En uno de los ejes
tendremos la temperatura y en otro los días de la semana. Se marcan los valores de la
temperatura mínima y se unen con una línea mostrando la oscilación; con otro color se
representa de igual forma la temperatura máxima. De un vistazo, el lector puede ver cómo
han oscilado ambas variables en un periodo de siete días.

¿Como se construye y se analiza?

Paso 1: ¿Cuáles son los datos que se van a analizar? ¿Los tienes? Si es así, perfecto,
vamos al paso 2. Si no, procedemos a capturar los datos del fenómeno que se desea
analizar.

Paso 2: Cuando hablamos de clases o intervalos nos referimos a las barras verticales que
tendrá nuestro histograma. Normalmente se dice que un histograma debe tener barras del
mismo ancho, lo cual no es necesariamente cierto. Dependiendo de la situación que se
analiza, es más conveniente utilizar intervalos de diferente ancho.

Cuando los intervalos son del mismo ancho, la altura de cada barra será proporcional a su
área. Caso contrario cuando tenemos intervalos de ancho distinto, y en este caso resulta
conveniente analizar el área de la barra.

Bueno, me extendí un poco. Entonces, en el paso 2 vamos a determinar el rango. El rango


se define como la resta entre el valor más grande con el valor más pequeño de tus datos
capturados.

Paso 3: Existen diversas formas para definir cuántas clases considerar. K es el número de
clases.
La primera es considerar una tabla guía. La siguiente está basada en la publicación de
Roberto Behar y Pere Grima (abajo te dejo la referencia).

Otras referencias sugieren 4 clases si tenemos menos de 50 datos, 7 clases para menos de
100 datos, 10 clases para menos de 150 datos, 12 clases para menos de 200 datos y 14
clases para más de 200 datos.

La siguiente opción es obtener la raíz cuadrada de la cantidad de datos. El resultado


redondeado será el número de clases.

Otra opción es la regla de Sturges. Propuesta por Hébert Sturges, nos da una regla práctica
para obtener el número de clases:

Hay otras formas, pero estas son las más difundidas. ¿Qué opción elegir? Como regla
general considera que, a mayor número de datos, más clases tendremos.

Lo realmente importante es la forma que va a tomar nuestro histograma, así que lo más
recomendable es que vayas probando con cada una de las opciones buscando la que te
permita hacer un mejor análisis final.

Paso 4: Determina la amplitud de clase o ancho del intervalo. Se define con la letra h.
Para ello divide el rango entre el número de clases definido en el paso 3. Si obtienes un
número decimal, redondea al entero más cercano. ¿Por qué? Porque la información debe
ser fácil de interpretar.

Paso 5: Define las clases. Ya tienes el número de intervalos de clase a considerar y su


amplitud, con esto ya puedes establecer cada clase.
Busca el número más pequeño en todos tus datos, y a ese número le vas a sumar la
amplitud de clase. Ya tienes tu primer intervalo o clase.

Por ejemplo, si el número más pequeño que tienes es 10 y tu amplitud de clase es 5:

Tu primer intervalo será: [10 – 15], el segundo (15, 20], y así sucesivamente.

Si te encuentras con un dato que coincide con el límite de clase, como por ejemplo «15»,
simplemente define un criterio para todos los intervalos de clase. Define si se ubica en el
intervalo actual o el intervalo siguiente.

Por ejemplo, nosotros definimos que el primer intervalo sea todos los números mayores
o iguales a 10 y menores e iguales a 15. En consecuencia, el segundo intervalo será todos
los números mayores a 15 y menores iguales a 20.

Paso 6: Tabula los datos con base en los intervalos de clase definidos. En otras palabras,
agrupa los datos según su pertenencia a cada clase. Esto te dará la frecuencia de cada
clase.

Paso 7: Construye el histograma:

• En el eje x ubica los intervalos de clase.

• En el eje y ubica la frecuencia.

Según la amplitud del intervalo, será el ancho de la barra. El paso a paso que venimos
tratando es para intervalos de clase del mismo ancho.

Paso 8: Interpreta el histograma. Analiza aspectos como la tendencia, la variabilidad y la


forma de distribución de los datos.
▪ Histograma

Un histograma es la representación gráfica en forma de barras, que simboliza la


distribución de un conjunto de datos. Sirven para obtener una "primera vista" general, o
panorama, de la distribución de la población, o de la muestra, respecto a una
característica, cuantitativa y continua.
▪ Gráfico de dispersión

El punto de partida son también los ejes cartesianos que muestran todos los valores de la
variable dependiente y de la independiente, o de dos variables para comprobar si existe
relación. El resultado suele ser una nube de puntos que muestra una dispersión o una
concentración y ayuda a los estadistas a determinar la relación o no entre las variables.
Estas representaciones gráficas permiten combinaciones diversas, por ejemplo,
representar unas variables en barras y otras en línea, siempre que el tipo de datos a
representar lo permita.

¿Como se construye y se analiza?

Paso 1: Determina cuál es la situación. Si no entendemos qué es lo que esta ocurriendo,


no podremos establecer las variables a estudiar.

Paso 2: Determina las variables a estudiar. Si ya determinaste las variables a estudiar, es


porque crees que puede existir una relación entre ellas que te permita caracterizar la
situación.

Paso 3: Recolecta los datos de las variables: Si ya los tienes, perfecto. Si no, definimos
un período de tiempo para conseguir los datos de las variables antes definidas. Recuerda
que los datos de las dos variables deben estar dados en el mismo período de tiempo.

Paso 4: Ubica los valores en el eje respectivo. Por lo general, la variable independiente
es aquella que no está influenciada por la otra y se ubica en el eje x. La variable
dependiente que es la que se ve afectada por la otra variable se ubica en el eje y. Así pues,
procedemos a ubicar los valores en el plano cartesiano de acuerdo a su variable (x, y)

Paso 5: Determina el coeficiente de correlación: El coeficiente de correlación debe verse


reflejado en la forma que toma el gráfico de dispersión. Es el cociente de la covarianza y
la multiplicación de la desviación típica de las dos variables. Con Excel logramos
calcularlo de manera muy simple.

Paso 6: Analizamos: Con base en el coeficiente y en el gráfico, definimos cuál es la


relación de las dos variables y tomamos las decisiones pertinentes.

▪ Pictogramas

Otra variación son los pictogramas, gráficos donde las barras o las líneas se sustituyen
por dibujos que muestran la temática de los datos que se están expresando en los gráficos:
si se representa la variación del precio de distintas frutas, el pictograma puede elaborarse
con dibujos de esas frutas.

¿Como se construye y se analiza?

Paso 1: Selecciona la fuente de los datos

-Elige la fuente de los datos que va a representar tu pictograma. Puedes reunir tus propios
datos entrevistando personas, o contando elementos, o también puedes usar datos que
haya reunido otra persona.

-Haz una lista de todos los datos que reuniste. Compila en una lista todos los datos y
números que obtuviste.

-Revisa tus números. Asegúrate de haber reunido suficiente información como para
responder la pregunta o mostrar la información que quieras representar a través del
pictograma. Si vas a reunir información acerca de distintos estados, asegúrate de obtener
datos de muchos estados diferentes para poder representar tus datos con mayor exactitud

Paso 2: elegir los símbolos


-Escribe qué es lo que va a representar tu pictograma. Escribe una breve descripción de
qué es lo que las personas verán al observar tu pictograma. La descripción también te
ayudará a determinar qué símbolos debes usar y a asegurarte de que el pictograma esté
correctamente diseñado.

-Asígnale un valor a cada símbolo. Establece el valor numérico que va a representar cada
imagen en particular. Una buena idea es usar números enteros como 10, 100 o 1.000.

-Haz que tus datos coincidan con los símbolos. Revisa la lista de datos y determina qué
imágenes necesitas para representar cada grupo de datos. Escribe una nota indicando qué
vas a dibujar para cada dato que reuniste. Si sabes que en Georgia cosecharon 7,5 millones
de nueces, entonces podrías dibujar 7 nueces y media.

Paso 3: crear el pictograma

-Decide si vas a dibujar el pictograma o imprimirlo desde una computadora. Puedes hacer
pictogramas con la ayuda de programas de computadora como, por ejemplo, Excel.

-Dibuja los ejes del gráfico y etiquétalos. Los pictogramas son un tipo de gráfico y tienen
etiquetas a los costados y en la parte de abajo para indicar qué es lo que representan. Los
ejes del gráfico son las dos líneas (una vertical y la otra horizontal) que sirve como barrera
o margen del gráfico.

-Dibuja símbolos en el pictograma. Utiliza la tabla de datos que creaste y completa cada
categoría de datos con imágenes.

Paso 4: etiqueta todas las categorías de datos

Debajo de cada columna de imágenes, escribe la fuente de los datos. Para cada estado
donde se cosecharon nueces, debes escribir el nombre del estado debajo de las imágenes.
Paso 5: Incluye referencias para el pictograma.

En la esquina de tu pictograma dibuja un cuadro de referencias para indicarle al lector


qué representa cada imagen.

Medidas de tendencia central

Son medidas estadísticas que se usan para describir como se puede resumir la localización
de los datos. Ubican e identifican el punto alrededor del cual se centran los datos. Las
medidas de tendencia central nos indican hacia donde se inclinan o se agrupan más los
datos. Las más utilizadas son: la media, la mediana y la moda.

El propósito de las medidas de tendencia central es:

1. Mostrar en qué lugar se ubica el elemento promedio o típica del grupo.

2. Sirve como un método para comparar o interpretar cualquier valor en relación con el
puntaje central o típico.

3. Sirve como un método para comparar el valor adquirido por una misma variable en dos
diferentes ocasiones.

4. Sirve como un método para comparar los resultados medios obtenidos por dos o más
grupos.

La media

La media o media aritmética, usualmente llamada promedio, se obtiene sumando todos


los valores de los datos y divide el resultado entre la cantidad de datos. Si los datos
proceden de una muestra la media se representa con una x testada (x) y si provienen de la
población se representan con la letra griega miu (µ).

Donde

X: promedio muestral (estadístico).

µ: promedio poblacional (parámetro).

∑: signo de sumatoria.

N = número de datos de la población.

n: número de datos de la muestra.

fi: frecuencia absoluta.

Xc: Marca de clase o punto medio.

Ejemplo de cómo se emplea la media o promedio con el siguiente ejemplo para datos no
agrupados:

a) A continuación se presenta una muestra de las puntuaciones en un examen de un curso


de estadística:

70 90 95 74 58 70 98 72 75 85 95 74 80 85 90 65 90 75 90 69

Podemos calcular el promedio de las puntuaciones para conocer cuántos estudiantes


obtuvieron puntuaciones por encima y por debajo del promedio.
Primero, sumamos todos los valores de los datos y el resultado lo divide entre el total de
datos o tamaño de la muestra. Al sumar todas las puntuaciones en el ejemplo anterior
obtendrás un total de 1600, que dividido por 20(total de datos), es igual a 80. Si
empleamos la fórmula obtenemos:

La media para datos agrupados, ejemplo: Ejemplo: Para los gastos diarios en periódicos
del hotel agrupados en una tabla de frecuencia:

El promedio aritmético es:

1ro) Se construye la tabla de distribución de frecuencias.

2do) se obtiene el total de la frecuencia absoluta de clase por el punto medio.

3ro) El resultado obtenido se divide entre el tamaño de la muestra.

Propiedades de la Media:

1ª) La suma de las desviaciones de los valores o datos de una variable X, respecto

a su media aritmética es cero.

Ventajas e inconvenientes:

- La media aritmética viene expresada en las mismas unidades que la variable.

- En su cálculo intervienen todos los valores de la distribución.


- Es el centro de gravedad de toda la distribución, representando a todos los valores
observados.

- Es única.

- Su principal inconveniente es que se ve afectada por los valores extremadamente


grandes o pequeños de la distribución.

La Mediana

La segunda medida de tendencia central que analizaremos es la mediana, en ocasiones se


le llama media posicional, porque queda exactamente en la mitad de un grupo de datos,
luego de que los datos se han colocado de forma ordenada. En este caso la mitad (50%)
de los datos estará por encima de la mediana y la otra mitad (50%) estará por debajo de
ella. La mediana es el valor intermedio cuando los valores de los datos se han ordenado.

La Mediana (Me) para datos no agrupados:

1. Primero se ordenan los datos.

2. Luego se calcula la posición de la mediana con la siguiente formula: (n+1) ÷2

donde, n es el número de datos.

a) Por ejemplo, se tiene una muestra de tamaño 5 con los siguientes valores: 46, 54, 42,
48 y 32.

Primer paso, ordenar los datos: 32 42 46 48 54

Como la cantidad de datos es impar (5 datos), la mediana es el valor del dato que se
encuentra ubicado en la posición (5+1)÷2=3, la mediana es: Me = 46.

b) Se ha obtenido una muestra con los valores de datos: 27, 25, 27, 30, 20 y 26.

¿cómo se determina la mediana en este caso?


Primer paso, ordenar los datos de forma ascendente: 20 25 26 27 27 30

Como el número de datos es par (6), la mediana es el promedio de los datos que se
encuentran en las posiciones (6+1) ÷1 = 3.5. Por lo tanto, la mediana es:

Donde:

Li: Límite inferior real de la clase que contiene la mediana.

n: tamaño de la muestra.

Fi-1 = AFA: Frecuencia acumulada anterior a la clase que contiene la mediana.

Fi: frecuencia de clase absoluta de la clase mediana.

Para identificar la clase mediana se divide n/2 y la primera clase que contenga una
frecuencia acumulada mayor que n/2.

n = 32, entonces n/2 = 32/2 = 16. Buscar la primera frecuencia acumulada mayor que 16,
esa será la clase mediana.

Ahora se aplica la formula:

Me = (6.95 + (((32/2 – 8) /9) *(0.9)) = 6.95 + (16 – 8) / 9) *(0.9)

Me = (6.95 +(8/9) *(0.9)) = 6.95 +(0.88*0.9)

Me = 6.95 + 0.79
Me = 7.75 ≈ 7.8

Ventajas e inconvenientes:

- Es la medida más representativa en el caso de variables que solo admitan la escala


ordinal.

- Es fácil de calcular.

- En la mediana solo influyen los valores centrales y es insensible a los valores extremos
u “outlets”.

- En su determinación no intervienen todos los valores de la variable.

La Moda (Mo)

La moda es el dato que más se repite o el dato que ocurre con mayor frecuencia. Un grupo
de datos puede no tener moda, tener una moda (unimodal), dos modas (bimodal) o más
de dos modas (multimodal).

Veamos los siguientes ejemplos:

a) Se tiene una muestra con valores 20, 23, 24, 25, 25, 26 y 30.

Mo = 25 es unimodal
b) Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.

Mo= 20 y 25, se dice que es bimodal.

c) Se tiene una muestra con valores 20, 23, 24, 25, 25, 26, 30 y 30.

Mo= 20, 25 y 30, se dice que es multimodal.

En los datos agrupados la Mo es la marca de clase de la clase que contenga la mayor


frecuencia absoluta.

También se puede calcular a través de la formula:

, donde Lir: límite inferior verdadero de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi-1 es la frecuencia de clase absoluta anterior a la clase modal

fi+1 es la frecuencia de clase absoluta posterior a la de la clase modal.

i es el intervalo de clase. La clase modal es aquella que contiene la mayor frecuencia absoluta.
d1 = 9 – 4 = 4

d2 = 9 – 7 = 2

Mo = 6.95 + (4 / 4 + 2) * 0.9 = 6.95 + (4 / 6) * 0.9 = 6.95 + 0.66 * 0.9

Mo = 6.95 + 0.59

Mo = 7.55 ≈ 7.6

Es mejor utilizar la fórmula para el cálculo de la moda.

Ventajas e inconvenientes:

- Su cálculo es sencillo.

- Es de fácil interpretación.

- Es la única medida de posición central que puede obtenerse en las variables

de tipo cualitativo.

- En su determinación no intervienen todos los valores de la distribución.


Conclusión

La realización de este informe de investigación me ha permitido afianzar mis


conocimientos y entender elementos propios de la estadística que no entendía muy bien.
Por lo tanto, entiendo que esta asignación a sido bastante efectiva para mi desarrollo
profesional y entiendo que lo aprendido me ayudará con mi práctica docente.

A través de este trabajo he aprendido que:

-La estadística es la rama de las matemáticas encargada de la recolección y análisis de


datos, con motivo de conocerlos y así tomar decisiones o realizar planes en base a las
informaciones obtenidas. En base a su función, podemos hacer énfasis en los siguientes
términos: interpretar, analizar, recolectar, examinar, procesar, agrupar, calcular y deducir.

-Desde los tiempos más remotos siempre ha existido la necesidad de recolectar y analizar
datos. Las civilizaciones antiguas, como Egipto y Grecia, acudían a la estadística para
realizar censos. Del mismo modo, en la edad media se realizaban registros de
nacimientos, matrimonios y muertes.

- La población estadística hace referencia al conjunto de todos los elementos que


estudiaremos. Por otro lado, la muestra es una parte seleccionada dentro del conjunto de
la población.

Las variables son características de interés de los miembros de una población que toma
diferentes valores. Estas pueden ser cualitativas y cuantitativas. Dentro del primer grupo
encontramos las ordinales y nominales y dentro del segundo están las discretas y
continuas.

-Existen diferentes tipos de gráficos que nos permiten representar los datos estadísticos
mediante un organizador o imagen en donde se resumen los resultados arrojados en el
análisis de datos. Los principales gráficos son: de barra, de pastel, pictograma, de
frecuencia y de dispersión.

-Las medidas de tendencia central son tres: media, mediana y moda. La media es el valor
obtenido al sumar todos los datos y dividir el resultado entre el numero total de los datos.
La moda es el elemento que mas re repite; en un conjunto de datos puede haber más de
una moda, pero también puede que no existe ninguna. Por último, la mediana es el valor
de la variable que ocupa la posición central en un conjunto de datos ordenados.
Bibliografía

(2015, 2 marzo). La Estadística - Matemáticas Cuarto Primaria. Aulafacil.

https://www.aulafacil.com/cursos/matematicas-primaria/matematicas-

cuartoprimaria/la-estadistica-l7678

Paula Nicole Roldán (31 de julio, 2017) Estadística. Economipedia.com

Experto GestioPolis.com. (2021, 4 mayo). Historia de la estadística. Origen y evolución.


gestiopolis. https://www.gestiopolis.com/historia-de-la-estadistica/

U. (2018c). IMPORTANCIA DE LA ESTADISTICA. BlogdeMiguel.


http://materiaestadistica.blogspot.com/2012/01/importancia-de-la-
estadistica_15.html

1.2-Formas de Presentación de Información Estadística. (2019). Gidecam.


http://cidecame.uaeh.edu.mx/lcc/mapa/PROYECTO/libro19/12formas_de_prese
ntacin_de_informacin_estadstica.html

Tablas de frecuencia y marcas de clase. (2020, January 13). Retrieved April 8, 2020,
from https://www.superprof.es/apuntes/escolar/matematicas/estadistica/descripti
va/tablas-de-frecuencia.html

Betancourt, D. F. (26 de julio de 2016). Cómo hacer un diagrama de dispersión: Ejemplo


en calidad. Recuperado el 22 de octubre de 2021, de Ingenio Empresa:
www.ingenioempresa.com/diagrama-de-dispersion.

Unir, V. (2021, 18 febrero). Gráficos estadísticos: tipos e importancia en la

comunicación de datos. UNIR. https://www.unir.net/marketing-

comunicacion/revista/graficos-estadisticos/

wikiHow. (2021, 21 agosto). Cómo hacer un pictograma. https://es.wikihow.com/hacer-

un-pictograma

También podría gustarte