Está en la página 1de 32

Matemáticas para maestros

Sergio Pérez Pozuelo


Facultat de Magisteri
1. LA ESTADÍSTICA
1.1.¿Qué es la estadística?
La estadística:
• Estudia el comportamiento de los fenómenos llamados de
colectivo.
• Está caracterizada por:
 Una información acerca de un colectivo o universo, lo
que constituye su objeto material.
 Un modo propio de razonamiento a partir de datos
empíricos, el método estadístico, lo que constituye su
objeto formal.
 Unas previsiones de cara al futuro, lo que implica un
ambiente de incertidumbre, que constituyen su objeto
o causa final.
• Es la ciencia de los datos.
Partes: estadística descriptiva y estadística inferencial.
• La estadística descriptiva:
 Tiene como fin presentar resúmenes de un conjunto
de datos y poner de manifiesto sus características,
mediante representaciones gráficas.
 Los datos se usan para fines comparativos.
 No se usan principios de probabilidad.
 El interés se centra en describir el conjunto de datos y
no se plantea el extender las conclusiones a otros
datos diferentes o a una población.
• La inferencia estadística:
 Estudia los resúmenes de datos con referencia a un
modelo de tipo probabilístico.
 Se supone que el conjunto de datos analizados es una
muestra de una población.
 El interés principal es predecir el comportamiento de la
población, a partir de los resultados de la muestra.
1.2. El lenguaje de la estadística
• Población
Es el conjunto de todos los elementos objeto de nuestro
estudio.
• Muestra
Es un subconjunto , extraído de la población, cuyo estudio
sirve para inferir características de toda la población.
El tamaño de la muestra es el número de elementos que la
forman.
• Individuo u objeto
Es cada uno de los elementos de la población. El individuo
es la unidad poblacional o muestral.
• Carácter estadístico
Aspecto que deseamos estudiar en los individuos de una
población.
Cada carácter puede tomar distintos valores o
modalidades:
Cuantitativas, susceptibles de expresarse mediante
números. Por ejemplo, la edad, el número de hijos, el
peso o la estatura.
Cualitativas, que sólo pueden explicarse mediante
palabras, como el color del pelo, la nacionalidad, el
sexo, el estado civil, etc.
• Variable estadística
Conjunto de valores que constituyen un carácter
estadístico. En términos estrictos, se denomina variable
estadística a todo carácter cuantitativo de un individuo,
mientras que los caracteres cualitativos se suelen llamar
atributos.
Las variables estadísticas se clasifican en dos grandes
grupos:
Variables discretas, que toman únicamente valores
puntuales. Por ejemplo, el número de hijos de una
mujer es siempre un valor entero: 0, 1, 2, 3, ...
Variables continuas, que pueden tomar cualquier valor
dentro del conjunto de los números reales R o de un
intervalo suyo. Ejemplos de variables continuas: la
altura de los ciudadanos de un determinado colectivo,
la medición de temperaturas, etc.
• Intervalos de clase
Son cada una de las partes en las que pueden agruparse
los datos que se obtienen en un estudio estadístico. Son
de gran ayuda para simplificar grandes conjuntos de
datos.
Extremos de un intervalo: son sus umbrales inferior y
superior. Lo normal es considerar intervalos cerrados
por la izquierda y abiertos por la derecha.
Elección de los extremos: es conveniente que no
coincidan con ningún valor de la variable; de hacerlo, se
incluirá en el intervalo el extremo inferior y excluiremos el
superior.
Marcas de clase: son los puntos medios de cada intervalo.
Longitud del intervalo: es la diferencia entre sus extremos.
Es conveniente que todos los intervalos tengan la misma
longitud.
Número total de intervalos: viene determinado por el
recorrido de los datos y por la longitud deseados de cada
intervalo.
 Criterio de Norcliffe:
 Criterio de Huntsberger o Regla de Sturges:
1 + 3.3 log
Siendo N el total de elementos representados.
• Frecuencias
La frecuencia absoluta es el número de veces que
aparece un determinado valor en un estudio
estadístico. Se representa por fi.
La suma de las frecuencias absolutas es igual al
número total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la
letra griega Σ (sigma mayúscula) que se lee suma o
sumatoria.
La frecuencia relativa es el cociente entre la frecuencia
absoluta de un determinado valor y el número total de
datos.
Se puede expresar en tantos por ciento y se
representa por .
La suma de las frecuencias relativas es igual a 1.
La frecuencia acumulada es la suma de las frecuencias
absolutas de todos los valores inferiores o iguales al
valor considerado.
Se representa por Fi.
La frecuencia relativa acumulada es el cociente entre
la frecuencia absoluta acumulada de un determinado
valor y el número total de datos.
Se representa por y se puede expresar en tantos por
ciento.
2. PRESENTACIÓN DE LOS DATOS: TABLAS Y
GRÁFICOS.
2.1 Tablas y gráficos
• Tablas
Un tabla es una matriz de datos con tantas filas y columnas
como sean necesarias. En las filas consignaremos los
caracteres estudiados; en las columnas se colocan los valores
de frecuencias correspondientes.
• Gráficos
Son representaciones visuales que emplean símbolos, barras,
polígonos y sectores, de los datos contenidos en tablas de
frecuencias.
Gráfico simple: frecuencias absolutas o relativas.
Gráfico acumulativo: frecuencias acumuladas.
En cada caso se indicará: la fuente de datos, las unidades en
que se han medido, el título y el número de la tabla/gráfico.
2.2 Tipos de gráficos
• Diagrama de barras
Son gráficos que asignan a cada valor de la variable una
barra proporcional a su frecuencia.
• Histogramas
Son gráficos específicos para variables agrupadas por
intervalo.
Los histogramas asocian a cada intervalo un rectángulo
de superficie proporcional a la frecuencia
correspondiente. La altura de cada rectángulo
dependerá de la frecuencia representada y de la longitud
del intervalo.
• Polígonos de frecuencias
Es la línea que une los puntos correspondientes a las
frecuencias de cada valor o de los extremos de las
barras; si los datos vienen dados en intervalos, unirá
los puntos correspondientes a las marcas de clase. En
este caso, convendrá distinguir entre poligonal simple
y acumulativa.
• Diagrama de sectores
Tienen forma circular o semicircular. En el círculo, cada
carácter viene representado por un sector circular de
una amplitud proporcional a su frecuencia. El radio del
círculo dependerá de la magnitud representada.
• Pictogramas
Son gráficos que se ayudan de imágenes alusivos al tipo
de datos representados (coches, espigas, personas,….).
• Cartogramas
Son representaciones sobre un mapa, sobre él se
indican cantidades o colores de acuerdo con el carácter
que representa.
• Diagrama triangular
Este diagrama se construye sobre un triángulo
equilátero, siendo cada lado un eje graduado de 0 a
100. Estos gráficos permiten representar a la vez tres
modalidades, expresadas en porcentajes, de un mismo
hecho.
3. PARÁMETROS ESTADÍSTICOS
3.1 Parámetros estadísticos
Son números que describen el comportamiento y las
características generales de un conjunto de datos.
Medidas de centralización:
 Indican la tendencia central de los datos.
 Más usuales: moda, mediana, media.
Medidas de dispersión:
 Miden la variación de los datos.
 Más usuales: rango, cuartiles, varianza y desviación
típica.
3.2 Medidas de centralización
• Moda
Es el valor que más se repite en un conjunto de datos.
Distribución bimodal, trimodal, …: hay 2, 3, … valores que
se repiten mayoritariamente y con igual frecuencia.
• Mediana
Es el valor central cuando todos los datos se han
ordenado de menor a mayor valor.
Si en el conjunto estudiado hay un número par de datos,
la mediana es la media de los valores centrales.

• Media aritmética
Es el valor resultante que se obtiene al dividir la suma de
los valores de todos los datos entre el número de ellos.

Para datos agrupados en


una tabla de frecuencias:
Propiedades de la media aritmética
1. La suma de las desviaciones de todas las puntuaciones
de una distribución respecto a la media de la misma
igual a cero.
2. La suma de los cuadrados de las desviaciones de los
valores de la variable con respecto a un número
cualquiera se hace mínima cuando dicho número
coincide con la media aritmética.

3. Si a todos los valores de la variable se les suma un


mismo número, la media aritmética queda aumentada en
dicho número.
4. Si todos los valores de la variable se multiplican por un
mismo número la media aritmética queda multiplicada
por dicho número.
Un inconveniente de la media es que los datos con valores
extremos pueden influir excesivamente en su evaluación.
• Media aritmética ponderada
Se aplica cuando no todos los tienen el mismo peso.
Es el resultado de multiplicar cada uno de los datos por
un valor particular para cada uno de ellos, llamado su
peso, y obteniendo a continuación la media aritmética del
conjunto formado por los productos anteriores

3.3 Medidas de dispersión


• Rango o recorrido
Es la diferencia entre el mayor y el menor valor de los
datos considerados.
• Cuartiles
Son tres valores que dividen el conjunto de datos, una vez
ordenados de menor a mayor, en cuatro grupos que contienen
todos el mismo número de éstos.
 Primer cuartil: cuartil inferior.
 Segundo cuartil: mediana.
 Tercer cuartil: cuartil superior.
 Rango intercuartílico. Diferencia entre el cuartil superior e
inferior.
• Quintiles, deciles y percentiles
Quintiles: son 4 valores que dividen el conjunto de datos en 5
partes con igual número de individuos cada una.
Deciles: son 9 valores que dividen el conjunto de datos en 10
partes con igual número de individuos cada una.
Percentiles o centiles: son 99 valores que dividen la totalidad en
100 partes con igual número de individuos cada una de ellas.
• Desviaciones respecto de la media
Las diferencias entre cada valor de la variable y la media
aritmética. Se representan por di y son iguales a:

Observaciones a las desviaciones respecto a la media


 Las diferencias di dan una idea de la proximidad del
valor de xi respecto a la media.
 Pueden ser positivas, negativas o nulas.
 La suma de las desviaciones respecto a la media
siempre vale 0. Por tanto, no podemos usar esta suma
para medir la dispersión. Para evitarlo, se recurre a dos
procedimientos:
a) Utilizar el valor absoluto de las desviaciones respecto
a la media, lo que dará lugar a la desviación media.
b) Utilizar el cuadrado de las desviaciones respecto a la
media, lo que dará lugar a la varianza.
• Desviación media
Es la media aritmética de los valores absolutos de las
desviaciones respecto a la media.

Ventajas y desventajas de la desviación media


 La desviación media tiene dos ventajas.
Utiliza para su cómputo todos los elementos de la
serie de datos.
Es fácil de entender.
 Requiere que usemos los valores absolutos que no es
una operación algebraica y por lo tanto es difícil trabajar
con valores absolutos y por ello la desviación media no
es usada frecuentemente.
• Varianza
Es la media aritmética de las diferencias al cuadrado de
cada valor respecto de la media de todos ellos.
Varianza poblacional: ; varianza muestral :

Consideraciones sobre la varianza:


1. La varianza es siempre un número positivo, por
tratarse de la media aritmética de números positivos.
2. Cuanto mayor es la dispersión le corresponde mayor
varianza y, en consecuencia, menor es la
representatividad de los valores centrales.
3. La varianza depende de todos los valores de la
variable.
Inconvenientes de la varianza:
El inconveniente principal es que utiliza unas medidas
distintas a las que tratamos en la variable. Al estar
elevado al cuadrado perdemos referencia respecto a
las variables.

• Desviación típica
Es la raíz cuadrada de la varianza.

La desviación típica sí viene expresada en las mismas


unidades que los datos, de ahí que resulte más interesante
que la varianza.
 Propiedades de la desviación típica
1. La desviación típica será siempre un valor positivo o
cero, en el caso de que las puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un
número la desviación típica no varía.
3. Si todos los valores de la variable se multiplican por un
número la desviación típica queda multiplicada por
dicho número.
4. Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones típicas se
puede calcular la desviación típica total.
 Si todas las muestras tienen el mismo tamaño:

 Si las muestras tienen distinto tamaño:


Observaciones sobre la desviación típica
1. La desviación típica, al igual que la media y la
varianza, es un índice muy sensible a las puntuaciones
extremas.
2. En los casos que no se pueda hallar la media tampoco
será posible hallar la desviación típica.
3. Cuanta más pequeña sea la desviación típica mayor
será la concentración de datos alrededor de la media.

• Coeficiente de variación
El coeficiente de variación permite comparar la dispersión
entre dos poblaciones distintas e incluso, comparar la
variación producto de dos variables diferentes (que pueden
provenir de una misma población).
Se define como:

 En porcentajes:

La muestra que tenga un coeficiente de variación menor es


la más homogénea o menos dispersa.

3.4 Tablas para los parámetros estadísticos


Para el cálculo práctico de muchos parámetros
estadísticos se utilizan tablas que facilitan dichos cálculos
3.5 Cálculo de los parámetros estadísticos para datos
agrupados en intervalos [ , )

• Moda

• Mediana.
• Cuantiles: cuartiles, quintiles, deciles, percentiles.

Cuartil p=4; quintil p=5; decil p=10, percentil o centil


p=100.

• Tablasde los parámetros estadísticos para datos


agrupados en intervalos.
Intervalos Marcas de clase
fi …
[ , +1 ) ( xi )
FIN DE LA
PRESENTACIÓN DEL
TEMA 3

También podría gustarte