Está en la página 1de 12

Cátedra: MATEMÁTICA

ESTADÍSTICA

 Estadística
Es la ciencia formal que estudia los métodos y procedimientos para recolectar datos,
clasificarlos, organizarlos, representarlos, analizarlos e inferir conclusiones. Los datos
pueden referirse a personas, animales, objetos, hechos, etc. La Estadística descriptiva
realiza la recolección, organización, clasificación, representación y análisis de los datos.
En cambio, la Estadística inferencial toma decisiones y realiza inferencias sobre los
mismos.

 Población
Es el conjunto de todos los elementos o datos que se someten a un estudio estadístico.

Ejemplos:
La población de alumnos que estudian diseño.
La población de animales que viven en la montaña.
La población de autos que circulan en una ciudad.
La población de computadoras de una institución, etc.

 Individuo o unidad estadística


Corresponde a cada uno de los elementos que componen la población.

Ejemplos:
En la población de alumnos que estudian diseño, los individuos son los alumnos.
En la población de animales que viven en la montaña, cada individuo es un animal.
En la población de autos que circulan en una ciudad, cada individuo es un auto.

 Muestra
Es un subconjunto representativo de la población de referencia. El número de
individuos de una muestra es menor que el de la población y se considera mayor a 800 y
menor a 2000.

Ejemplo:
En la población de alumnos que estudian diseño, una muestra estaría formada por 10
alumnos que cursan primer año, 10 de segundo, 10 de tercero, etc.

¿Cómo elegir una muestra?

El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción


reducida y representativa de la población. Se puede realizar en forma:

- Aleatoria (azarosa o estratificada)


- No aleatoria (sistemática o deliberada)
1
Cátedra: MATEMÁTICA

En el muestreo no aleatorio y sistemático se busca el mismo perfil del encuestado; en el


muestreo no aleatorio y deliberado se busca a quien encuestar.

 Carácter estadístico
Es el atributo que se desea estudiar sobre los individuos de la población o de la muestra.
Puede ser de tipo cualitativo o cuantitativo; a su vez el cuantitativo puede ser continuo o
discreto, según recolecte información utilizando números reales o números enteros
respectivamente.

Ejemplos:

Carácter cualitativo:
Se desea estudiar el color de ojos de una población.

Carácter cuantitativo discreto:


Se desea estudiar la edad en años de los alumnos de primer año.

Carácter cuantitativo continuo:


Se desean estudiar las longitudes en cm de tornillos.

Todo carácter estadístico tiene asociado una variable estadística.

 Variable estadística
Es el conjunto de valores que toma el carácter estadístico al cual está asociado. Pueden
ser de tipo cualitativas o cuantitativas, según el carácter estadístico respectivo.

Ejemplos:

Variable cualitativa:
En el ejemplo del estudio del color de ojos de una población, la variable cualitativa
puede tomar los valores: negro, marrón, verde, gris, azul.

Variable cuantitativa discreta:


En el ejemplo del estudio de la edad en años de los alumnos, la variable cuantitativa
discreta puede tomar los valores: 17, 18, 19, 20, 21, etc. (recuerda que los valores que
puede tomar son números enteros).

Variable cuantitativa continua:


En el ejemplo del estudio de las longitudes en cm de tornillos, la variable cuantitativa
continua puede tomar los valores: 1,34; 1,32; 1,234; 1,452, etc. (recuerda que los
valores que puede tomar son números reales).

También se pueden clasificar en dicotómicas (toman dos valores) o policotómicas


(varios valores).

2
Cátedra: MATEMÁTICA

Ejemplos:

Variable cualitativa dicotómica:


Si se desea estudiar la filiación de un grupo de personas, la variable cualitativa
dicotómica asociada puede tomar los valores: si tiene hijos, no tiene hijos.

Variable cualitativa policotómica:


Si se desea estudiar el color de autos, la variable cualitativa policotómica asociada
puede tomar los valores: verde, azul, rojo, amarillo, gris, blanco, etc.

Para su estudio, se las considera agrupadas en intervalos o no agrupadas.

Ejemplos:

Variable no agrupada:
Se ha considerado el peso en kilogramos de un grupo de jóvenes que practican natación.
Se presentan a continuación:
60- 62- 70- 75- 71- 70- 70- 65- 67- 62

Variable agrupada en intervalos:


En la siguiente tabla se presentan los pesos al nacer de un grupo de bebes:

Pesos(en kilogramos) Cantidad


de bebes
[2,0;2,3[ 5
[2,3;2,6[ 4
[2,6;2,9[ 8
[2,9;3,2[ 35
[3,2;3,5[ 20
[3,5;3,8[ 18
[3,8;4,1[ 10
[4,1;4,4[ 6

 Frecuencias
Las frecuencias pueden ser de diferentes tipos: frecuencia absoluta, acumulada, relativa
o porcentual.

Frecuencia absoluta (f): es el número de veces que se registra cada valor de la


variable.

Frecuencia acumulada (fa): es la suma de todas las frecuencias absolutas


correspondientes a los valores que preceden o son iguales al considerado.

Frecuencia relativa (fr): es el cociente entre su frecuencia absoluta y el número total de


datos de una colección (N).

3
Cátedra: MATEMÁTICA

fr = f/N
Frecuencia porcentual (f%): es el producto entre su frecuencia relativa y 100.

f% = fr .100

 Organización de los valores de la variable y sus frecuencias


Si se realiza un determinado estudio estadístico, los valores obtenidos de la variable en
cuestión y de sus frecuencias, suelen organizarse en cuadros o tablas denominadas
tablas de distribución de frecuencias.

Ejemplos:

Para una variable cualitativa


Se realiza un estudio estadístico sobre los grupos sanguíneos de 40 personas, en la
siguiente tabla de distribución de frecuencias se presentan los valores obtenidos y las
frecuencias asociadas:

Estatura (en cm) Cantidad de Frecuencia Frecuencia Frecuencia


personas ( f) acumulada (fa) relativa (fr) porcentual (f%)
A 15 15 15/40 40%
B 12 27 12/40 30%
O 8 35 8/40 20%
AB 5 40 5/40 10%
Total ( N) 40 1 100

Para una variable cuantitativa continua


Se realiza un estudio estadístico sobre las estaturas (en cm) de 70 personas, en la
siguiente tabla de distribución de frecuencias se presentan los valores obtenidos y las
frecuencias asociadas:

Estatura (en cm) Cantidad de Frecuencia Frecuencia Frecuencia


personas ( f) acumulada (fa) relativa (fr) porcentual (f%)
[170,0;170,3[ 5 5 5/70 7%
[170,3;170,6[ 4 9 4/70 5%
[170,6;170,9[ 8 17 8/70 11%
[170,9;171,2[ 35 52 35/70 50%
[171,2;171,5[ 18 70 18/70 25%
Total ( N) 70 1 100

En todos los casos, sean datos agrupados o no agrupados, se cumple que:


- la suma de las frecuencias absolutas debe ser igual al número total de datos (N).
- la suma de las frecuencias relativas debe ser igual a 1.
- la suma de las frecuencias porcentuales debe ser igual a 100.

4
Cátedra: MATEMÁTICA

La construcción de las tablas de distribución de frecuencias esta explicada en videos que


se encuentran en la catedra virtual.

 Organización de los valores de la variable y sus frecuencias en


diferentes tipos de gráficos
Existen diferentes tipos de gráficos que permiten visualizar de otra forma la información
obtenida al realizar un estudio estadístico, es decir, permiten mostrar de manera gráfica
los valores obtenidos y sus frecuencias asociadas. Entre ellos podemos destacar los
gráficos de bastones, de barras, de sectores o pastel, histograma, pictograma,
cartograma, poligonal estadística, polígono de frecuencias, etc.

Para utilizarlos de forma adecuada hay que tener en cuenta que deben:
- ajustarse a la realidad de los datos que representan,
- ser claros, fáciles de leer y entender,
- llevar todas las indicaciones necesarias para su fiel interpretación,
- ser los adecuados para el carácter estadístico que visualizan.

Ejemplos:

Diagrama de bastones:
Es una gráfica que asocia a cada valor de la variable un bastón o segmento, cuya altura
es proporcional a la frecuencia absoluta correspondiente. Generalmente se utiliza para
variable cualitativa o también para variable cuantitativa discreta.

Diagrama de barras:
Es una gráfica que asocia a cada valor de la variable una barra, cuya altura es
proporcional a la frecuencia absoluta correspondiente. Generalmente se utiliza para
variable cualitativa o también para variable cuantitativa discreta.

5
Cátedra: MATEMÁTICA

Diagrama de sectores:
Es un diagrama de sectores, en el cual cada sector circular tiene una amplitud que es
proporcional a la frecuencia que representa, generalmente se utiliza la frecuencia
porcentual, en cuyo caso el disco entero representa al 100%. Se los utiliza para variable
cualitativa o también para variable cuantitativa discreta, en estudios en donde
intervengan poca cantidad de datos.

Histograma:
Dada una variable cuantitativa discreta o continua que este agrupada en intervalo. Un
histograma es una gráfica que asocia a cada intervalo de dicha variable un recinto
rectangular, siendo el valor de la frecuencia absoluta coincidente con la altura de dicho
rectángulo.

Poligonal estadística:
Es la línea poligonal obtenida al unir las extremidades de los puntos medios de las bases
superiores de los rectángulos en un histograma.

6
Cátedra: MATEMÁTICA

Polígono estadístico:
Es el polígono determinado por una poligonal asociada a un histograma y una porción
de la recta de abscisas, agregando en los dos extremos de la distribución de datos, dos
intervalos ficticios con frecuencia cero.

 Parámetros estadísticos
Corresponden a los valores numéricos obtenidos al realizar un estudio estadístico y que
reflejan el comportamiento de los datos, es decir, son números que describen, de manera
concisa, el comportamiento y las características generales de un conjunto de datos.
Pueden ser de diversos tipos: de centralización, de dispersión y de posición, entre otros.

 Parámetros de centralización
Los parámetros de centralización o medidas de tendencia central dan un valor típico o
representativo de un conjunto de datos, es la disposición de éstos para agruparse
alrededor del centro o de ciertos valores numéricos. Corresponden a la moda (Mo), la
media ( X ) y la mediana (Me).

 Para datos no agrupados en intervalos

MEDIA ARITMÉTICA: X

Se obtiene calculando el cociente entre la sumatoria de los productos de los valores


numéricos de la variable y sus respectivas frecuencias, y el número total de esos valores,
es decir:
n

x
i 1
i fi
X =
N
Es un concepto intuitivamente claro, cada conjunto de datos tiene media y es única,
además es útil para llevar a cabo procedimientos estadísticos como la comparación de
datos. Si bien es confiable porque toma en cuenta todos los valores del conjunto, puede

7
Cátedra: MATEMÁTICA

verse afectada por los valores extremos que no son representativos del resto de los
datos.

MEDIANA: Me

Es el valor de la variable que ocupa el lugar central en el conjunto ordenado de datos:

 si N (número de datos) es par, se encuentra calculando el promedio de


los dos valores centrales
 si N es impar, es el valor central obtenido

Los valores extremos no afectan a la mediana tan intensamente como a la media.

MODA: Mo

Corresponde al valor de la variable que tiene mayor frecuencia. Si el valor modal se


repite dos veces corresponde a una distribución bimodal, si se repite más de dos veces,
es multimodal. También puede ocurrir que todos los valores de la variable presenten la
misma frecuencia, en ese caso no hay moda. La moda no se modifica por los valores
extremos.

 Para datos agrupados en intervalos

MEDIA ARITMÉTICA: X

Se obtiene calculando el cociente entre la sumatoria de los productos de las marcas de


clase y sus respectivas frecuencias, y el número total de datos, es decir:
n

x
i 1
im fi
X =
N

Siendo xim la marca de clase del intervalo i-ésimo, es decir el punto medio del
intervalo i-ésimo.

MEDIANA: Me

Para calcular la mediana se determina primero el intervalo en donde se encuentra, y


luego se aplica la siguiente fórmula:
N
 fa i 1
Me = ei  ( 2 ).h
f

En donde: ei es el extremo inferior del intervalo donde está la mediana


fai-1 es el valor de la frecuencia acumulada del intervalo anterior
f es el valor que toma la frecuencia donde está la mediana
h es la amplitud del intervalo

8
Cátedra: MATEMÁTICA

MODA: Mo

Para calcular la moda se determina primero el intervalo modal (corresponde al de mayor


frecuencia), y luego se aplica la siguiente fórmula:
1
Mo = ei  ( ).h
1   2

En donde: ei es el extremo inferior del intervalo de mayor frecuencia (intervalo modal)


1 es la diferencia entre la mayor frecuencia y la anterior
2 es la diferencia entre la mayor frecuencia y la siguiente
h es la amplitud del intervalo

 Parámetros de dispersión
Los parámetros de dispersión son medidas que representan el alejamiento o
diseminación de los datos a lo largo del rango de distribución; es decir la variación de
valores alrededor del punto central, o la tendencia de valores individuales a desviarse de
los parámetros de centralización. Las más frecuentemente utilizadas son el rango, la
desviación estándar o típica, la desviación media y la varianza.

 Para datos no agrupados en intervalos

RANGO: R

Es el valor que se obtiene de la diferencia entre el mayor y el menor valor de la variable.


Indica la variabilidad existente entre los valores que toma la variable, sin embargo, debe
usarse con precaución ya que su valor depende únicamente de los valores extremos.

R = Xmax – X min

DESVIACIÓN MEDIA: dm

Indica el promedio de las desviaciones con respecto a la media.

x
i 1
i  X fi
dm =
N

xi - X  es la distancia entre X y xi

9
Cátedra: MATEMÁTICA

VARIANZA: 2

La varianza de las observaciones x1, x2,…, xn es el promedio de los cuadrados de las


distancias entre cada valor de la variable y la media aritmética del conjunto de datos. El
valor de la varianza puede sufrir un cambio muy desproporcionado por la existencia de
valores extremos en el conjunto de datos.

 (xi 1
i  X )2 fi
2 =
N

DESVIACION ESTÁNDAR O TIPICA: 

La raíz cuadrada de la varianza, es la desviación estándar o típica. A menudo, esta se


prefiere en lugar de la varianza, porque se expresa en las mismas unidades que la de los
datos. Permite calcular con un buen grado de precisión, dónde están localizados los
valores de la variable con respecto a la media.

 (x
i 1
i  X )2 fi
=
N

COEFICIENTE DE VARIACIÓN: CV

Es una medida de dispersión relativa, indica que proporción de la media representa la


desviación estándar, suele expresarse en forma porcentual.


CV=
x

 Para datos agrupados en intervalos

RANGO: R

R = Xmax – X min

DESVIACIÓN MEDIA: dm

xi 1
im  X fi
dm =
N

10
Cátedra: MATEMÁTICA

Siendo xim la marca de clase del intervalo i-ésimo, es decir el punto medio del
intervalo i-ésimo.

VARIANZA: 2
n

 (x
i 1
im  X )2 fi
2 =
N
Siendo xim la marca de clase del intervalo i-ésimo, es decir el punto medio del
intervalo i-ésimo.

DESVIACIÓN ESTÁNDAR O TIPICA: 

 (x
i 1
im  X )2 fi
=
N
Siendo xim la marca de clase del intervalo i-ésimo, es decir el punto medio del
intervalo i-ésimo.

 Parámetros de posición
Para datos agrupados en intervalos

Los parámetros de posición representan el lugar que ocupa un individuo con respecto
a los demás en el conjunto ordenado de datos. Estos valores solo sirven para realizar
comparaciones, corresponden entre otros, a los cuartiles y percentiles.

PERCENTILES: Pk

Se divide a la población en 100 partes iguales.


Para hallar cada percentil se calcula primero la frecuencia acumulada, que permite
determinar el intervalo donde se encuentra el mismo. Para esto se utiliza la fórmula:
kN
fa = . Luego se aplica la siguiente fórmula para calcular el percentil k:
100
kN
 fa i 1
Pk = ei  ( 100 ).h
f
En donde: ei es el extremo inferior del intervalo donde está el percentil
fai-1 es el valor de la frecuencia acumulada del intervalo anterior
f es la frecuencia del intervalo donde está el percentil
h es la amplitud del intervalo

11
Cátedra: MATEMÁTICA

CUARTILES: Qk

Se divide a la población en 4 partes iguales.


Para hallar cada cuartil, se calcula primero la frecuencia acumulada que permite
kN
determinar el intervalo donde se encuentra el mismo, utilizando la fórmula: fa = .
4
Luego se aplica la siguiente fórmula para calcular el cuartil k:

kN
 fa i 1
Qk = ei  ( 4 ).h
f
En donde: ei es el extremo inferior del intervalo donde está el cuartil
fai-1 es el valor de la frecuencia acumulada del intervalo anterior
f es el valor que toma la frecuencia donde está el cuartil
h es la amplitud del intervalo

12

También podría gustarte