Está en la página 1de 78

ESTADISTI

CA
GENERALIDADES
LA ESTADISTICA
Wikipedia
Ciencia formal que estudia la recolección, análisis e
interpretación de datos de una muestra representativa, ya
sea para ayudar en la toma de decisiones o para explicar
condiciones regulares o irregulares de algún fenómeno o
estudio aplicado, de ocurrencia en forma aleatoria o 
condicional

Murria R. Spiegel

"La estadística estudia los métodos científicos para recoger,


organizar, resumir y analizar datos, así como para sacar
conclusiones válidas y tomar decisiones razonables
basadas en tal análisis
CIENCIA FORMAL
 Ramas de la ciencia que estudian sistemas formales.
 Validan sus teorías con base
en proposiciones, definiciones, axiomas y reglas de inferencia,
todas ellas son analíticas, a diferencia de las ciencias sociales y
las ciencias natures, que las comprueban de manera empírica,
es decir, observando el mundo real.
DATOS
 El dato es una representación simbólica (numérica, alfabética,
algorítmica, entre otros) de un atributo o variable cuantitativa.
 Los datos describen hechos empíricos, sucesos y entidades.
TOMA DE DECISIONES

Proceso mediante el cual se
realiza una elección entre las
opciones o formas para
resolver diferentes
situaciones
(utilizando metodología
cuantitativas que brinda
la administración).
ALEATORIEDAD

 Se asocia a todo


proceso cuyo
resultado no es
previsible más que
en razón de la
intervención del 
azar.
PROBABILIDAD

Método mediante el cual se


obtiene la frecuencia de un
suceso determinado
mediante la realización de
un experimento aleatorio,
del que se conocen todos
los resultados posibles, bajo
condiciones estables.
E. DESCRIPTIVA E INFERENCIAL
ESTADISTI
CA

DESCRIPTI
VA
ESTADISTICA DESCRIPTIVA

 Parte de la estadística que se dedica a:


 Recolectar,
 Ordenar,
 Analizar
 Representar
un conjunto de datos, con el fin de describir las
características de este.

 Es un conjunto de procedimientos que tienen por objeto


presentar masas de datos por medio de tablas, gráficos y/o
medidas de resumen
ESTADISTICA DESCRIPTIVA
POBLACION

Universo o Colectivo.

Conjunto de elementos de referencia sobre el que


estamos interesados en obtener conclusiones
(hacer inferencia).

 El número de elementos o sujetos que componen una población


estadística es igual o mayor que el número de elementos que se
obtienen de ella en una muestra (n).
MUESTRA

 Subconjunto de casos o individuos de


una población estadística.

Las muestras se obtienen con la


intención de inferir propiedades de
la totalidad de la población, para lo
cual deben ser representativas de la
misma

 La muestra se escoge a través de Técnicas de Muestreo


TECNICAS DE MUESTREO
PARAMETRO
Una medida resumen calculada sobre la población

ESTADISTICO
Una medida resumen calculada sobre la muestra
DATOS
CARACTERÍSTICAS DE LOS
CONJUNTOS DE DATOS.
 UNIDAD DE ANÁLISIS O DE OBSERVACIÓN al objeto bajo
estudio. Ej.: persona, una familia, un país, una región, una
institución o en general, cualquier objeto.

 VARIABLE a cualquier característica de la unidad de


observación que interese registrar, la que en el momento de ser
registrada puede ser transformada en un número.

 VALOR de una variable, OBSERVACIÓN o MEDICIÓN, al


número que describe a la característica de interés en una unidad
de observación particular.

 CASO o REGISTRO al conjunto de mediciones realizadas sobre


una unidad de observación.
EJEMPLO CARACTERÍSTICAS
DE LOS CONJUNTOS DE
DATOS.
ACTIVIDAD
: TIPOS DE
DATOS.
 Investigue y realice un cuadro
sinoptico de los tipos de datos,
teniendo en cuenta las
subcategorias de los cualitativos y
los numericos
IMPORTANCIA DE LA
CLASIFICACION DE LOS DATOS

Porque el tipo de datos DETERMINA el


método de análisis apropiado y válido
y cada método de análisis estadístico
es específico para un cierto tipo de
datos.
La distinción más importante es entre
datos numéricos y categóricos.
PRESENTAC
ION DE
DATOS
CATEGORIC
OS
TABLAS DE FRECUENCIA

La distribución de frecuencias o tabla de
frecuencias es una ordenación en forma de tabla de
los datos estadísticos, asignando a
cada dato su frecuencia correspondiente
EJEMPLO DE TABLAS DE
FRECUENCIA
 Se tienen las notas de una prueba de matemática para 1000
alumnos de enseñanza media de un determinado colegio. Se
resume la información en la siguiente tabla de frecuencia
TIPOS DE FRECUENCIA
 Frecuencia Absoluta : Es el número de repeticiones que
presenta una observación. Se denota por ni
 Frecuencia Relativa : Es la frecuencia absoluta dividida por
el número total de datos. Se denota por fi
 Frecuencia Absoluta Acumulada : Es la suma de los
distintos valores de la frecuencia absoluta tomando como
referencia un individuo dado. La última frecuencia absoluta
acumulada es igual al número de casos. Se denota por Ni
 Frecuencia Relativa Acumulada : Es el resultado de dividir
cada frecuencia absoluta acumulada por el número total de
datos. Se denota por Fi
ACTIVIDAD

 REALIZA LA TABLA DE
FRECUENCIA DEL
EJERCICIO ANTERIOR
HISTOGRAMA
 un histograma es una
representación gráfica de una 
variable en forma de barras, donde la
superficie de cada barra es
proporcional a la frecuencia de los
valores representados
 Permite observar una preferencia, o
tendencia, por parte de la muestra o
población por ubicarse hacia una
determinada región de valores dentro
del espectro de valores posibles
 Permite observar el grado de
variabilidad, y por ende, la
dispersión de todos los valores que
toman las partes
CONSTRUCCION DEL
HISTOGRAMA
 En el eje vertical se representan las frecuencias, es decir, la
cantidad de población o la muestra, según sea el caso, que se
ubica en un determinado valor o subrango de valores de la
característica conocido como intervalo de clase
 En el eje horizontal se representa el espectro de valores
posibles que toma la característica de interés
TIPOS DE HISTOGRAMA
 Diagramas de barras simples
 Representa la frecuencia simple (absoluta o relativa)
mediante la altura de la barra la cual es proporcional a la
frecuencia simple de la categoría que representa
TIPOS DE HISTOGRAMA
 Polígono de frecuencias
 Es un gráfico de líneas que de las frecuencias absolutas de
los valores de una distribución en el cual la altura del punto
asociado a un valor de las variables es proporcional a la
frecuencia de dicho valor.
TIPOS DE HISTOGRAMAS
 Ojiva porcentual
 Es un gráfico acumulativo, el cual es muy útil cuando se
quiere representar el rango porcentual de cada valor en una
distribución de frecuencias.
 En los gráficos las barras se encuentran juntas y en la tabla
los números poseen en el primer miembro un corchete y en el
segundo un paréntesis, por ejemplo: [10-20)
ESTADISTI
COS
ESTADISTICOS
MEDIDAS DE TENDENCIA
CENTRAL
La mayor parte de los conjuntos de datos muestran una
tendencia a agruparse alrededor de un punto "central" y por lo
general es posible elegir algún valor que describa todo un
conjunto de datos. Un valor típico descriptivo como ese es una
medida de tendencia central o "posición".

Las medidas de tendencia central a estudiar son: media


aritmética, mediana y moda.
MEDIA ARITMETICA
La media aritmética ( también denominada media ) es la
medida de tendencia central que se utiliza con mayor
frecuencia. Se calcula sumando todas las observaciones de un
conjunto de datos, dividiendo después ese total entre el número
total de elementos involucrados.

Su símbolo es ẍ si la media aritmética es de una muestra y µ si


la media aritmética es de una población.
MEDIA ARITMETICA DATOS NO
AGRUPADOS
EJEMPLO DE MEDIA
ARITMETICA DATOS NO
AGRUPADOS

 EJEMPLO: calcular la media aritmética de los siguientes


datos, relacionados con las notas de un test de estadística
aplicado a un alumno: 45, 80, 56, 35,25, 90

 El promedio o media aritmética es 55 puntos


MEDIA ARITMETICA DATOS
AGRUPADOS

Si los datos están ordenados en tablas de frecuencia la media


se obtiene de la siguiente manera:
MARCA DE CLASE

 La marca de la clase e la sumatoria del limite inferior mas el


limite superior de cada clase, dividido entre 2. Ejemplo
EJEMPLO DE MEDIA
ARITMETICA DATOS AGRUPADOS

EJEMPLO: Calcular la
media aritmética del peso
de 40 trabajadores

Rta.: El peso promedio de


los 40 trabajadores es: 72
kilos
MEDIANA

 La mediana es el valor que se encuentra en el centro de una


secuencia ordenada de datos
 Su símbolo es
MEDIANA PARA DATOS NO
AGRUPADOS

 Ordenar los datos de forma creciente o decreciente.


 Para muestras con un número impar de observaciones, la
mediana es el dato que queda en el centro de dicha
ordenación
 Para muestras con número Par de observaciones la mediana
es el promedio de los dos datos centrales
MEDIANA EJEMPLO DATOS
NO AGRUPADOS
 EJEMPLOS
MEDIANA EJEMPLO DATOS
NO AGRUPADOS
MEDIANA DATOS
AGRUPADOS
MEDIANA EJEMPLO
DATOS AGRUPADOS
 EJEMPLO: Distribución de frecuencias de la duración, en horas, de uso
continuo de 212 dispositivos electrónicos iguales, sometidos a un cierto
control.
MODA

 La moda es el valor de un conjunto de datos que aparece


con mayor frecuencia. Se le obtiene fácilmente a partir de
un arreglo ordenado.
 A diferencia de la media aritmética, la moda no se afecta
ante la ocurrencia de valores extremos. Sin embargo, sólo se
utiliza la moda para propósitos descriptivos porque es más
variable, para distintas muestras, que las demás medidas de
tendencia central. Un conjunto de datos puede tener más de
una moda o ninguna.
 Su símbolo es Mo
MODA DATOS NO
AGRUPADOS

a) Moda para datos no agrupados


MODA DATOS AGRUPADOS

b) Moda para datos agrupados: existe mas de una forma de


calcularla
MODA EJEMPLO DATOS
AGRUPADOS
DIFERENTES MEDIDAS-
DIFERENTES IMPRESIONES
 El famoso trío - promedio, mediana y moda – representan tres
métodos diferentes para encontrar el valor del “centro”. Estos
tres valores pueden ser un mismo valor pero a menudo son
distintos.
 Cuando son distintos, pueden servir para diferentes
interpretaciones de los datos que queremos resumir.
EJEMPLO
 Considere el ingreso mensual de cinco familias en un barrio:
$120 000 $120 000 $300 000 $900 000 $1 000 000
 ¿Cuál es el ingreso típico de este grupo?
 El ingreso mensual promedio es:
 La mediana del ingreso mensual es:
 La moda del ingreso mensual es:
 Si Usted está tratando de promover el barrio, ¿Qué medida usaría?
 Si Usted está tratando que bajen las contribuciones, ¿Qué medida
usaría?
MEDIDA
S DE
DISPERS
IÓN
DISPERSIÓN

La dispersión muestra la disparidad que existe entre los


valores de la variable. Si es elevada, las medidas de
posición pueden resultar poco representativas, al ser una
muestra poco homogénea para esa variable. Si la dispersión
es baja, la representatividad de las medidas de posición
mejora, siendo el grupo más homogéneo.
MEDIDAS DE DISPERSIÓN

• Las medidas de tendencia central son valores en una


distribución y las medidas de la variabilidad son
intervalos, designan distancias o un número de unidades
en la escala de medición.
• Sólo pueden obtenerse con variables de escala de
intervalo o de razón en las que puede valorarse el
grado de representatividad de medidas de posición como
la media.
TIPO DE MEDIDAS DE
DISPERSIÓN
ABSOLUTAS
Recorrido
Desviación media
Varianza
Desviación estándar
Pueden ser

RELATIVAS
Coeficiente de apertura
Recorrido relativo
Coeficiente de variación
MEDIDAS DE DISPERSIÓN
ABSOLUTAS

Recorrido
Desviación media
Varianza
Desviación estándar
RECORRIDO
• Es la diferencia entre el mayor y el menor valor de
la variable:

R  xMax - x min
RECORRIDO
VENTAJAS DESVENTAJAS

• Cálculo sencillo • Sólo tiene en cuenta dos


valores de la serie.
• Le afecta la existencia de
valores extremos.
• No se refiere a ninguna
medida de posición central
por lo que no sirve para
valorar representatividad
de alguna de ellas.
DESVIACIÓN MEDIA
n

 X i 
De una población: DM  i 1

n

 Xi 
De una muestra: DM  i 1
X
n
DESVIACIÓN MEDIA
• Si no se tomaran los valores absolutos de las diferencias
entre los valores de la variable y la media el resultado sería
igual a 0.

• La DM puede calcularse respecto a la mediana y a la


moda, en el caso de que la media no sea representativa
de los valores que toma la variable.
CALCULO DE LA
DESVIACIÓN MEDIA
Caso de una Distribución de Frecuencia de Datos No
Agrupados:

Ejemplo:

Un pediatra obtuvo la siguiente tabla sobre los meses de edad de


50 niños de su consulta en el momento de empezar a caminar:
CALCULO DE LA
DESVIACIÓN MEDIA
µ = 12,2 meses
n = 50
Meses
n
(x) Niños (f) lxi-µl lxi-µl fi
 Xi 
9 1 3,2 3,2 
DM  i1
10 4 2,2 8,8
n
11 9 1,2 10,8

12 16 0,2 3,2
52
DM  50 1,04meses
13 11 0,8 8,8

14 8 1,8 14,4

15 1 2,8 2,8

50 52
CALCULO DE LA
DESVIACIÓN MEDIA
Caso de una Distribución de Frecuencia de Datos Agrupados:

Ejemplo:

Las alturas de los jugadores de un equipo de basquet vienen


dadas por la tabla:
CALCULO DE LA
DESVIACIÓN MEDIA
µ = 186,63 cm
n = 23

Nº de n
Altura

(cms)
jugado
res
MC lMCi-µl lMCi-µl fi

i 1
X i  
[170, 175) 1 172,5 14,13 14,13 DM 
n
[175, 180) 3 177,5 9,13 27,39
[180, 185) 4 182,5 4,13 16,52
[185, 190) 8 187,5 0,87 6,96
[190, 195) 5 192,5 5,87 29,35 116,09
[195, 200) 2 197,5 10,87 21,74
DM  23  5.05cm
23 116,09
VARIANZA
Es una medida de dispersión que cuantifica la variabilidad
de los datos con respecto a la media aritmética y se
denota por V(X).

Se define como la media aritmética de las desviaciones


n n
al cuadrado de cada uno de los datos con respecto
i   )
2
 axlai2  n  2
Para una población:  2 ( x )  
media. i 1 ( x
 i 1
n n
n n

 (x i x)2  x i2  nx
2

Para una muestra: s (x)


2 i 1
 i 1

n n

Cuando se refiere a la población se representa por σ2 y si se refiere a la


muestra se representa como s2
CALCULO DE VARIANZA

Meses
Niños (f) (xi-µ)2 (xi-µ)2 fi
(x)
9 1 10,24 10,24

10 4 4,84 19,36 µ = 12,2 meses


n = 50
11 9 1,44 12,96

12 16 0,04 0,64

n
13 11 0,64 7,04
 (x i   ) 2

14 8 3,24 25,92 84
 (x) 
2 i1
n  50 
2
1,68meses
15 1 7,84 7,84

50 84
CALCULO DE VARIANZA

Meses
Niños (f) xi2 xi 2 f i
(x)

9 1 81 81

10 4 100 400 µ = 12,2 meses


11 9 121 1089
n = 50
n
12 16 144 2304
 x i2  n 2

7526  50 12,2 2
13 11 169 1859
 2 (x)  i1
 
n 50 1,68
14 8 196 1568

15 1 225 225

50 7526
PROPIEDADES DE LA
VARIANZA
1. Nunca es negativa: el numerador incluye
diferencias al cuadrado.
2. Si se suma una constante k (positiva o negativa)
a todos los valores de la variable, la varianza
no cambia.
3. Si se multiplica por una constante k a todos los
valores de la variable, la varianza queda
multiplicada por k2. Si se divide por k la
varianza queda dividida por k2.
PROPIEDADES DE LA
VARIANZA
• Es un concepto estadístico sumamente
importante porque muchas de las pruebas
cuantitativas se fundamentan en él.

• En general, es difícil interpretar puesto que


su magnitud se expresa en valores al
cuadrado. Para fines descriptivos se utiliza
preferentemente la desviación estándar.
DESVIACION STANDARD
Se define como la raíz cuadrada de la varianza

n n


i 1 ( x
i ) 2
 x i2  n  2

Para una población:  ( x )   i 1

n n

n n

 (x x)2   nx
2
2i
i x
Para una muestra: s(x) i 1
 i 1

 n n

Cuando se refiere a la población se representa por σ y si se refiere a la


muestra se representa como s
CALCULO DE LA DESVIACIÓN
ESTÁNDAR
Meses
Niños (f) (xi-µ)2 (xi-µ)2 fi
(x)
9 1 10,24 10,24

10 4 4,84 19,36

µ = 12,2 meses 11 9 1,44 12,96


n = 50 12 16 0,04 0,64

13 11 0,64 7,04

14 8 3,24 25,92

15 1 7,84 7,84

n 50 84

i1(x   )
i 2
 84
 (x)  1,68meses 2  1,30meses
 n 50
CALCULO DE LA DESVIACIÓN
ESTÁNDAR
Meses
Niños (f) xi2 xi2 fi
(x)
9 1 81 81

10 4 100 400
µ = 12,2 meses
11 9 121 1089
n = 50
12 16 144 2304

13 11 169 1859

14 8 196 1568

15 1 225 225

n 50 7526
x  n
2

 (x) i1 2
i 7526  50 12,22
 1,68mes 2  1,30mes
 50
 n
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR
1. Nunca es negativa, dado que se toma la raíz
positiva.
2. Si se suma una constante k (positiva o negativa)
a todos los valores de la variable, la desviación
estándar no cambia.
3. Si se multiplica por una constante k a todos los
valores de la variable, la desviación estándar
queda multiplicada por k. Si se divide por k la
desviación estándar queda dividida por k.
DESVIACIÓN ESTÁNDAR
• Su ventaja frente a la varianza es que sus
unidades son las mismas que la variable.
Luego, puede ser comparada directamente
con la media para determinar su
representatividad.

• Se emplea con varios métodos de inferencia


estadística.
MEDIDAS DE DISPERSIÓN
RELATIVAS

• Coeficiente de apertura
• Recorrido relativo
• Coeficiente de variación
COEFICIENTE DE
APERTURA
Es el cociente entre el mayor y el menor valor de la
variable. A mayor CA, mayor dispersión.

xMax / xmin
CA =

Es sencillo de calcular pero le afecta la existencia de valores


extremadamente grandes y/o pequeños y no se refiere a
ninguna medida de posición central.
RECORRIDO RELATIVO

 Es el cociente entre el recorrido y la media. Es el número de


veces que el recorrido incluye a la media. A mayor recorrido
relativo, mayor dispersión.

Rr  xMax  xmin
X

Es sencillo de calcular y tiene en cuenta una medida de


posición central, pero le afecta la existencia de valores
extremos.
COEFICIENTE DE VARIACIÓN
Es el cociente entre la desviación estándar y la media.
Es el número de veces que la desviación estándar
incluye a la media. A mayor coeficiente de variación,
mayor dispersión.

CV = S

Expresa si la dispersión es alta o no y el grado de


representatividad de la media. Además permite comparar
coeficientes de distintas series de datos y sus
respectivos niveles de dispersión.

También podría gustarte