Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1clases de Estadistica 1.
1clases de Estadistica 1.
ESTADISTICA DESCRIPTIVA
No
Probabilistica
Probabilistica
Muestra
Muestra Muestra Muestra por Muestra a Muestra por Muestra de
Aleatoria
Sistemática Estractificada conglomerado Juicio cuota Voluntarios
simple
• CARACTERISTICA: son los rasgos o
cualidades que se van a estudiar en una
población, todos los elemento o unidades
de la población deben tenerlos, estas
pueden ser características cualitativas o
características cuantitativa
Variables
Todo estudio estadístico debe considerar
diferentes tipos de variables:
Variables
Cuando la estadística que se va a estudiar se mide en una Edad, sueldo, cantidad de bacteria,
escala numérica, son características numéricas del individuo , precio de un producto, ingresos
anuales
CUANTITATIVA Discreta: Aquellas a las que se les puede asociar un número Cantidad de amigos, edad en años,
entero, es decir, aquellas que por su naturaleza no admiten cantidad de hermanos, cantidad de
un fraccionamiento de la unidad apartamentos
Continua: aquellas que pueden tomar cualquier valor en un Velocidad de auto, estatura de una
intervalo real, persona, pesos,
CLASES DE INVESTIGACIÓN O DE
ANALISIS ESTADISTICO
• Investigación o Análisis Descriptivo:
Son las que se realizan sobre hechos
reales con el fin de explicar las
características o variables, se utilizar el
método de caso o el estadístico.
• Investigación o Análisis Experimental:
Son observaciones dirigidas en unas
condiciones rigurosamente controladas,
determinando las relaciones causa y
efecto
Etapas para un análisis estadístico
• Definición del problema de estudio y objetivos
• Selección y recogida de la información que
depende del presupuesto con el que contemos y de
la calidad de los datos exigida.
• Ordenación y clasificación de la información en
tablas y gráficos.
• Resumen de los datos mediante medidas de
posición, dispersión, asimetría y concentración.
• Análisis, interpretación y extracción de conclusiones
obteniendo hipótesis y contrastándolas.
• Extrapolación y predicción.
Ordenando la Información
xi fi fr pi Fi Fr Pi
• xi Valor de la variable
• fi Frecuencia absoluta: Número de veces que aparece un determinado valor
de x
• fr Frecuencia relativa: Número de veces que aparece un determinado valor de
x respecto al total
• pi Frecuencia absoluta acumulada: Suma de la frecuencia absoluta
correspondiente más todas las anteriores
• Frecuencia Absoluta: La frecuencia absoluta de una
variable estadística es el número de veces que aparece
en la muestra dicho valor de la variable, la
representaremos por fi
• Frecuencia Relativa:
• es el cociente entre la frecuencia absoluta y el tamaño
de la muestra. La denotaremos por fr
fi
fr
N
• Donde N es el tamaño de la muestra
Frecuencia Porcentual
• La frecuencia relativa es
un tanto por uno, sin
embargo, hoy día es
bastante frecuente hablar
siempre en términos de
tantos por ciento o pi fr 100%
porcentajes, por lo que
esta medida resulta de
multiplicar la frecuencia
relativa por 100. La
denotaremos por pi.
Frecuencia Absoluta Acumulada:
• Para poder calcular este tipo de frecuencias hay
que tener en cuenta que la variable estadística
ha de ser cuantitativa o cualitativa ordenable.
La frecuencia absoluta acumulada es la suma
de las frecuencias absolutas. y lo
representaremos por F.
Frecuencia Relativa Acumulada:
• Al igual que en el
caso anterior la
frecuencia relativa
acumulada es la
fi
suma de las Fr
frecuencias relativas N
y se denotaremos por
Fr
Porcentaje Acumulado:
• Análogamente se define
el porcentaje acumulado
y lo vamos a denotar por Pi Fi 100%
Pi como la frecuencia
relativa acumulada por
100.
EJEMPLOS
1.Supongamos que queremos hacer un estudio en la CUN
sobre el grupo de danza, hay 20 estudiantes, y les
pregunta lo siguiente:
1: Edad del encuestado
2: sexo
Las respuestas a las pregunta fueron:
mujeres_: 16,16,16,18, 16, 17,17,16,17,17,18,18,16
Hombre_: 16,17,18,18,16,17,17,
• Cuantas variables se identifican?
• De que tipo?
Ejemplo
• Veamos esto con un ejemplo: tomamos para ello los
datos relativos a las personas activas.
Personas Número
activas familias
Xi Ni Fi Pi Ni Fi Pi
1 16 16/50 32% 16 16/50 32%
2 20 20/50 40% 36 36/50 72%
3 9 9/50 18% 45 45/50 90%
4 5 5/50 10% 50 50/50 100%
Total 50
• En este ejemplo se puede ver fácilmente como se
calculan estas frecuencias.
• En una institución de enseñanza del ingles se clasifican
a los estudiantes en unos de los siguientes niveles:
elementary (E) beginner (B) intermediate (I), y upper (U),
deacuerdo con los resultados de las pruebas de
admision elementary es el nivel mas bajo y upper es el
nivel es el mas alto. La clasificación de 20 inscritos para
el primer semestre del año fue:
E, I, .E, I, I, I, B, E,U, B,U, B ,B, B, I, U, B, E, B, U
Tablas de frecuencias
147,148,149,149,150,150,151,151,152,153,153,154,156,
157,157,158, 158, 158, 158,
158,159,159,160,162,162,163,163,164,165,166,168,170,
170,170,171,173,176, 178,179, 179,
Representar los datos en tabla de frecuencia,
Analizar la información.
1. se halla el rango
rango =179-147 =32
2. Se halla el numero de intervalos = 6.3
3. Se halla la longitud de intervalo 32/6 = 5.3
que seria 5.3 que seria la longitud de mi intervalo.
Primer intervalo 147, 147 5.3 147 , 152.3
SARAMPION 41 15
120
100
80
fi
60
40
20
0
BCG SABIN DPT SARAMPION
POLIGONOS DE FRECUENCIA
• Es una representación grafica de la distribución de
frecuencia que resulta esencialmente equivalente al
histograma y se obtiene uniendo mediante segmentos los
centros de las bases superares de los rectángulos del
histograma.
fi
120
100
80
fi
60
40
20
0
BCG SABIN DPT SARAMPION
OJIVA.
100
80
60
40
20
0
BCG SABIN DPT SARAMPION
fi
DIAGRAMA CIRCULAR, PASTEL O
TORTA.
27%
41%
MEDIDAS DE TENDICIAS CENTRAL
VARIABLES CUANTITATIVAS
Media
También llamado promedio o esperanza matemática, es
un numero calculado mediante la suma de todos los
valores de dicha variable divididos por el numero total de
datos Hay distintos tipos de media.
Se simboliza asÍ
• Media Aritmética:
También llamado promedio o esperanza matemática, La media
aritmética de una variable se define como la suma ponderada de
los valores de la variable por sus frecuencias relativas y lo
denotaremos por y se calcula mediante la expresión:
x i n
xi * f i
X i 1
n i 1 N
xi representa el valor de la variable o en su caso la marca de clase.
• Media geométrica:
• La media geométrica de n observaciones es la raíz de índice n
del producto de todas las observaciones. La representaremos
por g.
• Media armónica:
• La media armónica de n observaciones es la inversa de la media
de las inversas de las observaciones y la denotaremos por h
N par N impar
Me=
• MODA (Mo):
Es el valor de la variable que tenga mayor frecuencia
absoluta, la que más se repite. Por su propia definición,
la moda no es única, pues puede haber dos o más
valores de la variable que tengan la misma frecuencia
siendo esta máxima. En cuyo caso tendremos una
distribución bimodal o polimodal según el caso.
• .
• Apoyándonos en el gráfico podemos llegar a la determinación de
la expresión para la moda que es:
Li-1 Li Ni Ni
45 55 6 6
55 65 10 16
Utilizando la fórmula aproximada
65 75 19 35
75 85 11 46
85 95 4 50
Parámetros de localización.
Y
• Deciles
• Medida de localización que divide la población o muestra
en 10 partes iguales
• No tiene mucho sentido calcularlas para variables
cualitativas discretas. Por lo que lo vamos a ver sólo para
las variables continuas.
• Dk = decil k-simo es aquel valor de la variable que deja a
su izquierda el k·10 % de la distribución.
k = 1... 9
• Percentiles:
• Medida de localización que divide la población o muestra
en 100 partes iguales
• No tiene mucho sentido calcularlas para variables
cualitativas discretas. Por lo que lo vamos a ver sólo para
las variables continuas.
• Pk = percentil k-simo es aquel valor de la variable que deja
a su izquierda el k % de la distribución.
[li-2 -- li-1) Ni-1 Ni-1 Intervalo donde se encuentra el . .
. percentil correspondiente
[li-1 -- li) Ni Ni
k=1... 99
• Ejemplo:
• Como se puede observar la forma de calcular estas
medidas es muy similar a la del cálculo de la mediana.
• Veamos el cálculo de algunas de estas medidas en el
ejemplo que estamos estudiando.
• Vamos a calcular q1, q3, d3, y p45
• Rango
• Es la medida de dispersión que indica la distancia entre el
valor mayor y menor en un grupo de datos
• Se denota como r. Realmente no es una medida muy
significativa e la mayoría de los casos, pero
indudablemente es muy fácil de calcular.
Varianza para datos no agrupados:
Es una medida de dispersión que se halla mediante la
suma de los cuadrados de la desviación respecto a las
medias, divididas entre el número de datos. Es la media de
los cuadrados de las desviaciones, y la denotaremos por
si se trata de una muestra o también por si se habla de
una población.