Documentos de Académico
Documentos de Profesional
Documentos de Cultura
C1-Métodos Estadística
C1-Métodos Estadística
• Estadística descriptiva:
Es la rama de la estadística que se ocupa de la clasificación de la información, representación gráfica y resumen
de la información a través de medidas estadísticas, lo que permite realizar un análisis de la información captada.
• Estadística inferencial:
Es la rama de la estadística que se ocupa de la aplicación de procedimientos que permiten realizar
generalizaciones hacia toda la población, utilizando la información proporcionada por una muestra aleatoria
extraída de ella.
• Universo:
Es el conjunto individuos objeto de nuestro interés de estudio.
• Población:
Es el conjunto de todos los elementos cuyas propiedades se van a estudiar. También es llamada universo.
• Muestra:
Es un subconjunto de la población. En muchas ocasiones, es importante trabajar con una muestra representativa
de la población, para ello, debemos trabajar con criterios y técnicas de muestreo. Una muestra representativa debe
reflejar las características de la población.
• Muestreo:
Es el proceso de selección de una muestra a partir de la población estadística que se desea estudiar.
• Individuo:
Es cada uno de los elementos que componen la población. También se le conoce como unidad estadística.
Definiciones
• Valor de datos:
Es el valor de la variable asociado con un elemento de una población o muestra. Este valor puede ser un número, una palabra o un
símbolo.
• Datos:
Es cada uno de los valores recolectados de la variable que se han obtenido al realizar un estudio estadístico. Por ejemplo, si le
preguntamos a 7 personas cuál es su bebida preferida, obtenemos 7 datos: Sprite, Coca Cola, Pepsi, Coca Cola, agua, Gatorade,
Coca Cola.
• Hipótesis:
Es una declaración explícita de predicción. Describe en términos concretos lo que se espera que pase o suceda en los resultados.
• Parámetro:
Es una medida estadística o indicador que resume la información proporcionada por todas las unidades elementales que forman
una población. Es un valor único o constante que usualmente es desconocido.
• Estadístico
Es una medida estadística o indicador que permite resumir la información de las observaciones proporcionadas por los elementos
que conforman una muestra. Puede tomar un valor diferente de una muestra a otra muestra, por lo tanto, es una variable.
• Variable estadística:
Es cada una de las características o cualidades que poseen individuos de una población.
Población y muestra
•
Clasificación de variables
Clasificación de variables
Cualitativas Cuantitativas
•
Estadística descriptiva
Valor •
… … … …
… … … …
Total N 1 100,0%
Estadística descriptiva
Frecuencia Frecuencia
Raza Frecuencia relativa relativa %
Labrador 3 0.025 3%
Medidas
•
Medidas de tendencia central
•
Medidas de tendencia central
•
Medidas de tendencia central
•
Medidas de tendencia central
•
Medidas de tendencia central
•
Medidas de dispersión
•
máx mín
Medidas de dispersión
•
Medidas de dispersión
•
Medidas de dispersión
•
Descripción de variables cuantitativas para datos agrupados
• utiliza
Se cuando hay una gran cantidad y variedad de datos, por lo que es conveniente agruparlos en
intervalos semiabiertos, excepto el último, que es cerrado.
Intervalo: corresponde al conjunto de datos agrupados en una tabla de frecuencia. Se escribe de la
forma donde es el límite inferior del intervalo y es el límite superior.
Marca de clase (): corresponde al valor central de cada intervalo. Es el promedio de los extremos del
intervalo.
Ejemplo: Las estaturas de los alumnos de un colegio viene dada por la tabla:
•
Amplitud: corresponde a la distancia entre los limites del intervalo. Se calcula como
•Media
aritmética: cuando se conoce la frecuencia de los datos, la
media aritmética (o promedio) se calcula mediante la fórmula:
𝑛
∑ 𝑥𝑖 ∗ 𝑓 𝑖
´ = 𝑖=1
𝑋
𝑛
Ejemplo
Según los datos de la tabla, calcular la media aritmética
Dato Frecuencia
´ = 1 ∗ 6+2∗ 5+3 ∗ 4+4 ∗10
𝑋
1 6 25
2 5
3 4 ´ = 6 +10+12+ 40 = 68 ≅ 2,72
𝑋
25 25
4 10
Total 25
Descripción de Variables cuantitativas para datos agrupados
Ejemplo
Estatura (cm) Frecuencia Marca de clase
[150, 160[ El intervalo
120 155 modal es el que tiene
mayor frecuencia,
[160, 170[ 240 por lo 165 tanto en este ejemplo es
[160, 170[
[170, 180[ 150 175
[180, 190] 80 185
Descripción de Variables cuantitativas para datos agrupados
•
Descripción de Variables cuantitativas para datos agrupados
Ejercicio 1:
En un centro Teletón se ha ido anotando durante un mes, el número de metros que cada
niño anda, seguido y sin caerse, el primer día que comienza a caminar, obteniéndose la
tabla de información adjunta:
Metros 1 2 3 4 5 6 7 8
Niños 2 6 10 5 10 3 3 2
Determine:
a) Tabla de frecuencias y diagrama de barras para frecuencias absolutas
b) Media, mediana y moda
c) Varianza y desviación estándar
Descripción de variables cuantitativas para datos agrupados
•donde
es corresponde
Intervalo: al conjunto de datos agrupados en una tabla de frecuencia. Se escribe de la forma
el límite inferior del intervalo y es el límite superior.
Marca de clase (): corresponde al valor central de cada intervalo. Es el promedio de los extremos del
intervalo.
Amplitud: corresponde a la distancia entre los limites del intervalo. Se calcula como
Número de clases: corresponde a la cantidad de clases en una tabla de frecuencia. Usualmente es un número
impar (puede ser par) y es entero. Se puede calcular de varias formas, una de ellas es la Regla de Sturges.
Regla de Sturges: es un método empírico muy utilizado en la estadística descriptiva para determinar el número de
clases que deben existir en un histograma de frecuencias, para así poder clasificar un conjunto de datos que
representan una muestra o población.
∑ 𝑥𝑖 ∗ 𝑓 𝑖
´ = 𝑖=1
𝑋
𝑛
• ¿Grafique la frecuencia?
Medidas de posición
PK = , en donde
Pi = , en donde
i = {1, 2, …, 99}
N = número total de datos.
Medidas de posición
Ejemplo
Se tienen las estaturas medidas en centímetros de 10 niños
159 160 162 162 163 168 168 170 172 175
Como los datos están ordenados de menor a mayor, la estatura 162 cm representa el
percentil 30 P(30) ya que 3 de los 10 niños tiene una estatura igual o menor a 162 cm,
es decir, un 30%, ya que: 3/10=30%
Usando la formula, para calcular, por ejemplo el percentil 80, se debe identificar el dato
X8, que corresponde a la estatura 170 cm, por lo tanto, P80=170. Esto significa que el
80% de los niños tiene una estatura menor o igual a 170 cm.
Medidas de posición
•
Percentil para datos agrupados
Los percentiles para datos agrupados, también se pueden calcular
mediante la expresión:
Pi = L+ , en donde
Ejemplo
Medidas de posición
OBSERVACIÓN: Q2
Cuartil Cuartil coincide con la
Míni Cuartil Máxi mediana.
2 3
mo 1 mo
Q2 Q3
Q1
Medidas de posición
Cálculo de los Cuartiles
1. Ordenamos los datos de menor a mayor
2. Buscamos el lugar que ocupa cada cuartil mediante la expresión
Medidas de posición
Ejemplo cálculo de los Cuartiles
Número impar de datos 2, 5, 3, 6, 7, 4, 9
Medidas de posición
Ejemplo cálculo de los Cuartiles
Número par de datos 2, 5, 3, 4, 6, 7, 1, 9
Medidas de posición
Cálculo de los cuartiles para datos agrupados
En primer lugar buscamos la clase donde se encuentra
en la tabla de frecuencias acumuladas.
Medidas de posición
Ejemplo cálculo de los cuartiles para datos agrupados
Calcular los cuartiles de la distribución de la tabla
Medidas de posición
Ejemplo cálculo de los cuartiles para datos agrupados
Medidas de posición
Ejemplo cálculo de los cuartiles para datos agrupados
Medidas de posición
Quintil
• El Quintil (Qn) es una medida estadística que se utiliza para indicar el
valor por debajo del cual se encuentra un determinado porcentaje de
observaciones.
• Cada quintil representa un 20% hasta llegar a 100% siendo 100% el total
de las muestras analizadas:
• Quintil 1 (Q1): valor que es superior al del 20% de las muestras más bajas.
• Quintil 2 (Q2): valor que es superior al del 40% de las muestras más bajas.
• Quintil 3 (Q3): valor que es superior al del 60% de las muestras más bajas.
• Quintil 4 (Q4): valor que es superior al del 80% de las muestras más bajas.
• Quintil 5 (Q5): corresponde al valor más alto.
Medidas de posición
Deciles
• Los deciles son los nueve valores que dividen la serie
de datos en diez partes iguales.
• Los deciles dan los valores correspondientes al 10%, al 20%... y al
90% de los datos.
• D5 coincide con la mediana.
Medidas de posición
Cálculo de Deciles datos agrupados
En primer lugar buscamos en la clase donde se encuentra
en la tabla de frecuencias acumuladas
Probabilidad y Estadística
Historia de la Teoría de Probabilidad
0 ≤ P(A) ≤ 1
Recuerda que…
• El valor de la probabilidad siempre se encuentra entre 0 y 1
(incluidos ambos números), es decir, 0 ≤ P(A) ≤1.
• La probabilidad de que ocurra un evento imposible es 0. Por ejemplo,
la probabilidad de obtener un 8 al lanzar un dado numerado del 1 al
6 es 0, es decir, P(X)=0.
• La probabilidad de que ocurra un evento seguro es 1. Por ejemplo, la
probabilidad de obtener un número menor que 7 al lanzar un dado
numerado del 1 al 6 es 1, es decir, P(X)=1.
Ejemplo 02 Probabilidad
P( A ) = 1 – 0,83 = 0,17
La probabilidad de que el Barcelona empate o pierda en su próximo partido de
local es de 0,17.
Regla de la suma o adición de probabilidades
Donde:
• A y B son eventos, y además: P(B) ≠ 0.
• P(A|B): es la probabilidad de que ocurra A, dado que ha ocurrido B.
• P(B|A): es la probabilidad de que ocurra B, dado que ha ocurrido A.
• P(A): es la probabilidad de que ocurra A.
• P(B): es la probabilidad de que ocurra B.
Teorema de Bayes