Documentos de Académico
Documentos de Profesional
Documentos de Cultura
María Concepción
Ruiz Sánchez
Unidad I: Conceptos Generales
1.1 Contenido:
• Definición de:
– Estadística.
– Dato.
– Información.
– Población … Parámetro.
– Muestra … Estadístico.
– Ramas de la Estadística:
• Descriptiva.
• Inferencial.
Definición de Estadística
Conjunto de
técnicas que
sirven para: Recopilar,
Ordenar,
Procesar,
Analizar,
Interpretar,
Presentar,
ESTADÍSTICA
DATOS
• Información:
– Conjunto de datos procesados que adquieren
un significado útil para una persona
determinada, en un lugar determinado, en un
tiempo determinado.
Estadística Estadística
Inferencial Descriptiva
POBLACIÓN
muestra
FINITA INFINITA
• Población: Conjunto de individuos a los que se realiza un
estudio.
• Población Finita: aquella que se puede contar, que tiene
un número determinado de individuos.
• Población Infinita: aquella que no se puede contar.
Contiene un número indeterminado de individuos.
• Muestra: Parte representativa de la población.
• Parámetro: es una característica medida a una
población.
• Estadístico: es una característica medida a una muestra.
• RAMAS DE LA ESTADÍSTICA
– Estadística descriptiva: analiza un grupo de datos definiendo sus
características.
– Estadística Inferencial: generaliza los resultados obtenidos en
una muestra a la población.
Unidad I
1.2 Escalas de Medición
Escalas de Medición
• Contenido:
• Nivel nominal
• Nivel ordinal
• Nivel de intervalo
• Nivel de razón
Tipos de Datos:
• Datos Cualitativos:
– Se distinguen por sus atributos.
• Datos Cuantitativos:
– Se aquellos a los que se les asigna un valor
numérico.
– Determine en los ejemplos que se le mencionen si son
cualitativos o cuantitativos: edad, peso, color, género,
número de salón, licencia, no. del Seguro Social,
Escala o Nivel Nominal
• Es una escala utilizada para datos
cualitativos en la cual se mide los atributos
de los objetos.
• Datos Cuantitativos:
– Ascendente y Descendente.
– Tablas de frecuencia:
» Absoluta
» Relativa
» Acumuladas
Tablas de
Distribución de Frecuencias
• Tablas de distribución de Frecuencias
Absolutas:
• Tabla que permite determinar el número de
elementos que se encuentran incluidos dentro
de cada clase o intervalo.
• Una tabla de frecuencias consta de:
– La sección donde se describen los atributos en el
caso de datos cualitativos, o bien donde se desglosan
los intervalos de clase para datos cuantitativos
(intervalos de clase).
– Y la sección donde se establece el número de datos
dentro de cada clase (frecuencia).
• Una tabla de distribución de frecuencias
siempre debe cumplir con las siguientes:
• Características:
1. Los intervalos deben ser totalmente incluyentes.
2. Los intervalos deben se mutuamente excluyentes.
3. Los intervalos deben ser del mismo tamaño.
• Implica que:
• Todos los datos deben considerarse dentro de la tabla.
• No pueden considerarse los datos en más de un intervalo.
• El tamaño regular permite realizar comparaciones.
• El cálculo para el ancho del intervalo se
propone de la siguiente forma:
– Ancho de intervalo=(MAX-min+variación)/No. de intervalos
• Donde:
• MAX es el número mayor
• min el número menor
• La variación depende de las características de los datos:
– Para datos enteros la variación es de 1
– Para datos con 1 decimal es de 0.1
– Para datos con 2 decimales es de 0.01
• El número de intervalos debe ser definido por la
persona que realiza la tabla.
• Tarea:
• Verifique en tres textos de estadística que se
recomienda para determinar el número de
intervalos.
• Debe reportar: Título del libro, autor, página y un
resumen de 2 renglones de la recomendación
para el número de intervalos para la tabla de
frecuencia.
• Ejemplo: 15.2 15.7 16.2
producción en metros
7/30=0.2333=
de 30 telares se 15.20 15.79 7 23.33%
tiene: 17/30=0.5666
=56.67%
15.80 16.39 17
6/30=0.2000=
20.00%
16.40 16.99 6
1
17.00 30 =100%
Frecuencia Acumulada
• Tablas de distribución de Frecuencias
Acumuladas Absolutas:
• Tipos:
– Menor que
– Mayor que
• Indican cuantos datos son menores que
(mayores iguales que) el límite inferior del
intervalo de clase.
• Tablas de distribución de Frecuencias
Acumuladas Relativas:
• Indican la proporción o el porcentaje de
los datos que son menores que (mayores
iguales que) el límite inferior del intervalo
de clase.
• Utilizando los datos de:
frec. Acum.
• La producción en metros frec. Acum Rel.
de 30 telares, Intervalo de fre meno mayor menor mayor
Clase c r que que que que
pertenecientes a una 15.2 15.4 2 0 30 0.00 1.00
industria con 300 telares. 15.5 15.7 5 2 28 0.07 0.93
• Realizar la tabla de 6 15.8 16 11 7 23 0.23 0.77
16.1 16.3 6 18 12 0.60 0.40
intervalos, calcular la
16.4 16.6 2 24 6 0.80 0.20
frecuencia acumulada 16.7 16.9 4 26 4 0.87 0.13
menor que y mayor que y 17.0 30 30 0 1.00 0.00
sus relativas
correspondientes
Gráficas
• Histograma:
– es el gráfico de barras de una tabla de
frecuencias, ya sean absolutas o relativas. En
el eje ‘x’ se colocan los intervalos y en el eje
‘y’ la frecuencia absoluta o relativa.
• Polígono de frecuencias:
– es un gráfico de línea tanto para la frecuencia
absoluta como para la relativa. Se colocan
puntos en la parte central del intervalo y la
altura corresponde a la frecuencia.
• Ojivas:
– son gráficas de línea de la frecuencia acumulada. En
el eje ‘x’ se colocan los intervalos y en el eje ‘y’ la
frecuencia acumulada absoluta o relativa.
– Los puntos de la gráfica deben situarse al inicio del
intervalo.
• Circulograma:
– Gráfica que permite visualizar la frecuencia relativa
en forma proporcional dentro del círculo. Para
realizarla se requieren 3.6o por cada punto porcentual
de la frecuencia relativa.
Unidad I
1.4 Medidas de Tendencia Central
1.5 Medidas de Dispersión
1.6 Medidas de Posición
Introducción
• Las medidas de Tendencia Central y las
de Dispersión resultan ser valores útiles
para resumir comportamientos en un
grupo de datos.
• La Media Aritmética, de
x i
una población : i 1
N
n
• La media aritmética de la
muestra:
x i
x i 1
n
– En donde:
• xi son los datos,
• N el tamaño de la
población, y
• n el tamaño de la muestra.
Mediana
• La mediana es una medida de posición
que indica el valor del dato que se
encuentra en el centro del grupo de datos
ordenado.
• Se localiza el lugar tomando el número de
datos más uno y dividiéndolo entre 2.
• En el caso de datos impares sólo se tiene
una media.
• En el caso de datos pares se toman los
dos valores del centro y se promedian.
Moda
• La moda es el dato que se repite mayor
número de veces.
• Se pueden tener grupos de datos:
– A modales (no hay un dato que se repita)
– Unimodales.
– Bimodales.
– Trimodales.
– Multimodales.
• TAREA:
• Rango = Max-min
Varianza
• La varianza es uno de los indicadores más
valiosos en ingeniería.
• Su valor se obtiene calculando la Suma del
cuadrado de la distancia de cada dato hacia el
valor promedio, y dividiendo este valor entre el
número de datos (si es población).
• La varianza poblacional se representa por la
letra griega sigma al cuadrado 2
• La varianza para la muestra se simboliza con s2.
• Varianza de la población:
N
• Varianza de la muestra: (x ) i
2
2 i 1
– En donde: N
• xi es cada uno de los
datos, n
• es la media de la
población,
• N el número de datos de
( x x)
i
2
la población, s
2 i 1
• x la media de la muestra,
• n el tamaño de la muestra.
n 1
Desviación Estándar
• La desviación estándar es la raíz
cuadrada de la varianza.
• La desviación estándar poblacional se
representa por la letra griega sigma al
cuadrado
• La desviación estándar para la muestra se
simboliza con s.
N
• Desviación estándar de la
población: (x ) i
2
i 1
N
• Desviación estándar de la
muestra: n
– En donde:
• xi es cada uno de los datos,
( x x)
i
2
• es la media de la s i 1
población,
• N el número de datos de la
n 1
población,
• x la media de la muestra,
• n el tamaño de la muestra.
Datos agrupados
• ¿qué son los datos agrupados?
• ¿por el hecho de tener una tabla de
distribución de frecuencias se tienen datos
agrupados? Explique su respuesta.
MC f i i
i 1
N
n
MC f i i
x i 1
n
Para datos agrupados…
• Varianza:
N
(MC )
i
2
fi
2 i 1
N
n
i
( MC x ) 2
fi
s
2 i 1
n 1
Para datos agrupados…
• Desviación Estándar:
N
i
( MC ) 2
fi
i 1
N
n
i
( MC x ) 2
fi
s i 1
n 1
1.6 Medidas de Posición
• Las medidas de Posición:
– Se usan para describir la posición que tiene el valor
de un dato específico con relación al resto de los
datos.
• Cuartiles: son los valores de la variable que
dividen en cuartos a los datos ordenados.
– Cada conjunto de datos posee 3 cuartiles:
– Q1 o primer cuartil: el 25% de los datos es menor a Q1 y el
75% es mayor.
– Q2 o segundo cuartil: el 50% de los datos es menor a Q2 y el
50% es mayor.
– Q3 o tercer cuartil: el 75% de los datos es menor a Q3 y el 25%
es mayor.
• Percentiles: son los valores de la
variable que dividen al conjunto de datos
ordenados en 100 partes.
– Cada conjunto de datos posee 99 percentiles:
– El k-ésimo percentil Pk es el valor en el qie k% de los
datos son más pequeños y (100-k)% son mayores.
• Nota:
– Q1=P25
– Q2=P50
– Q3=P75
• Para encontrar el k-ésimo percentil, se busca el
dato en la posición nk/100.
nk
Pk Lugardelda to
100
• Si nk/100 es entero se agrega 0.5 y se
promedian el valor anterior y el posterior en la
posición encontrada.
• Si nk/100 es fracción, se aproxima al siguiente
entero.