Está en la página 1de 51

Unidad I

1.1 Conceptos generales

María Concepción
Ruiz Sánchez
Unidad I: Conceptos Generales
1.1 Contenido:
• Definición de:
– Estadística.
– Dato.
– Información.
– Población … Parámetro.
– Muestra … Estadístico.
– Ramas de la Estadística:
• Descriptiva.
• Inferencial.
Definición de Estadística
Conjunto de
técnicas que
sirven para: Recopilar,
Ordenar,
Procesar,
Analizar,
Interpretar,
Presentar,

ESTADÍSTICA

DATOS

Para obtener información útil


en la ¡¡toma de decisiones!!
• Dato:
– Unidad básica de información.

• Información:
– Conjunto de datos procesados que adquieren
un significado útil para una persona
determinada, en un lugar determinado, en un
tiempo determinado.
Estadística Estadística
Inferencial Descriptiva

POBLACIÓN

muestra

FINITA INFINITA
• Población: Conjunto de individuos a los que se realiza un
estudio.
• Población Finita: aquella que se puede contar, que tiene
un número determinado de individuos.
• Población Infinita: aquella que no se puede contar.
Contiene un número indeterminado de individuos.
• Muestra: Parte representativa de la población.
• Parámetro: es una característica medida a una
población.
• Estadístico: es una característica medida a una muestra.

• RAMAS DE LA ESTADÍSTICA
– Estadística descriptiva: analiza un grupo de datos definiendo sus
características.
– Estadística Inferencial: generaliza los resultados obtenidos en
una muestra a la población.
Unidad I
1.2 Escalas de Medición
Escalas de Medición
• Contenido:
• Nivel nominal

• Nivel ordinal

• Nivel de intervalo

• Nivel de razón
Tipos de Datos:

• Datos Cualitativos:
– Se distinguen por sus atributos.

• Datos Cuantitativos:
– Se aquellos a los que se les asigna un valor
numérico.
– Determine en los ejemplos que se le mencionen si son
cualitativos o cuantitativos: edad, peso, color, género,
número de salón, licencia, no. del Seguro Social,
Escala o Nivel Nominal
• Es una escala utilizada para datos
cualitativos en la cual se mide los atributos
de los objetos.

• Los datos pueden ordenarse alfabéticamente, o


bien asociarse por atributo, generando lo que se
conoce como tablas de frecuencia. Esto permite
cuantificar cuántos elementos se tienen por
atributo y establecer la razón o proporción de cada
uno de los atributos con respecto al total.
Escala o Nivel Ordinal
• Escala cualitativa que permite determinar
la posición que ocupa un dato
determinado dentro de un grupo
ordenado.

• Todo lo que representa posiciones (primero,


segundo, tercero, último, penúltimo, etc.)
Escala o Nivel de Intervalo
• Escala para datos cuantitativos que permite
ubicar los datos dentro de intervalos
específicos, con espaciamientos periódicos,
permite medir posiciones establecidas, sin la
existencia de un cero real.

• Al ser cuantitativos, los datos pueden ser ordenados en


forma ascendente o descendente, además se pueden utilizar
tablas de frecuencia absoluta, relativa, acumuladas. Y
aplicar algunos procesos estadísticos como medidas de
tendencia central y de dispersión.
Escala o Nivel de Razón
• Escala cuantitativa que permite medir
posiciones establecidas, simétricas y
escalables entre un punto y otro, con la
existencia de un cero real.
• El cero real implica la desaparición del objeto
por falta de esa característica.

• Además de los procesos de la escala de intervalo, los datos


pueden ser sometidos a procesos estadísticos más
complejos de comparación entre ellos.
Unidad I
1.3 Organización de Datos
Dependiendo del tipo de datos:
• Datos Cualitativos:
– Orden alfabético.
– Tablas de frecuencia:
» Absoluta
» Relativa

• Datos Cuantitativos:
– Ascendente y Descendente.
– Tablas de frecuencia:
» Absoluta
» Relativa
» Acumuladas
Tablas de
Distribución de Frecuencias
• Tablas de distribución de Frecuencias
Absolutas:
• Tabla que permite determinar el número de
elementos que se encuentran incluidos dentro
de cada clase o intervalo.
• Una tabla de frecuencias consta de:
– La sección donde se describen los atributos en el
caso de datos cualitativos, o bien donde se desglosan
los intervalos de clase para datos cuantitativos
(intervalos de clase).
– Y la sección donde se establece el número de datos
dentro de cada clase (frecuencia).
• Una tabla de distribución de frecuencias
siempre debe cumplir con las siguientes:
• Características:
1. Los intervalos deben ser totalmente incluyentes.
2. Los intervalos deben se mutuamente excluyentes.
3. Los intervalos deben ser del mismo tamaño.
• Implica que:
• Todos los datos deben considerarse dentro de la tabla.
• No pueden considerarse los datos en más de un intervalo.
• El tamaño regular permite realizar comparaciones.
• El cálculo para el ancho del intervalo se
propone de la siguiente forma:
– Ancho de intervalo=(MAX-min+variación)/No. de intervalos
• Donde:
• MAX es el número mayor
• min el número menor
• La variación depende de las características de los datos:
– Para datos enteros la variación es de 1
– Para datos con 1 decimal es de 0.1
– Para datos con 2 decimales es de 0.01
• El número de intervalos debe ser definido por la
persona que realiza la tabla.

• Tarea:
• Verifique en tres textos de estadística que se
recomienda para determinar el número de
intervalos.
• Debe reportar: Título del libro, autor, página y un
resumen de 2 renglones de la recomendación
para el número de intervalos para la tabla de
frecuencia.
• Ejemplo: 15.2 15.7 16.2

• Datos de la 15.4 15.7 16.3

producción en metros 15.6 15.8 16.3

de 30 telares, 15.6 15.8 16.3

pertenecientes a una 15.6 15.8 16.4


industria con 300 15.9 16.0 16.6
telares. 15.9 16.0 16.7
15.9 16.0 16.8
15.9 16.1 16.8
16.0 16.2 16.9
• Proceso para el cálculo del ancho del
intervalo:
• A.deI.=(16.9-15.2+.1)/No.Interv.

• A.de I.=1.80/ no.Interv.


• Para:
• 3 interv. A.de I=0.60
• 5 interv. A.de I=0.36
• 6 interv. A.de I=0.30
Metodología propuesta:
• Ejemplo para 3 intervalos:
• Se calcula el ancho del intervalo. • A. de I.=(16.9-15.2+0.1)/3=0.6
• Para realizar la tabla se inicia con
el número menor. • 15.2+0.6=15.8
• Al número menor debe sumarse el • 15.8+0.6=16.4
ancho del intervalo y colocarlo en
la siguiente posición. • 16.4+0.6=17.0
• Este procedimiento se repite hasta • 15.8-0.1=15.7
lograr el número de intervalos +1. • 16.4-0.1=16.3
• Posteriormente se calculan los
límites superiores de cada • 17.0-0.1=16.9
intervalo considerando el número
inmediato anterior al siguiente Intervalos de clase Frec.
intervalo.
• Se cuentan los datos dentro de 15.2 7
cada intervalo y se coloca dentro 15.7
de la columna de frecuencia. 15.8 16.3 17
• La suma de las frecuencias debe 16.4 16.9 2
ser igual al número total de datos.
17.0 30
Intervalo de Calse frec
15.20 15.79 7
15.80 16.39 17

• Ejemplo de 3 tablas 16.40 16.99 6


30
17.00

de frecuencia para los Intervalo de Clase frec

datos de la 15.20 15.55 2


15.56 15.91 12
producción de los 15.92 16.27 7
telares: 16.28 16.63 5
16.64 16.99 4
• Para: 17.00

• 3 interv. A.de I.=0.60 Intervalo de Clase


15.20 15.49
frec
2

• 5 interv. A.de I.=0.36 15.50 15.79 5


15.80 16.09 11
• 6 interv. A.de I.=0.30 16.10 16.39 6
16.40 16.69 2
16.70 16.99 4
• Tablas de distribución de Frecuencias
Relativas:
– Tabla que permite determinar la proporción
que representa el intervalo dentro del
conjunto de datos.
– Puede ser expresada en porcentaje, caso en
el cuál representará el porcentaje de cada
uno de los intervalos para el grupo de datos.
– La suma de la frecuencia relativa es 1.
• Utilizando el ejemplo
de los datos de la Intervalo de Calse Frec. Frec. Rel.

producción en metros
7/30=0.2333=
de 30 telares se 15.20 15.79 7 23.33%

tiene: 17/30=0.5666
=56.67%
15.80 16.39 17

6/30=0.2000=
20.00%
16.40 16.99 6

1
17.00 30 =100%
Frecuencia Acumulada
• Tablas de distribución de Frecuencias
Acumuladas Absolutas:
• Tipos:
– Menor que
– Mayor que
• Indican cuantos datos son menores que
(mayores iguales que) el límite inferior del
intervalo de clase.
• Tablas de distribución de Frecuencias
Acumuladas Relativas:
• Indican la proporción o el porcentaje de
los datos que son menores que (mayores
iguales que) el límite inferior del intervalo
de clase.
• Utilizando los datos de:
frec. Acum.
• La producción en metros frec. Acum Rel.
de 30 telares, Intervalo de fre meno mayor menor mayor
Clase c r que que que que
pertenecientes a una 15.2 15.4 2 0 30 0.00 1.00
industria con 300 telares. 15.5 15.7 5 2 28 0.07 0.93
• Realizar la tabla de 6 15.8 16 11 7 23 0.23 0.77
16.1 16.3 6 18 12 0.60 0.40
intervalos, calcular la
16.4 16.6 2 24 6 0.80 0.20
frecuencia acumulada 16.7 16.9 4 26 4 0.87 0.13
menor que y mayor que y 17.0   30 30 0 1.00 0.00
sus relativas
correspondientes
Gráficas
• Histograma:
– es el gráfico de barras de una tabla de
frecuencias, ya sean absolutas o relativas. En
el eje ‘x’ se colocan los intervalos y en el eje
‘y’ la frecuencia absoluta o relativa.

• Polígono de frecuencias:
– es un gráfico de línea tanto para la frecuencia
absoluta como para la relativa. Se colocan
puntos en la parte central del intervalo y la
altura corresponde a la frecuencia.
• Ojivas:
– son gráficas de línea de la frecuencia acumulada. En
el eje ‘x’ se colocan los intervalos y en el eje ‘y’ la
frecuencia acumulada absoluta o relativa.
– Los puntos de la gráfica deben situarse al inicio del
intervalo.
• Circulograma:
– Gráfica que permite visualizar la frecuencia relativa
en forma proporcional dentro del círculo. Para
realizarla se requieren 3.6o por cada punto porcentual
de la frecuencia relativa.
Unidad I
1.4 Medidas de Tendencia Central
1.5 Medidas de Dispersión
1.6 Medidas de Posición
Introducción
• Las medidas de Tendencia Central y las
de Dispersión resultan ser valores útiles
para resumir comportamientos en un
grupo de datos.

• Las medidas de Posición, ayudan a


distinguir la forma de distribución de los
datos dentro del conjunto.
1.4 Medidas de Tendencia Central
• Las Medidas de Tendencia Central indican
con un número el valor central de un
grupo de datos.
• Las medidas más comunes son:
– Media Aritmética.
– Mediana.
– Moda.
» NOTA: Existen más pero solo éstas están incluidas
en el temario.
Media Aritmética
• La Media Aritmética, también conocida
como promedio se calcula sumando todos
los datos y dividiéndolos entre el número
total de ellos.
• Si se realiza el promedio de una población
se simboliza con la letra griega  (mu o
miu).
• La media aritmética de la muestra se
simboliza por x testada.
Media Aritmética
N

• La Media Aritmética, de
x i

una población :  i 1

N
n
• La media aritmética de la
muestra:
x i
x i 1
n
– En donde:
• xi son los datos,
• N el tamaño de la
población, y
• n el tamaño de la muestra.
Mediana
• La mediana es una medida de posición
que indica el valor del dato que se
encuentra en el centro del grupo de datos
ordenado.
• Se localiza el lugar tomando el número de
datos más uno y dividiéndolo entre 2.
• En el caso de datos impares sólo se tiene
una media.
• En el caso de datos pares se toman los
dos valores del centro y se promedian.
Moda
• La moda es el dato que se repite mayor
número de veces.
• Se pueden tener grupos de datos:
– A modales (no hay un dato que se repita)
– Unimodales.
– Bimodales.
– Trimodales.
– Multimodales.
• TAREA:

– Discutir cuál de las medidas de tendencia


central vistas es la mejor, defendiendo su
punto de vista.
1.5 Medidas de Dispersión
• Las Medidas de Dispersión que tanto varían los
datos.
• Las medidas más comunes son:
– Rango.
– Varianza.
– Desviación estándar.
• La varianza y la desviación estándar indican el
valor promedio de la distancia del grupo de
datos al valor promedio.
» NOTA: Existen más pero solo éstas están incluidas en el
temario.
Rango
• El rango es el valor que indica la variación
del grupo de datos con respecto a su valor
mínimo y máximo.

• Se calcula sustrayendo del valor máximo


el valor mínimo.

• Rango = Max-min
Varianza
• La varianza es uno de los indicadores más
valiosos en ingeniería.
• Su valor se obtiene calculando la Suma del
cuadrado de la distancia de cada dato hacia el
valor promedio, y dividiendo este valor entre el
número de datos (si es población).
• La varianza poblacional se representa por la
letra griega sigma al cuadrado 2
• La varianza para la muestra se simboliza con s2.
• Varianza de la población:
N

• Varianza de la muestra:  (x  ) i
2

 
2 i 1
– En donde: N
• xi es cada uno de los
datos, n
•  es la media de la
población,
• N el número de datos de
 ( x  x)
i
2

la población, s 
2 i 1
• x la media de la muestra,
• n el tamaño de la muestra.
n 1
Desviación Estándar
• La desviación estándar es la raíz
cuadrada de la varianza.
• La desviación estándar poblacional se
representa por la letra griega sigma al
cuadrado 
• La desviación estándar para la muestra se
simboliza con s.
N
• Desviación estándar de la
población:  (x  ) i
2

  i 1
N
• Desviación estándar de la
muestra: n
– En donde:
• xi es cada uno de los datos,
 ( x  x)
i
2

•  es la media de la s  i 1
población,
• N el número de datos de la
n 1
población,
• x la media de la muestra,
• n el tamaño de la muestra.
Datos agrupados
• ¿qué son los datos agrupados?
• ¿por el hecho de tener una tabla de
distribución de frecuencias se tienen datos
agrupados? Explique su respuesta.

• ¿Qué es Marca de Clase?


• ¿Cómo se calcula? (variaciones)
Para datos agrupados…
• Media Aritmética:
N

 MC  f i i
 i 1
N
n

 MC  f i i
x i 1
n
Para datos agrupados…
• Varianza:
N

 (MC   )
i
2
 fi
 
2 i 1
N
n

 i
( MC  x ) 2
 fi
s 
2 i 1
n 1
Para datos agrupados…
• Desviación Estándar:
N

 i
( MC   ) 2
 fi
  i 1
N
n

 i
( MC  x ) 2
 fi
s  i 1
n 1
1.6 Medidas de Posición
• Las medidas de Posición:
– Se usan para describir la posición que tiene el valor
de un dato específico con relación al resto de los
datos.
• Cuartiles: son los valores de la variable que
dividen en cuartos a los datos ordenados.
– Cada conjunto de datos posee 3 cuartiles:
– Q1 o primer cuartil: el 25% de los datos es menor a Q1 y el
75% es mayor.
– Q2 o segundo cuartil: el 50% de los datos es menor a Q2 y el
50% es mayor.
– Q3 o tercer cuartil: el 75% de los datos es menor a Q3 y el 25%
es mayor.
• Percentiles: son los valores de la
variable que dividen al conjunto de datos
ordenados en 100 partes.
– Cada conjunto de datos posee 99 percentiles:
– El k-ésimo percentil Pk es el valor en el qie k% de los
datos son más pequeños y (100-k)% son mayores.
• Nota:
– Q1=P25
– Q2=P50
– Q3=P75
• Para encontrar el k-ésimo percentil, se busca el
dato en la posición nk/100.

 nk 
Pk   Lugardelda to 
 100 
• Si nk/100 es entero se agrega 0.5 y se
promedian el valor anterior y el posterior en la
posición encontrada.
• Si nk/100 es fracción, se aproxima al siguiente
entero.

También podría gustarte