Está en la página 1de 43

Probabilidad y Estadística

Dra. Daniela Cortés Toto


daniela.cortes@udlap.mx
CN 208 H

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA


Capítulo 1
Introducción a la Estadística

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA


¿Qué es la estadística?

Estadística: Es un conjunto de procedimientos para reunir, medir,


clasificar, codificar, computar, analizar y resumir información
numérica adquirida sistemáticamente

La información sistemáticamente adquirida que se organiza


siguiendo los procedimientos de la ciencia y la estadística se llama
dato o datos.

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA


Conceptos generales de la estadística

Estadística

Descriptiva Inferencial

Recolección Organización Presentación Interpretació Toma de


Pronósticos
de datos de los datos de datos n decisiones

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Conceptos generales de la estadística

Población: Universo de personas u objetos de interés


particular que deseamos estudiar y entender.

Muestra: Subconjunto de la población; la muestra se


observa y se mide y después se utiliza para obtener
conclusiones sobre la población.

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Conceptos generales de la estadística

Parámetro: Cálculo resumido de mediciones realizadas


en todos los sujetos de una población.

Estadístico: Cálculo resumido de mediciones realizadas


en una muestra para estimar un parámetro poblacional.

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Conceptos generales de la estadística

Muestra representativa: Muestra en la que todos los


segmentos de la población están incluidos en la muestra
en sus proporciones correctas respecto a la población.

Muestra no representativa: Es aquella en la que algunos


segmentos de la población están incluidos en la muestra
en sus proporciones correctas respecto a la población.

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Conceptos generales de la estadística

Muestra aleatoria simple: Muestra en la cual cada


persona (u objeto) de la población tiene la misma
oportunidad de ser seleccionado(a) para formar parte de
la muestra.

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Datos y conjunto de datos

• Los datos son los hechos y cifras recopilados,


analizados y resumidos para su presentación e
interpretación.
• Todos los datos recopilados en un estudio en
particular se conocen como el conjunto de datos para
el estudio.

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Elemento, variable y observación.

 •
Los elementos son las entidades sobre las que se recopilan los
datos.
• Una variable es una característica de interés para los elementos.
• El conjunto de medidas obtenidas para un elemento en particular
se llama observación.
• Un conjunto de datos con elementos contiene observaciones.
• El número total de valores de datos en un conjunto de datos
completo es el número de elementos multiplicado por el número
de variables.

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


• Masculino • 1.60 mts
• Femenino • 1.70 mts.
• 1.53 mts.

Género Estatura

Variables que
describen a una Color
persona Edad de
cabello
• 29 años • Negro
• 45 años • Rubio
• Castaño

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Datos, conjunto de datos, elemento, variable y observación.

Variables

Persona Color de cabello Edad Estatura


María Negro 45 1.58
Jorge Castaño 26 1.67
Andrea Rubio 33 1.73 Observación
Elementos Miguel Castaño 29 1.60
Sandra Negro 41 1.71

Conjunto de datos

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Tipos de variables

Cualidades Números
o atributos
UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx
Escalas o niveles de medición

La medición es la asignación de símbolos, tanto nombres como


números, a las diferencias que observamos en las cualidades o
cantidades de una variable

Nivel de medición de una variable: Identifica las propiedades de


medición de una variable y determina el tipo de operaciones
matemáticas que puede usarse apropiadamente con dicho nivel.
WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Escalas de medición

Lugar de nacimiento
Categorías Sabor favorito
Nominal
Dicotómicas Carrera académica

Nivel educativo
Ordinal Categorías Clasificación de vivienda
Jerarquías Estrato social

Unidad numérica Estatura


Intervalo de medición CI
Temperatura

Punto cero Estatura


Razón WORDS
verdadero: ausencia Edad NUMBERS
del atributo Distancia

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Escalas o niveles de medición

• La escala de medición determina la cantidad de información


contenida en los datos.
• La escala de medición indica el análisis estadístico más apropiado
para los datos.

WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Escala ordinal
Los datos son etiquetas o nombres que se utilizan para identificar un atributo del
elemento.
Se puede utilizar una etiqueta no numérica o un código numérico.

Ejemplo
Los estudiantes de una universidad se clasifican según la escuela en la que están
inscritos mediante una etiqueta no numérica como Negocios, Humanidades,
Ciencias, Artes, etc.
Alternativamente, se podría usar un código numérico para la variable de la escuela
(por ejemplo, 1 denota Negocios, 2 denota Humanidades, 3 denota Ciencias, 4
denota Artes, etc.). WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Escala nominal
Los datos tienen las propiedades de los datos nominales y el orden o rango de los
datos es significativo.
Se puede utilizar una etiqueta no numérica o un código numérico.

Ejemplo
Los estudiantes de una universidad se clasifican según el nivel de su clase utilizando
una etiqueta no numérica como “estudiante de primer año”, “estudiante de segundo
año”, etc.
Alternativamente, se podría usar un código numérico para la variable permanente de
la clase (por ejemplo, 1 denota estudiante de primer año, 2 denota estudiante de
segundo año, y así sucesivamente).WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Escala de intervalo

Los datos tienen las propiedades de los datos ordinales y el intervalo entre
observaciones se expresa en términos de una unidad de medida fija.
Los datos de intervalo son siempre numéricos.

Ejemplo
Melissa tiene un puntaje SAT de 1985, mientras que Kevin tiene un puntaje SAT de
1880. Melissa obtuvo 105 puntos más que Kevin.

WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Escala de razón
Los datos tienen todas las propiedades de los datos de intervalo y la proporción o
razón de dos valores es significativa.
Los datos de razón son siempre numéricos.
El valor cero está incluido en la escala.

Ejemplo:
El precio de un libro en una tienda minorista es de $ 200, mientras que el precio del
mismo libro vendido en línea es de $ 100. La propiedad de proporción muestra que
las tiendas minoristas cobran el doble del precio en línea (pues 200/100=2).

WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Escala de intervalo o de razón

Ejemplo:

1. Un joven de 90 kg. es dos veces más pesado que uno de 45 kg. La


razón es 2:1
2. Pero no tiene sentido afirmar que una variable temperatura en
Mérida, donde hay 80 grados Fahrenheit, es cuatro veces más
calurosa que en Wiscosin, donde hay 20 grados (Wisconsin no es
caluroso en absoluto).

Con una variable de nivel de razón, la respuesta para una razón


calculada tiene sentido, mientras
WORDS que con una variable
NUMBERSde intervalo
no la tiene.
UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx
Tipos de variables

Cualquier
Enteros
WORDS NUMBERS
número

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


VARIABLE DISCRETA CONTINUA

PESO

80 kg. 83 88.75 90 kg.


WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


VARIABLE DISCRETA CONTINUA

POBLACIÓN

1 persona ½ persona
2 personas Pero nunca (sólo enteros)
WORDS
3 personas

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Escalas de medición

Datos

Cualitativos Cuantitativos

Numéricos No-numéricos Numéricos

Nominal Ordinal Nominal Ordinal Intervalo Razón


WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Capítulo 2
Estadística descriptiva

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA


Gráficos para datos cualitativos

Datos
cualitativos

Gráfico Gráfico de
Gráfico de circular barras
barras
agrupadas

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Distribución de frecuencias

Distribución de frecuencias: Lista de todas las puntuaciones


observadas de una variable y la frecuencia (absoluta, relativa,
acumulada y/o porcentual) de cada puntuación o categoría.

WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


daniela.cortes@udlap.mx
Una bolsa de M&Ms contiene 25 dulces
Datos en bruto

Tabla de distribución de frecuencias:


Color Frecuencia Frecuencia Porcentaje Frecuencia relativa acumulada
absoluta relativa

Rojo 3 3/25 = .12 12% 0.12


Azul 6 6/25 = .24 24% 0.12+0.24=0.36
Verde 4 4/25 = .16 16% 0.36+0.16=0.52
Naranja 5 5/25 = .20 20% 0.52+0.20=0.72
Café 3 3/25 = .12 12% 0.72+0.12=0.84
Amarillo 4 4/25 = .16 16% 0.84+0.16=1 NUMBERS
Total 25 1 100
UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx
Una bolsa de M&Ms contiene 25 dulces
Datos en bruto

Frequency
3

Green Brown
16.0% 12.0% 1

0
Gráfico de pastel Y ellow
16.0%
Brown Yellow Red
Color
Blue Orange Green

Orange
20.0%

Red
12.0%
Gráfica de barras
Blue
24.0%
NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Ejemplos de gráficos para datos cualitativos

Cincuenta personas se agrupan en cuatro categorías: A, B,C,D, y el número de personas que caen en
cada categoría se muestra en los gráficos:

Gráfico de barras
Gráfico circular 25

5 11 20
20

15 14
A
B 11
C 10

D 5
5
20

0
14 A B C D

FRECUENCIA

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Gráfico de barras agrupadas

Gráfico de barras lado a lado Salarios de profesores por rango y tipo de


120 universidad

100
Profesor Profesor Profesor
80
de adjunto auxiliar
tiempo
60
completo

40 Pública 98.1 72.7 61.5


Privada 110.5 74.9 61.6
20

0
Profesor de tiempo completo Profesor adjunto Profesor auxiliar

Pública Privada

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Ejercicio

Un fabricante de jeans tiene plantas en California, Arizona y Texas. Un grupo de 25 pares de jeans se
selecciona al azar de la base de datos, registrándose el estado en el cuál se produjo cada uno.

CA CA AZ CA CA
Organizar y presentar los datos en gráficos.
AZ CA AZ AZ AZ

AZ TX CA TX AZ

TX TX AZ TX CA

CA TX TX TX CA

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Histograma, polígono de frecuencias y ojiva

Un histograma de frecuencia es un diagrama de 90 grados que


presenta las puntuaciones de una variable de intervalo/razón a lo
largo del eje horizontal, y la frecuencia de cada puntuación en una
columna paralela al eje vertical.

Un polígono de frecuencia es un gráfico de 90 grados con la


puntuación de intervalo/razón trazada sobre el eje horizontal, y las
frecuencias de puntuación descritas por las alturas de puntos
localizados sobre puntuaciones y enlazados por líneas rectas.
WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


DATOS: Tiempo en días
 Tiempo en días requerido para completar
auditorías de fin de año para una muestra de 12 14 19 18
20 clientes de Sanderson y Clifford, una 15 15 18 17
pequeña firma de contadores públicos. 20 27 22 23
Punto Frecuencia Frecuencia Frecuencia 22 21 33 28
Tiempo relativa o Porcentaje acumulada
medio absoluta 14 18 16 13
proporcional relativa
De 9 a menos
12 4 0.2 20% 0.2
de 15
De 15 a HISTOGRAMA
18 9 0.45 45% 0.45
menos de 21 9
8
De 21 a
24 4 0.2 20% 0.2 7
menos de 27 6
5
De 27 a
menos de 33 30 2 0.1 10% 0.1 4
3
2
De 33 a
menos de 39 36 1 0.05 5% 0.05 1
0
1 2 3 4 5
TOTAL   20 1 100% 1

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Selección del número de clases
Regla de Sturges

 𝑁𝑢𝑚 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 =1+ 𝑙𝑜𝑔2 ( 𝑀 )

 Donde es el tamaño de la muestra.

Una forma equivalente de calcularlo a partir de logaritmo en base 10 es la siguiente

  𝑙𝑜𝑔 10 ( 𝑀 )
𝑁𝑢𝑚 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 =1+
𝑙𝑜𝑔 10 ( 2 )

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


SIMETRÍA Y SESGO

Histograma simétrico

Fuente: Newbold P. et al (2008)

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


SIMETRÍA Y SESGO

Histograma con sesgo Histograma con sesgo


positivio negativo

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


¿Cómo interpretar un
histograma?

1. Observa la altura de las barras. La columna más alta indica el


valor de la puntuación en X que tenga la frecuencia más alta f.
2. Busca grupos de puntuaciones y ve si hay una “tendencia central”,
un valor de puntuación de X alrededor del que se centra la
distribución.
3. Busca la simetría o equilibrio en la distribución de las
puntuaciones.
WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


¿Cómo interpretar un
polígono de frecuencia?

1. Busca picos. El pico más alto indica el valor X con la frecuencia


más alta.
2. Busca simetría o equilibrio en la distribución de las puntuaciones.

WORDS NUMBERS

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Medidas de tendencia central
 • Media (promedio)
Sean observaciones o mediciones de una variable cuantitativa, la media es el número:

Donde es el número total de observaciones mediciones.

• Mediana

• Moda

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Dispersión

Los analistas financieros están preocupados por la dispersión de las ganancias de una
empresa. Las ganancias ampliamente dispersas que van desde extremadamente altas a
extremadamente bajas e incluso a niveles negativos son indicativas de un riesgo mayor
para los accionistas y para los acreedores que las ganancias que permanecen
relativamente estables.

De manera similar, los expertos en el control de la calidad analizan la dispersión de los


niveles de calidad de un producto. Una medicina cuya pureza promedio es buena, pero
que oscila desde muy pura hasta muy impura puede ser peligrosa para la vida humana.

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx


Medidas de dispersión
 • Varianza poblacional

• Desviación estándar poblacional

Donde:
• Varianza de la población
• : Elemento u observación
• Media de la población
• Número total de elementos de la población

UNIVERSIDAD DE LAS AMÉRICAS PUEBLA daniela.cortes@udlap.mx

También podría gustarte