Está en la página 1de 79

Módulo:

ESTADISTICA
DESCRIPTIVA

Docente: Ing. Raúl Omar Di Marco M.


Magíster en Adm. De Empresas.
Especialista en Finanzas.
email: raulomard@yahoo.com
AGOSTO / 2019
ESTADISTICA
OBJETIVOS:

• Facilitar la comprensión de las herramientas estadísticas analizando su


impacto y efectividad dentro de las organizaciones, así como su utilización
dentro de los procesos de investigación y desarrollo empresarial.

• Describir y explicar los elementos fundamentales estadísticos, reconociendo su


importancia y la aplicación de la misma.

• Entender y manejar los conceptos básicos de la estadística descriptiva,


reconociendo y aplicando correctamente los términos estadísticos, así como
los métodos de Investigación.

• Estar en capacidad de desarrollar pequeñas investigaciones, aplicando


diferentes métodos de muestreo e interpretando los resultados obtenidos, para
proyectar y analizar su comportamiento futuro.
ESTADISTICA
1.- ORIGEN:

• STATUS: Se deriva del latín status que significa Estado,


en el sentido político.

• STATERA: Se deriva del vocablo griego statera que


significa balanza, dado en parte a la función que cumple
en la medición o peso de los hechos que son objeto de
estudio.

• STAAT: Vocablo alemán que significa:


estado, considerado como una
organización política.
ESTADISTICA
1.- ORIGEN:
DESDE LA ANTIGÜEDAD SE ENCUENTRAN

ESTADISTICAS RUDIMENTARIAS RELACIONADAS CON


REGISTRO Y CENSOS

• Imperio Romano: estadísticas en todos aquellos hechos en que los


gobernantes requerían información sobre las diferentes provincias en
las que estaba dividido el Estado.

• Habla Hispana: los Árabes levantaron diversas estadísticas en la


Península Ibérica (727) y durante el reinado de los Reyes Católicos y
de Felipe II (Censos).

• ESTADISTICA: En 1749, la estadística es tratada en forma


sistemática y como ciencia; Godofredo de Anchersen la introduce
como asignatura universitaria, con el nombre de ESTADISTICA.
ESTADISTICA
1.- ORIGEN: LOS PERSONAJES QUE CONTRIBUYERON AL DESARROLLO
DE LA ESTADISTICA, APORTANDO IDEAS BASICAS
PARA SU FUNDAMENTACION, FUERON:

• LAPLACE: (1749-1827) Aplicó el cálculo de


probabilidades al análisis estadístico.

• Karl Friedrich Gauss: (1777-1855) Estableció


la distribución Gaussiana de errores resultantes,
con su forma de campana y su simetría (la Curva Normal).

• Adolph Quetelet: (1796-1874) Quién aplicó métodos modernos a


conjuntos y es reconocido como el padre moderno de la Estadística.

• W.S. Gosset: (1876-1937) Contribuyó con la teoría de las muestras


pequeñas: distribución “t” student.
ESTADISTICA
1.- ORIGEN: LOS PERSONAJES QUE CONTRIBUYERON AL DESARROLLO
DE LA ESTADISTICA, APORTANDO IDEAS BASICAS PARA SU
FUNDAMENTACION, FUERON:

• Sir Ronald A. Fisher: (1890-1962) Determinó la Distribución F

• Karl Pearson: (1857-1936) Con su periódico Biométrica, influyó


enormemente en el desarrollo de la estadística y en especial en el
desarrollo de la Distribución Chi-cuadrado.

• Florence Nightingale: (1820-1910) Defensora de los métodos


estadísticos, sostenía que el fracaso de muchos se debía a la
insuficiencia de conocimiento estadístico.

• Y muchos más como: Jacobo Bernoulli, Poisson, Pierre de Fermat,


Francisco Galton, Gregor Mendel, Blaise Pascal, Frank Yates.
ESTADISTICA
2.- DEFINICIONES:

• La palabra ESTADISTICA se menciona y se utiliza a


diario, sin que se tenga una definición o significado igual
para personas de formación e intereses distintos,
encontrándonos con una gran variedad de
interpretaciones.

• Para la mayoría, la estadística es un método de


investigación, no sólo para la observación de un hecho, sino
también para la formulación de hipótesis, el diseño de
experimentos y la comprobación de ciertas teorías.

• Conjunto de métodos para la toma de decisiones en


condiciones de incertidumbre.
ESTADISTICA
2.- DEFINICIONES:

Es la Ciencia que estudia los hechos


colectivos, mediante la observación
numérica, el análisis matemático y la interpretación
lógica, investigando especialmente sus causas y leyes
empíricas.

• Finalmente: es el conjunto de métodos aplicados en la


recolección, clasificación, presentación e interpretación
de datos numéricos, obtenidos de la observación de
hechos, que permiten a la vez, inferir hacia conclusiones
lógicas. (dos funciones: Describir e Inferir).
ESTADISTICA
3.- CLASIFICACION:

• Est. Descriptiva: indica el comportamiento de un hecho


a través de la recolección, ordenamiento, clasificación,
presentación (cuadros y gráficas), interpretación y
análisis de datos (utilización de medidas).

• Est. Inferencial: Son aquellas técnicas aplicadas en


investigaciones parciales, denominadas muestras, que
permiten la obtención de ciertos resultados mediante la
aplicación de estimadores de los parámetros.
ESTADISTICA
Otras definiciones y Conceptos básicos:

• Población o Universo: Es un conjunto de


unidades o elementos, finito o infinito, definido
por una o más características comunes, de las
que gozan todos los elementos que lo componen.

• Unidad: Hace referencia a una persona, una familia,


una vivienda, una manzana, un barrio, etc… de la cual
se obtiene la información necesaria.

• Censo: En ocasiones resulta posible estudiar cada uno de los


elementos que componen la población, realizándose lo que se
denomina un censo, es decir, la enumeración total de una Población
en un tiempo dado; requiere de una enorme organización, personas
y recursos.
ESTADISTICA
• Características Cualitativas: Son atributos, susceptibles de ser
expresados mediante palabras, ya que sólo se pueden contar, no son
mensurables; ej: profesión, nacionalidad, marcas, sexo, estado civil.

• Características Cuantitativas: Son variables que se expresan


numéricamente; ej: ingresos, ventas, edades, consumos, estatura.

• Investigación Exhaustiva: Es aquella donde se deben observar


todas las unidades que constituyen la Población o Universo, objeto
de la Investigación.

• Muestra o Investigación Parcial: En todas las ocasiones en que no


es posible o conveniente realizar un censo, lo que se hace, es
trabajar con una muestra, entendiendo por tal una parte
representativa de la población, que generalmente se ha seleccionado
por algún proceso aleatorio.
ESTADISTICA
UNIDAD CARACTERISTICAS A ESTUDIAR

Familia Número de personas que la componen. Niveles de Escolaridad


Número de personas que trabajan. Ingresos y Gastos
Ocupaciones. Propiedad de la Vivienda.
Número de Personas que estudian. Datos generales de la
Vivienda.

Establecimiento
Industrial Producción bruta Horas de Producción.
o Manufacturero Número de empleados Consumo de Energía.
Sueldos y Salarios Actividad Económica.

Hospital Pacientes según: Edad, Sexo, Clase de Consulta


Residencia, Estado civil. Clase de tratamiento.
Ocupación.
ESTADISTICA DESCRIPTIVA
1.- PRESENTACIONES ESTADISTICAS:

• DISTRIBUCIONES DE FRECUENCIA: Es la tabla


en la cual se agrupan en clases los valores posibles
para una variable y se registra el número de valores
observados que corresponden a cada clase. (Datos
Agrupados).
Distribución de Frecuencias de
los Salarios de 100 Obreros Salario / día No. Obreros
Calificados. 24000 - 25999 7
26000 - 27999 20
28000 - 29999 33
30000 - 31999 25
32000 - 33999 11
34000 - 35999 4
ESTADISTICA DESCRIPTIVA
INTERVALOS DE CLASE:
Indica el rango de los valores incluidos dentro de una clase; a menudo
los intervalos se representan por el punto medio de la clase (X).

Si n < 100 : el número de clases esta dado por m = n

Si n  100 : m = 1 + 3.3 log n Para los Datos originalmente no


agrupados, se detectó el salario
más alto ($35800) y el más
Salario / día Pto. Medio: X No. Obreros bajo ($24200); el Intervalo de
clase sería si se quieren
24000 - 25999 24999.50 7
26000 - 27999 26999.50 20
tener 6 clases es:
28000 - 29999 28999.50 33 Int. Aprox = (35800 – 24200)
30000 - 31999 30999.50 25 6
32000 - 33999 32999.50 11
= $ 1933.33
34000 - 35999 34999.50 4

Entonces: conviene $2.000


ESTADISTICA DESCRIPTIVA
• HISTOGRAMAS: Un histograma es una gráfica de barras de una
distribución de frecuencias, donde el eje horizontal van los límites
exactos de clase y en el vertical el número de observaciones.

• Y POLIGONOS DE FRECUENCIA: Es la gráfica lineal de una


distribución de frecuencias; a diferencia del histograma, en la
horizontal se coloca el punto medio de la clase.

40 40

No. Obreros
No. Obreros

30 30

20 20

10 10

24000 26000 28000 30000 32000 34000 36000 22999.5 24999.5 26999.5 28999.5 30999.5 32999.5 34999.5
Salario / dìa ($) Salario / dìa ($)
ESTADISTICA DESCRIPTIVA
. CURVAS DE FRECUENCIA: Es un polígono de frecuencias
suavizado, mostrando en términos de simetría: asimetría negativa
(con la cola hacia la izquierda), positivamente sesgada (con la cola
hacia la derecha) ó simétrica.
En términos de Kurtosis: Platicúrtica (Uniforme en todas las clases),
Leptocúrtica (concentrada en un estrecho rango de valores), y
Mesocúrtica.

40
Asimétrica Negativa Platicúrtica
No. Obreros

30

20

10 Asimétrica Positiva Leptocúrtica

22999.5 24999.5 26999.5 28999.5 30999.5 32999.5 34999.5


Salario / dìa ($)
Simétrica Mesocúrtica
ESTADISTICA DESCRIPTIVA
.DISTRIBUCIONES DE FRECUENCIA ACUMULADAS:
Identifica el número de observaciones acumuladas
incluidas bajo el límite exacto superior de cada clase de
la distribución; dicha gráfica está suavizada y se le
denomina Ojiva.
Salario / día No. Obreros
100

80
24000 - 25999 7 7
No. Obreros

26000 - 27999 20 27
60 28000 - 29999 33 60
30000 - 31999 25 85
40 32000 - 33999 11 96
34000 - 35999 4 100
20

Frecuencia
24000 26000 28000 30000 32000 34000 36000 Acumulada
Salario / dìa ($)
ESTADISTICA DESCRIPTIVA
• GRAFICAS DE BARRAS: Ilustra mediante columnas,
las cantidades de frecuencias para diferentes
categorías de datos.

• GRAFICAS DE LINEAS: Ilustra mediante segmentos


de línea los cambios en cantidades con respecto al
tiempo.
400 400

Prod. / mes
Prod. / mes

305 300
300 275 280 300
240
220
200 200

100 100

ENE FEB MAR ABR MAY JUN ENE FEB MAR ABR MAY JUN
Mes Mes
ESTADISTICA DESCRIPTIVA
• GRAFICAS DE PASTEL o TORTA: Ilustra las divisiones de una
cantidad total; cuando se hace en porcentajes, resulta más fácil
compararlos. Es una forma efectiva de representar dist. de
frecuencias en las que la característica es cualitativa.

• PICTOGRAMA: Es la representación por medio de Figuras que


guardan relación con la característica que se desea visualizar.
Torneos Oficiales de Fútbol
250
Ventas Callejeras
( 52%) 200

Est. Medianos 150


Est. Pequeños
( 10%) ( 30%)
Est. Grandes 100
( 8%)
Año: 1965 1985 2005
Caso de Estudio
• Dada la siguiente información obtenida de una encuesta
realizada a 40 trabajadores, respecto al salario (en Miles de $)
devengado durante la última quincena de Mayo, se pide realizar:
a). Construir una tabla de frecuencias, si m = 6.
b). Construir en una sola gráfica el histograma y el polígono.
c). Construir una curva acumulada de frecuencias (ojiva).
d). Utilizando la Curva acumulada, señalar el 41 % de los salarios
más bajos de la distribución.

Salario en Miles $

264 305 294 270 269 281 285 261 284 308 282 258 288 288 275
252 276 285 278 298 288 273 281 290 264 300 309 297 270 296
263 283 295 296 280 298 284 278 300 275
ESTADISTICA DESCRIPTIVA
2.- MEDIDAS DE POSICION (o de Tendencia Central):

• MEDIA ARITMETICA: o Promedio Aritmético se define como


la suma de todos los valores entre el número de valores.

x=∑x/n =∑(fxX)/n
ó simplemente es la suma del producto del punto medio de cada
(X) clase por su frecuencia de clase correspondiente (f).

• LA MEDIANA: Es el valor del dato que ocupa un lugar cuando


se les agrupa a todos en orden ascendente o descendente.

Med = X (n/2 + 0.5) (n: Impar) : (X (n/2) + X (n/2+1))/2 (n: Par)

• LA MODA: Es el valor que se presenta con mayor frecuencia


en un conjunto de datos. (Unimodal, Bimodal y Multimodal)
ESTADISTICA DESCRIPTIVA
3.- MEDIDAS DE VARIABILIDAD (o de Dispersión):

• EL RANGO: Es la diferencia entre el valor mayor y el menor


entre el conjunto de Datos: R= DM- Dm

• LA DESVIACION MEDIA: Se basa en la diferencia entre el


valor absoluto de cada uno de los elementos del conjunto de
datos y la media del grupo:
DM = (∑ x – x )/ n

• LA VARIANZA: Es similar a al desviación media, pero consiste


en que, antes de sumarlas, se eleve al cuadrado cada una de las
diferencias: v (x) = ∑ (x – x)2 /(n-1)

• LA DESVIACION ESTÁNDAR: Es la raíz cuadrada de la


Varianza: s = (∑ (x – x)2 /(n-1) ) 0.5 = v(x)0.5
ESTADISTICA DESCRIPTIVA
3.- MEDIDAS DE VARIABILIDAD (o de Dispersión):

• EL COEFICIENTE DE VARIACION:
Indica la magnitud relativa de la desviación
estándar con respecto a la media de la distribución:

CV = s / x

• EL COEFICIENTE DE ASIMETRIA: de Pearson, mide la


desviación de la simetría; si es positivo el valor la media es
mayor que la mediana (asimetría positiva – sesgo derecho) y
si es negativo, la media es menor que la mediana (asimetría
negativa – sesgo izquierdo):
Asimetría: 3( x – Med)/ s
ESTADISTICA DESCRIPTIVA
• EL COEFICIENTE DE CURTOSIS:
La curtosis mide el grado de agudeza o achatamiento de una
distribución con relación a la distribución normal, es decir,
mide cuán puntiaguda es una distribución.

curtosis = ∑ Fr (xi – x )4 / (n.σ4) - 3

La curtosis determina el grado de concentración que


presentan los valores en la región central de la Distri_
bución. Así puede ser:
• Leptocúrtica: Existe una gran concentración: Curtosis >> 0
• Mesocúrtica: Existe una concentración normal: Curtosis ± 0
• Platicúrtica: Existe una baja concentración: Curtosis << 0
ESTADISTICA DESCRIPTIVA
Fórmulas más comunes: Medidas de Tendencia Central

DATOS NO AGRUPADOS DATOS AGRUPADOS


MEDIA: x=∑x/n =∑(f x X)/n

MEDIANA: Med = X (n/2 + 0.5) = ((n+1)/2 – (F+1))/fm x w + Lm


(el dato que esté más en el medio; F: Frecuencia Acumulada hasta
es una posición). la clase mediana.
Fm: Frecuencia de la clase med.
w: ancho del intervalo de clase.
Lm: Límite inferior de la clase med.

MODA: El Dato que más se repita = ((d1)/(d1+d2)) x w + Lm


d1: Diferencia de f. entre la clase
modal y la clase anterior.
d2: Diferencia de f. entre la clase
modal y la clase posterior.
ESTADISTICA DESCRIPTIVA
Fórmulas más comunes: Medidas de Dispersión

DATOS NO AGRUPADOS DATOS AGRUPADOS


DESVIACION MEDIA:
DM = (∑ x – x )/ n = (∑ f X X – x )/ n

VARIANZA:
v (x) = ∑ (x – x )2 /(n -1) = ∑ f x (X – x )2 /(n -1) = s2

DESVIACION ESTANDAR:

s = ∑ (x – x )2 /(n -1) = ∑ f x (X – x )2 /(n -1)


Caso de Estudio
• Dada la siguiente información obtenida de una encuesta
realizada a 40 trabajadores, respecto al salario (en Miles de $)
devengado durante la última quincena de Mayo, se pide Calcular:
a). La media, La mediana y la Moda. Que se puede decir de estas
medidas; cual salario tendría mayor tendencia?
b). Cual será el Coeficiente de Variación, el coeficiente de
Asimetría y la desviación estándar? Cual se tendría como el
mejor estimador de dispersión?

Salario en Miles $

264 305 294 270 269 281 285 261 284 308 282 258 288 288 275
252 276 285 278 298 288 273 281 290 264 300 309 297 270 296
263 283 295 296 280 298 284 278 300 275
PROBABILIDAD
1.- Definiciones:

• Método axiomático: Concibe la probabilidad de


ocurrencia de un suceso, como el número
comprendido entre 0 y 1 donde 0 es la imposibilidad
absoluta y 1 la certeza absoluta.

• Método empírico o práctico: considera la probabilidad de un


suceso, como aquel número al cual se aproxima cada vez más la
frecuencia relativa de la ocurrencia de un suceso, cuando las veces
que se repite el experimento que origina este suceso es lo bastante
grande.

• Método Clásico: Considera la probabilidad como el cociente de


dividir el número de casos favorables ó éxitos que pueden ocurrir en
una prueba, por el total de casos posibles.
PROBABILIDAD
2.- Conceptos Básicos:

• Esperanza: Si p es la probabilidad de éxito de un suceso en un solo


ensayo, el número esperado de sucesos o la esperanza de ese suceso
en “n” ensayos, estará dado por el producto de n y la probabilidad de
éxito p: E = n x p

• Probabilidad A priori: Es aquella que se puede determinar de antemano,


sin necesidad de realizar el experimento; P(cara) = 0.5

• Probabilidad Empírica: se determina mediante una seria de


experimentos, siendo el número de casos favorables sobre el número
de casos totales.
• La Prueba es la realización de un acto y su respuesta se llama resultado, punto
muestral o suceso; Un evento es un conjunto de uno o más puntos muestrales,
mientras que el conjunto de pruebas realizadas en las mismas condiciones se
denomina experimento.
PROBABILIDAD
2.- Conceptos Básicos:

• Sucesos Mutuamente Excluyentes: dos eventos o más


son mutuamente excluyentes si uno de ellos ocurre cuando
ninguno de los otros pueda ocurrir al mismo tiempo; un
moneda: cara y sello.

• Sucesos Independientes: se dice que dos o más sucesos


son independientes, si la probabilidad de presentación de
ninguno de ellos queda influenciada por la presentación del
otro: P(cara) = 0.5

• Sucesos dependientes: Se dice que dos sucesos son


dependientes si la ocurrencia de un evento en cualquier
prueba afecta la probabilidad de los otros eventos en las
siguientes pruebas: sacar 3 cartas.
PROBABILIDAD
3.- Técnicas de conteo:

• Fórmula de Multiplicación: El total de arreglos posibles


= m x n x p. EJ: rutas a elegir para llegar a la oficina
desde la casa: Casa al Centro (hay 3), del Centro al
parqueadero (hay 2) y a la oficina (hay 4): entonces, total
de arreglos posibles = 3 x 2 x 4 = 24 maneras.

• Permutaciones: es el número de formas en los que


pueden acomodarse los objetos en términos de orden. Ej:
con 1,2,3,4 cuantas cifras de 4 dígitos se pueden formar:
Pn = n! = 4! = 24 (sin repetición).
y con la Palabra CASA: Pn = n! / r! = 4! / 2! = 12 palabras
se pueden formar (con repetición).
PROBABILIDAD

3.- Técnicas de conteo:

• Variaciones: Son permutaciones en las que implica orden


en la colocación de los elementos.
Ej: con 1,2,3,4 cuantas cifras de 2 dígitos se pueden
formar: nVr = nPr = n! / (n-r)! = 4! / (4-2)! = 24/2= 12 cifras
posibles.

• Combinaciones: Son un arreglo de los elementos sin


importar el orden en que se dispongan.
Ej: cuantas comisiones de 3 personas se pueden formar
seleccionadas entre 10: nCr = n! / (n-r)! r! = 10! / 3! 7! = 120
grupos diferentes.
PROBABILIDAD

• Regla del exponente: Es una forma muy


sencilla para determinar el número de casos posibles.
Ej: lanzar un solo dado: 61 = 6 eventos posibles.
Lanzar dos dados: 62 = 36 eventos posibles.
Lanzar tres dados: 63 = 216 eventos posibles.
Eventos

• Diagrama del árbol: es una forma C CC


C
de listar o mostrar la secuencia de S CS

las operaciones que se pueden realizar. C SC


S

S SS
Ejemplos de Estudio
• 1. Cuantas permutaciones se pueden realizar con la palabra Cooperador?.
R/: P10 = 10! / (3! x 2!) = 302.400.

• 2. De Cuantas maneras pueden mezclarse las letras: A, B y C. R/: P3 = 3! = 3 x 2 x 1 = 6

• 3. De cuantas maneras diferentes se puede contestar un Examen de cinco preguntas, si


sólo hay que dar respuesta a 3 de ellas? R/: 5V3 = 5P3 = 5! / (5-3)! = 5!/2!= 60.

• 4. Cuantos comités diferentes pueden seleccionarse entre 7 hombres y 4 mujeres, si


deben constituirse por 3 hombres y 2 mujeres.
R/: 7C3 x 4C2 = 7! / (7-3)! x 4! / (4-2)! = 35 x 6 = 210.

• 5. Cuantas placas se pueden elaborar si se conforman de tres letras y tres dígitos?


R/: (26)3 x (10)3 = 17´576.000 placas.

• 6. Elaborar un árbol de probabilidades para un vendedor si se conoce que visita a tres


posibles clientes y que la probabilidad de venta es del 25%.
PROBABILIDAD
4.- DISTRIBUCIONES DE PROBABILIDAD: TERMINOS
A MANEJAR:

• Distribución de Probabilidad:
Son todos los posibles valores que resultan
de un experimento aleatorio, junto con la
probabilidad asociada a cada valor.

• Variable aleatoria:
Corresponde a una caracterización cualitativa
de los resultados que constituyen un espacio
muestral. Cada cantidad o valor es el resultado
de un experimento aleatorio y, como tal, puede
tomar distintos valores.
PROBABILIDAD
4.- VARIABLES ALEATORIAS: DEFINICIONES

• DISCRETA:
Se considera así, cuando los valores que asume se
pueden contar y si éstos pueden organizarse en una
secuencia al igual que los números enteros positivos,
asumiendo un número finito de valores.

• CONTINUA:
Se da, cuando puede asumir cualquier valor dentro de
un intervalo ó en una unión de intervalos.

Dentro de los Modelos de Probabilidad correspondiente a variables


aleatorias discretas, se tienen: Binomial, Exponencial e Hipergeométrica;
en cuanto a variables aleatorias continuas, se tiene el modelo Normal
estandarizado.
PROBABILIDAD
• DISTRIBUCION BINOMIAL:
La probabilidad P de que se obtenga
x éxitos en n ensayos, será:

P(x) = nCx x px x q (n-x) , p: Prob. éxito


q: Prob. No éxito Además se
debe satisfacer que:

• a). Debe existir un número fijo de pruebas repetidas (n).


b). Cada una de las n pruebas debe tener sólo dos
resultados posibles: favorable o desfavorable.
c). La probabilidad de éxito de un acontecimiento es fijo.
d). Las pruebas son independientes.
Ejemplo de Estudio
• 1. Al lanzar cuatro monedas, se quiere determinar la
probabilidad de obtener:
a). exactamente dos caras
R/: P(2) = 4C2 x (1/2)2 x (1/2) (4-2) = 6 / 16 = 37.5%
b). exactamente tres caras.
R/: P(3) = 4C3 x (1/2)3 x (1/2) (4-3) = 4 / 16 = 25%
• DISTRIBUCION DE FRECUENCIAS DIAGRAMA DE FRECUENCIAS
Probabilidades %
x Fracción % 40

0 1/16 6.25 30
1 4/16 25.0 20
2 6/16 37.5 10
3 4/16 25.0
0 1 2 3 4 X
4 1/16 6.25 No. De caras (éxitos)
Casos de Estudio
• 1. Por regla, el 25 % de ciertos productos
manufacturados por el torno americano, son defectuosos; cual
es la probabilidad de que en 20 de estos productos haya:
a). Exactamente 15 defectuosos?
b). Menos de cinco defectuosos?
c). Por lo menos 8 defectuosos?.
• 2. Los registros hospitalarios indican que el 10% de los casos
de cierta enfermedad resultan fatales. Si hay cinco pacientes
que sufren de la enfermedad, encontrar la probabilidad que:
a). Todos sanen, que ninguno muera?
b). Por lo menos tres mueran?
c). Exactamente tres mueran?.
PROBABILIDAD
• DISTRIBUCION POISSON:
La probabilidad P de que se obtenga x éxitos
por una unidad de medición (minuto, hora, día,
cm, metro), será:
P(x) = x x e- / x! ,siendo:  = nxp y e=2,71828

Además se debe satisfacer que:


a). El producto de (=np) debe ser menor o igual a cinco.
b). Probabilidad de éxito sumamente pequeña (p).
c). El número de observaciones debe ser grande (n).
d). Los eventos aleatorios que ocurren dentro de un campo
(tiempo o espacio) son independientes.
Ejemplo de Estudio
• 1. Si el 1% de las baterías fabricadas por la Cia.
de Pilas son defectuosas, hallar la probabilidad de que, en
una muestra de 100 Baterías, 3 sean defectuosas.
R/:  = 100 x (0,01) = 1, entonces: P(x=3) =13 x e-1 / 3!
= 1 (0.36788) / 6 = 6.13%
• DIAGRAMAS DE FRECUENCIAS

% % %
40  = 1,1 40  = 2,0 40  = 5,0
30 30 30
20 20 20
10 10 10
0 1 2 3 4 5 6 7 X 0 1 2 3 4 5 6 7 8 X 0 1 2 3 4 5 6 7 8 9 X
Exitos Exitos Exitos
Casos de Estudio
• 1. Entre las 2 y las 4 de la tarde, el promedio de
llamadas telefónicas que entran por el conmutador de una
empresa por minuto es de 2,5; Hallar la probabilidad de que en
un determinado minuto se reciban:
a). Exactamente 3 llamadas? b). Al Menos de 2 llamadas?
c). Ninguna llamada?.

• 2. Los clientes de una cafetería llegan a razón de 9 (nueve) en


un período de 30 minutos. Calcule la probabilidad:
a). Que en la primera media hora por lo menos lleguen 4(cuatro)
personas? Y b). Que en los diez (10) primeros minutos no
llegue ningún cliente?.
PROBABILIDAD
• DISTRIBUCION HIPERGEOMETRICA:
Está asociada generalmente con un proceso de
muestreo sin reposición en una población finita;
la probabilidad P de que se obtenga x éxitos
será: P(x) = ACx x (N-A)C(n-x) / NCn , donde
A = Número de éxitos en al Población, de N tamaño, y
x = Número de éxitos en al Muestra, de n tamaño.

Además se debe satisfacer que:


a). El tamaño de la muestra n debe ser superior en un 5%
con respecto al tamaño poblacional N.
b). La Probabilidad de éxito no es constante, cambia para
cada observación; eventos dependientes.
Ejemplo de Estudio
• 1. En la producción de cierto artículo, se sabe que
por cada 50 producidos en 43 su terminado es excelente.
Si se toma una muestra de 12 artículos, cual es la probabilidad:
a). De que exactamente dos no sean clasificados como
excelentes. (A=7, N=50, n=12 y x=2)

R/: P(x=2) = 7C2 x (50-7) C(12-2) / 50C12 = 33,17%

b). De que Diez sean clasificados como excelentes. (A=43 y x=10)


R/: P(x=10) = 43C10 x (50-43) C(12-10) / 50C12 = 33.17%
Casos de Estudio
• 1. Un nuevo sabor de helado fue probado por un grupo
de 15 alumnos de un colegio en el que se vende normalmente y
10 encontraron agradable el nuevo sabor; repitiendo la prueba
en cinco alumnos de los 15, cual es la probabilidad de que:
a). A dos les guste el nuevo sabor?
b). A dos no les guste el nuevo sabor?.

• 2. Un jefe de almacén sabe que 6 de las 25 bicicletas que tiene


para la venta presentas rayones y necesitan pintura; si el
vendedor que no tenía conocimiento de lo anterior vendió en el
día cuatro bicicletas, cual es la probabilidad de que vendiera
por lo menos dos que requerían pintura.
ESTADISTICA – TIPOS DE DATOS

• Cualitativos:
son datos que solo toman valores
asociados a las cualidades o atributos,
clasificándolos en una de varias
categorías.

• Ejemplos:
– Género: Masculino, Femenino.
– Profesión: Ingeniero, Economista, Administrador,…
– Hábito de fumar: Fumador/No fumador
– Raza: Asiáticos, Europeos, Latinos, …
– Religión: Católica, Evangélica, …
– Estado civil: Soltero, Casado, Divorciado,…
ESTADISTICA – TIPOS DE DATOS

• Cuantitativos: provienen de variables que pueden


medirse, cuantificarse o expresarse
numéricamente.

• Ejemplos:
– Peso
– Edad
– Estatura
– Humedad
– Temperatura
– Intensidad de un sismo
– Cantidad de hermanos
TIPOS DE VARIABLES CUANTITATIVAS
– Discretas: es aquella que solo puede tomar un número
finito o infinito numerable de valores.
Ejemplo: cantidad de hermanos.

– Continuas: es la variable que puede tomar cualquier


valor en una escala continua.
Ejemplo: cantidad de café
contenido en un recipiente.
ESCALAS DE MEDIDAS

• Escala Nominal. Variables


• Escala Ordinal. Cualitativas

• Escala de Intervalos.
Variables
• Escala de Razón o Proporción. Cuantitativas

• Escala Absoluta.
ESCALA NOMINAL - ORDINAL
NOMINAL: Los datos se pueden agrupar en
categorías que no mantienen una relación de
orden entre si, por lo tanto están definidas solo
por la igualdad o diferencia.
Ej: color de ojos, sexo, profesión, estado civil,
religión.

ORDINAL: En los datos existe un cierto orden o


jerarquía entre las categorías.
Ej: grados militares, organigrama de una empresa,
escalafón de los profesores universitarios, talla de
camisas.
ESCALA DE INTERVALOS
• Además de los valores numéricos de las variables y
de las relaciones de orden, se pueden establecer
distancias, es decir, tienen sentido las operaciones
de suma y resta.
• Tiene dos propiedades:
– Existe una unidad de medida que se mantiene constante para
todos los valores que toma la variable.
– Existe un valor patrón u origen relativo que no significa la
ausencia de valor en la variable.

Ej: Cantidad de agua consumida, Rendimientos de una


empresa, Ingresos.
ESCALA DE PROPORCION
• Es la más completa y general de todas las escalas, la
cual se caracteriza porque los valores de la variable
son números entre los cuales, además de las
relaciones de orden (>, <, , ) y distancia (+,-), se
pueden establecer múltiplos y proporciones.

Peso,
Altura,
Edad,
Temperatura.
ESCALA ABSOLUTA
• Se caracteriza porque los valores que toma la
variable van de uno en uno (son el resultado de
contar) y por lo tanto, está constituida por los
enteros positivos y el cero.
• Ejemplos: Cantidad de hijos, Número de puntos
eléctricos, Número de hermanos, Cantidad de
autos vendidos.
TIPOS DE DATOS
• Univariantes o unidimensionales:
Sólo recogen información sobre una característica
Ej: Estatura de los alumnos de una clase.

• Bivariantes o bidimensionales:
Recogen información sobre dos características de la
población.
Ej: Edad y Estatura de los alumnos de una clase.

• Multivariantes o pluridimensionales:
Recogen información sobre tres ó más
características.
Ej: Edad, Estatura y Peso de los alumnos de una clase.
VARIABLE ALEATORIA

Nominal y Ordinal TIPO

Intervalor, Proporción y Absoluta


de
Variable
CUALITATIVA CUANTITATIVA
Escalas:

Escalas:
DISCRETA CONTINUA

FUENTE de
Datos

Uso de DATOS Diseñar un Realizar una Realizar un est


Publicados Experimento ENCUESTA Observacional

Tipo de Aspectos
Muestra Éticos

Probabilístico No Probabilístico
Muestreo de Poblaciones Normales
• Cuando la población está distribuida normalmente, la distribución de
muestreo de la media también es normal; sin embargo, los
responsables de tomar decisiones deben lidiar con muchas
poblaciones que no están dist. Normalmente, por lo cual apelan al
TEOREMA DEL LIMITE CENTRAL, el cual asegura que:
“ La distribución de muestreo de la media se aproxima a la
normal al incrementarse el tamaño de la muestra, sin importar
la forma de la Distribución de la Población”.
La Importancia del Teo. Del Límite central es que permite usar
estadísticas de muestra para hacer inferencias con respecto a los
parámetros de la población, sin saber nada sobre la forma de la
distribución de frecuencia de esa población.
La Distribución de Muestreo de la Media
Distribución de la Población
Tiene:
μ : La Media de la Distribución
ó Media Poblacional
σ : La desviación estándar de
μ esta distribución.

La Distribución de frecuencia de
Muestra: cada una es una distribución
Discreta con x y s propias.
x1 , s1 x2 , s2 x3 , s3
Distribución de Muestreo de la Media
Esta distribución es la dist. de todas
Las Medias de Muestra y tiene:
μ x : Media de la Dist. de muestreo
de las medias. (miu sub x testada)
σ x : Error estándar de la media
μx (sigma sub x testada)
La Distribución de Muestreo de la Media
Las Propiedades de la Distribución de Muestreo de la Media son:

la distribución de muestreo tiene una media igual a la media de la


población, es decir:
μx = μ

la distribución de muestreo tiene una desviación estándar (un error


estándar) igual a la desviación estándar de la población dividida
entre la raíz cuadrada del tamaño de la muestra, es decir:
_
σx = σ / √n

La ecuación está diseñada para situaciones en las que la población es


muy grande (infinita); pero hay muchas situaciones en las que se
examinan poblaciones finitas, es decir, de tamaño establecido o
limitado.
La Distribución de Muestreo de la Media
Entonces, la fórmula diseñada para encontrar el error estándar de
la media sería: _
σ x = ( σ / √n ) x √ N – n
N-1

Este nuevo factor se conoce como Multiplicador (F. M.) de población


finita, y se debe utilizar para corregir el error estándar de la media
cuando la fracción de muestreo n / N, es mayor al 5%.

Otras propiedades son:


La curva sólo tiene un pico, por lo tanto es unimodal.
Tiene la forma de Campana de Gauss (dist. Gaussiana por Karl Gauss).
La Media cae en el centro de su curva normal y que debido a la
simetría de la distribución normal de probabilidad la moda y la
mediana de la distribución se encuentran también en el centro.
Distribución Normal
Para poder calcular
las probabilidades ó
2 2
f (x) = 1 e -[(x-μ) / 2σ ] áreas bajo la curva
en una distribución
2πσ2 normal, se necesita
integrar ó aplicando
un concepto más
práctico:
el valor “ z “.

El valor de z está
derivado de la
fórmula:
x–μ
x μ x z=
σ
-z +z Para luego proceder
a encontrar la Prob.
en la Tabla Normal.
z = número de desviaciones estándar que hay desde x
a la media de la distribución.
Distribución Normal
Ej: Cual es la probabilidad que
un candidato elegido al azar se
tome más de 600 horas de
entrenamiento, si el programa es
34,13% de 500 horas con una desviación
estándar de 100 horas.
Se conocen:
15,87% x = 600 horas : n = 1
μ = 500 horas, y
σ = 100 horas
μ= 500 x= 600
x–μ ( 600 – 500 )
+ z = 1,0 z= =
σ 100
z= 1.0 desviaciones estándar
Se busca z = 1,0 en la tabla de Dist. Normal, y …
se encuentra una Probabilidad de =0,3413 ó 34,13% que corresponde desde la
Media hasta el valor de la variable aleatoria dado (x).
Luego, como cada lado de la campana tiene un 50% de probabilidad, entonces al:
50% se le resta el 34,13% y se obtiene la probabilidad buscada: 15,87%
Distribución Normal
Ej: Cual es la probabilidad que 5
candidatos elegidos al azar se
tomen más de 600 horas de
entrenamiento, si el programa es
48,71% de 500 horas con una desviación
estándar de 100 horas.
Se conocen:
1,29% x = 600 horas : n = 5
μ = 500 horas, y
σ = 100 horas
μ= 500 x= 600
x–μ ( 600 – 500 )
+ z = 2,23 z= =
σx- 100/√5
z= 2,23 desviaciones estándar
Se busca z = 2,23 en la tabla de Dist. Normal, y …
se encuentra una Probabilidad de =0,4871 ó 48,71% que corresponde desde la
Media hasta el valor de la variable aleatoria dado (x).
Luego, como cada lado de la campana tiene un 50% de probabilidad, entonces al:
50% se le resta el 48,71% y se obtiene la probabilidad buscada: 1,29%
Distribución Normal
Ej: Cual es la probabilidad que 5
candidatos elegidos al azar de 50
se tomen más de 600 horas de
entrenamiento, si el programa es
49,01% de 500 horas con una desviación
estándar de 100 horas.
Se conocen:
0,99% x = 600 horas : n = 5 N = 50
μ = 500 horas, y
σ = 100 horas
μ= 500 x= 600
Como n / N = 5 / 50 = 10% > 5%
+ z = 2,33 Se debe calcular el F.M.

F.M.= √ NN –- 1n = √ 50 –5
50 - 1
x–μ ( 600 – 500 )
z= = = 2,33 F.M.= 0,9583
σx- 100/√5 x 0,9583
Se busca z = 2,33 en la tabla de Dist. Normal, y la Prob. es = 0,4901 ó 49,01% .
Entonces al 50% se le resta el 49,01% y se obtiene la probabilidad buscada: 0,99%.
Localización de las Observaciones
Teorema de Chebyshev:

99 %
95 %
68 %

2,5% 2,5%

μ -3 σ μ -2 σ μ -1 σ μ μ +1 σ μ +2 σ μ +3 σ
Distribución de Probabilidad Normal Estándar
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.00 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.10 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.20 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0.30 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0.40
0.50
.1554
.1915
.1591
.1950
.1628
.1985
.1664
.2019
.1700
.2054
.1736
.2088
.1772
.2123
.1808
.2157
.1844
.2190
.1879
.2224
x–μ
0.60 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .2549 Z=
0.70
0.80
.2580
.2881
.2611
.2910
.2642
.2939
.2673
.2967
.2704
.2995
.2734
.3023
.2764
.3051
.2794
.3078
.2823
.3106
.2852
.3133
σx-
0.90 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.00 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
1.10 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1.20 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.30 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.40 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.50 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.60 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.70 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.80 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706
1.90 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.00 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817 0 z
2.10 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.20 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.30 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.40
2.50
2.60
.4918
.4938
.4953
.4920
.4940
.4955
.4922
.4941
.4956
.4925
.4943
.4957
.4927
.4945
.4959
.4929
.4946
.4960
.4931
.4948
.4961
.4932
.4949
.4962
.4934
.4951
.4963
.4936
.4952
.4964
Áreas bajo la curva
PROBABILIDADES
2.70 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.80 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981
2.90 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.00 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .4990
3.10
3.20
.4990
.4993
.4991
.4993
.4991
.4994
.4991
.4994
.4992
.4994
.4992
.4994
.4992
.4994
.4992
.4995
.4993
.4995
.4993
.4995
(zona sombreada)
3.30 .4995 .4995 .4995 .4996 .4996 .4996 .4996 .4996 .4996 .4997
3.40 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4997 .4998
3.50 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998 .4998
3.60 .4998 .4998 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
3.70 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
3.80 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
3.90 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .4999
Distribución de Probabilidad Normal Estándar
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.00 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641
0.10 .4602 .4562 .4522 .4483 .4443 .4404 .4364 .4325 .4286 .4247
0.20 .4207 .4168 .4129 .4090 .4052 .4013 .3974 .3936 .3897 .3859
0.30 .3821 .3783 .3745 .3707 .3669 .3632 .3594 .3557 .3520 .3483
0.40
0.50
.3446
.3085
.3409
.3050
.3372
.3015
.3336
.2981
.3300
.2946
.3264
.2912
.3228
.2877
.3192
.2843
.3156
.2810
.3121
.2776
x–μ
0.60 .2743 .2709 .2676 .2643 .2611 .2578 .2546 .2514 .2483 .2451 Z=
0.70
0.80
.2420
.2119
.2389
.2090
.2358
.2061
.2327
.2033
.2296
.2005
.2266
.1977
.2236
.1949
.2206
.1922
.2177
.1894
.2148
.1867
σx-
0.90 .1841 .1814 .1788 .1762 .1736 .1711 .1685 .1660 .1635 .1611
1.00 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379
1.10 .1357 .1335 .1314 .1292 .1271 .1251 .1230 .1210 .1190 .1170
1.20 .1151 .1131 .1112 .1093 .1075 .1056 .1038 .1020 .1003 .0985
1.30 .0968 .0951 .0934 .0918 .0901 .0885 .0869 .0853 .0838 .0823
1.40 .0808 .0793 .0778 .0764 .0749 .0735 .0721 .0708 .0694 .0681
1.50 .0668 .0655 .0643 .0630 .0618 .0606 .0594 .0582 .0571 .0559
1.60 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455
1.70 .0446 .0436 .0427 .0418 .0409 .0401 .0392 .0384 .0375 .0367
1.80 .0359 .0351 .0344 .0336 .0329 .0322 .0314 .0307 .0301 .0294
1.90 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233 0
2.00 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183 z
2.10 .0179 .0174 .0170 .0166 .0162 .0158 .0154 .0150 .0146 .0143
2.20 .0139 .0136 .0132 .0129 .0125 .0122 .0119 .0116 .0113 .0110
2.30 .0107 .0104 .0102 .0099 .0096 .0094 .0091 .0089 .0087 .0084
2.40
2.50
2.60
.0082
.0062
.0047
.0080
.0060
.0045
.0088
.0059
.0044
.0075
.0057
.0443
.0073
.0055
.0041
.0071
.0054
.0040
.0069
.0052
.0039
.0068
.0051
.0038
.0066
.0049
.0037
.0064
.0048
.0036
Áreas bajo la curva
PROBABILIDADES
2.70 .0035 .0034 .0033 .0032 .0031 .0030 .0029 .0028 .0027 .0026
2.80 .0026 .0025 .0024 .0023 .0023 .0022 .0021 .0021 .0020 .0019
2.90 .0019 .0018 .0018 .0117 .0016 .0016 .0015 .0015 .0014 .0014
3.00 .0013 .0013 .0013 .0012 .0012 .0011 .0011 .0011 .0010 .0010
3.10
3.20
.0010
.0007
.0009
.0007
.0009
.0006
.0009
.0006
.0008
.0006
.0008
.0006
.0008
.0006
.0008
.0005
.0007
.0005
.0007
.0005
(zona sombreada)
3.30 .0005 .0005 .0005 .0004 .0004 .0004 .0004 .0004 .0004 .0003
3.40 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0002
3.50 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002
3.60 .0002 .0002 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001
3.70 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001
3.80 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001
3.90 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000 .0000
Proporciones de área para la distribución t
 (Significancia)
gl 0.10 0.05 0.025 0.01 0.005 gl
1 3.078 6.314 12.706 31.821 63.657 1
2 1.866 2.920 4.303 6.965 9.925 2
3 1.638 2.353 3.182 4.541 5.841 3
4
5
1.533
1.476
2.132
2.015
2.776
2.571
3.747
3.365
4.604
4.032
4
5 x–μ
6 1.440 1.943 2.447 3.143 3.707 6 t=
7
8
1.415
1.397
1.895
1.860
2.365
2.306
2.998
2.896
3.499
3.355
7
8
σx-
9 1.383 1.833 2.262 2.821 3.250 9
10 1.372 1.812 2.228 2.764 3.169 10
11 1.363 1.796 2.201 2.718 3.106 11
12 1.356 1.782 2.179 2.681 3.055 12
13 1.350 1.771 2.160 2.650 3.012 13
14 1.345 1.761 2.145 2.624 2.977 14
15 1.341 1.753 2.131 2.602 2.947 15
16 1.337 1.746 2.120 2.583 2.921 16
17 1.333 1.740 2.110 2.567 2.898 17 0
18 1.330 1.734 2.101 2.552 2.878 18 t
19 1.328 1.729 2.093 2.539 2.861 19
20 1.325 1.725 2.086 2.528 2.845 20
21
22
1.323
1.321
1.721
1.717
2.080
2.074
2.518
2.508
2.831
2.819
21
22 Áreas bajo la curva
Valores t
23 1.319 1.714 2.069 2.500 2.807 23
24 1.318 1.711 2.064 2.492 2.797 24
25 1.316 1.708 2.060 2.485 2.787 25
26 1.315 1.706 2.056 2.479 2.779 26
27
28
1.314
1.313
1.703
1.701
2.052
2.048
2.473
2.467
2.771
2.763
27
28
(zona sombreada)
29 1.311 1.699 2.045 2.462 2.756 29
30 1.310 1.697 2.042 2.457 2.750 30
40 1.303 1.684 2.021 2.423 2.704 40
60 1.296 1.671 2.000 2.390 2.660 60
120 1.289 1.658 1.980 2.358 2.617 120
 1.282 1.645 1.960 2.326 2.576 
Caso de Estudio
• 1. Una institución bancaria calcula que sus cuentas de ahorros
individuales están normalmente distribuidas con una media de
$200.000 y una desviación estándar de $60.000; si el banco toma
una muestra aleatoria de 100 cuentas, cual es la probabilidad que la
media de la muestra sea:
a. Menor de $197.500.
b. Mayor de $205.000.
c. Que caiga entre $192.500 y $207.500.
d. Que caiga entre $212.500 y $225.000.
e. Que caiga entre $190.000 y $195.000.
f. Si el número total de cuentas de ahorro es de 850, Calcule la
Probabilidad de que la media de la muestra sea Menor de $197.500
Caso de Estudio
• 2. Faico, indica que sus baterías están normalmente distribuidas
con una duración promedio de 1 (un) año y una desviación estándar
de 3 meses; si Faico toma una muestra aleatoria de 50 baterías de
un lote de producción de 500, cual es la probabilidad que la media
de la muestra sea:
a. Menor de 12 meses
b. Mayor de 15 meses.
c. Que caiga entre 11 y 14 meses.
d. Que caiga entre 13 meses y 18 meses.
e. Que caiga entre 10 meses y 11 meses.
f. Si se han fabricado 25000 baterías, Calcule la Probabilidad de
que la media de la muestra sea Menor de 12 meses y medio.
Estimadores y Pronósticos
Un estimador puntual es sólo un valor numérico basado en datos de
una muestra aleatoria que se utiliza para estimar el valor de un
parámetro poblacional.

_ _
μ = x σ = s por lo que se tiene: σx = σ / √n = s / √n

Se cuentan con otros estimadores, que se conocen como Intervalos


de Confianza, el cual es un estimador de intervalo que se construye
con respecto a la media muestral y que permite especificar la
probabilidad de que incluya el valor de la media poblacional.

Para muestras Pequeñas: (n≤30) Para muestras Grandes: (n>30)


( x – t σx, x + t σx) ( x – Z σ x, x + Z σ x )
Propiedades de un BUEN Estimador
• INSESGADO: Ya que el valor esperado del mismo es igual al
parámetro de la población que estima.

• EFICIENTE: Se refiere a lo cerca que se encuentra el valor


estimado del parámetro.

• CONSISTENTE: Se obtiene cuando el tamaña de la muestra se


incrementa de tal forma que la varianza disminuya, siendo menor
la diferencia entre el valor real y el estimado.

• SUFICIENTE: Debido a que utiliza toda la información que


posee una MUESTRA sobre el parámetro que se estima.
Intervalos de Confianza

Zona de Aceptación
Región crítica

x – tσx x x +t σx n ≤ 30
x – zσ x x x + zσ x n >30
Regresión Lineal
El principal objetivo del análisis de regresión es la de estimar el valor de
una variable aleatoria (dependiente) conociendo el valor de una variable
asociada (independiente).
La forma de la relación se representa mediante un diagrama de dispersión y
puede ser curvilínea ó lineal; aunque el análisis de regresión lineal suele
depender del criterio matemático que se utilice, ya que pueden elaborarse
diversas ecuaciones lineales distintas para una gráfica de dispersión
determinada.
La ecuación es:

y  A  Bx Donde:
y: variable dependiente
Además: A y B: estimadores
∑x y – n x y
B= x: variable independiente
∑ x2 – n x 2

: significa estimado
A=y-B
x
Regresión lineal
Diagrama de Dispersión
Y

Tiempo de Entrega (horas).


X
Distancia en Km.

.- Error estándar de la Estimación: -. Coeficiente de Correlación de muestra:


∑y2 – a ∑ y – b ∑ xy Indica la dirección de la relación.
Se =
n-2 r = √r2
.- Coeficiente de Determinación: Medida
2
r =
a ∑ y + b ∑ xy – n y 2 del grado
∑ y2 – n y 2 de asociación.
Caso de Estudio
• Suponga que un analista toma una muestra aleatoria de 10
embarques recientemente enviados por camión de una compañía y
registra la distancia en Km y el tiempo de entrega en días, como
aparece a continuación:

Embarque 1 2 3 4 5 6 7 8 9 10
muestreado

Distancia 825 215 1070 550 480 920 1350 325 670 125
(KM)
Tiempo de 3.5 1.0 4.0 2.5 2.0 3.0 4.5 1.5 3.0 1.0
Entrega
(Días)

Construya un diagrama de dispersión para los datos de la tabla


dada y determine si un análisis de regresión lineal es apropiado.
Regresión Múltiple
El principal objetivo del análisis de regresión Múltiple es la de estimar el
valor de una variable aleatoria (dependiente) conociendo el valor de más de
una variable asociada (independiente).
La forma de la relación no se puede representar mediante un diagrama de
dispersión; aunque el análisis de regresión Múltiple suele depender de un
criterio matemático, ya que pueden elaborarse a partir de una ecuación
lineal.
La ecuación es: y  a  b1X 1  b2 X 2  b3 X 3  ....bnXn

Donde: y: variable dependiente


Permite utilizar más
a, b1, b2, b3…. bn: estimadores Información disponible
X1 : variable independiente No. 1 para estimar la variable
Dependiente, encontrando
X2 : variable independiente No. 2 una relación de mayor
precisión.
Xn : variable independiente No. n
Caso de Estudio
• Suponga que un analista toma una muestra aleatoria de 10 embarques
recientemente enviados por camión de una compañía y registra la
distancia en Km, el tiempo de entrega en horas y una calificación
según el clima, como aparece a continuación:

Embarque 1 2 3 4 5 6 7 8 9 10
muestreado
Distancia 825 215 1070 550 480 920 1350 325 670 125
(Km)
Tiempo de 3.5 1.0 4.0 2.5 2.0 3.0 4.5 1.5 3.0 1.0
Entrega
(días)
Condiciones 3.0 4.0 3.5 2.0 3.5 4.0 4.5 5.0 2.5 3.5
del clima

Determine si un análisis de regresión Múltiple es apropiado para el


tiempo de Entrega.
Series de Tiempo
Una serie de tiempo es un conjunto de valores observados, tales como datos
de producción o ventas, por ser ordenadas secuencialmente por períodos
de tiempo.

El análisis de series de tiempo es el procedimiento mediante el cual se


identifican y separan los factores relacionados con el tiempo que influyen
sobre los valores observados de la serie; una vez que se identifiquen esos
valores, se les puede utilizar para mejorar la interpretación de los valores
históricos de la serie de tiempo y para pronosticar valores futuros.

Se deben identificar los siguientes efectos:


1. Tendencia: El movimiento a largo plazo de los valores de la serie de tiempo
durante un número prolongado de años.
2. Fluctuaciones cíclicas: Movimiento recurrentes hacia arriba y hacia abajo
con respecto a las tendencias.
3. Variaciones Estacionales: Que tienen poca duración y que se presentan
todos los años.
4. Variaciones irregulares: variaciones erráticas con respecto a la tendencia y
que no pueden adjudicarse a efectos estacionales o cíclicos.
Caso de Estudio
• En la tabla se presentan los datos trimestrales de ventas en
millones de pesos, para la compañía ABC:

Trimestre 1999 2000 2001 2002 2003 2004

1 500 450 350 550 550 750

2 350 350 200 350 400 500

3 250 200 150 250 350 400

4 400 300 400 550 600 650

Construya un diagrama de dispersión para los datos de la


tabla dada y determine si un análisis de series de tiempo es
apropiado.

También podría gustarte