Está en la página 1de 57

ESTADISTICA Y PROBABILIDADES APLICADA

Ing. M.A. GUIDO ANDRES ARAUZO GALLARDO Profesor Principal D.E. FIEE - UNCP

CURRICULUM
Ingeniero Electricista, 1977 Universidad Nacional del Centro del Per Facultad de Ingeniera Elctrica. Magister en Administracin de Negocios, 1989-90 Universidad ESAN, Lima Per. Becario del Programa de Gerencia del Banco Interamericano de Desarrollo (BID). Concentracin en Investigacin de Mercados.

Estudios concluidos de Doctorado en Ingeniera Energtica, ao: 200809. Universidad Nacional San Agustn de Arequipa. Investigacin en el rea de estadstica actuarial y aplicacin del Modelo Biomtrico a la supervivencia de sistemas elctricos.
Especializacin en Software Estadstico para Investigacin, Anlisis Univariante, Multivariable, Series de Tiempo, Factorial, Discriminante, Diseo de Experimentos. Universidad Nacional Mayor de San Marcos, 1992. Especializacin en Modelos Cuantitativos de Riesgos Financieros, 2007. Centro de Formacin Bancaria. Superintendencia de Banca y Seguros del Per (SBS). Con aplicacin de las recomendaciones del Acuerdo de Basilea II.

ORGANIZACIN DEL CURSO


PARTE I Principios Bsicos Estadstica Descriptiva
PARTE II Probabilidades Inferencia Estadstica PARTE III Regresin Lineal Series de Tiempo PARTE IV Anlisis de varianza Diseo de Experimentos

QUE ES LA ESTADISTICA
Es la ciencia de los datos, lo cual implica su recoleccin, clasificacin, sntesis, organizacin, anlisis e interpretacin, para la toma de decisiones frente a la incertidumbre
Estadistica General Aplicada Angel Gutierrez Edit. Fondo Editorial Universidad. Colombia

QUE ES LA ESTADISTICA
La palabra estadstica se refiere a un sistema o mtodo usado en la recoleccin, organizacin, anlisis y descripcin numrica de la informacin. Estudia el comportamiento de los fenmenos de grupo.
Estadstica y Muestreo. Ciro Martinez Bencardino. ECOE EDICIONES. Colombia.

QUE ES LA ESTADISTICA
El campo de la estadstica trata de la recoleccin, presentacin, anlisis y uso de datos para tomar decisiones, solucionar problemas y disear productos y procesos.
PROBABILIDAD Y ESTADISTICA Aplicadas a la Ingeniera. Montgomery. Runger. Edit. Limusa Wiley. Mexico.

QUE ES LA ESTADISTICA
La disciplina, de la estadstica proporciona mtodos para organizar y resumir datos, y para sacar conclusiones con base en la informacin que contienen los datos.
PROBABILIDAD Y ESTADISTICA Para Ingeniera y Ciencias. Jay L. Devore. Editorial Thomson. Argentina.

QUE ES LA ESTADISTICA
Es la ciencia que nos proporciona un conjunto de mtodos, tcnicas o procedimientos para: recopilar, organizar (clasificar y agrupar), presentar y analizar los DATOS, con el fin de describirlos o realizar generalizaciones validas (INFORMACION).
ESTADISTICA. Manuel Crdova Zamora. Editorial San Marcos. Pontificia Universidad Catlica del Per.

IMPORTANCIA DE LA ESTADISTICA
Es importante porque provee de informacin actual (descriptiva) y proyectada (Inferencia) a los tomadores de decisiones.

ANALISTA DE INFORMACION Y FORMULADOR DE ESCENARIOS

DATOS

CONTEXTO

INFORMACION

INFERENCIA

INTELIGENCIA

CERTIDUMBRE

CONOCIMIENTO

ROJO: NEGRO: VERDE:

CAMPO DE LA ESTADISTICA CAMPO DE LA ESTADISTICA O DEL TOMADOR DE DECISIONES CAMPO DEL TOMADOR DE DECISIONES

EJEMPLO DE APLICACIN Recoleccin de datos


ENCUESTA DE VENTAS MENSUALES

EMPRESA: . FECHA : 28 setiembre 2010 ENCUESTADOR:

Le agradeceremos se sirva registrar las mentas mensuales realizadas por su empresa en el ao 2009.

ENERO FEBRERO MARZO ABRIL MAYO JUNIO JULIO AGOSTO SETIEMBRE OCTUBRE NOVIEMBRE DICIEMBRE

.. ----------------------------------------------------------------------------------------------------------------------------------------------

Gracias por su colaboracin.

EJEMPLO DE APLICACIN Resumen de datos


VENTAS MENSUALES ABC S.A.
Miles de nuevos soles

MES ENE FEB MAR ABR MAY JUN JUL AGO SET OCT NOV DIC
Fuente: Propia

2009 2.3 2.9 3.1 5.5 4.5 6.2 6.4 7.8 8.9 10.2 12.5 13.6

EJEMPLO DE APLICACIN Relacin con el contexto tiempo = Informacin

Ventas Mensuales
16

14
v e n t a s

12 10

8
6 4

2
0 ENE FEB MAR ABR MAY JUN JUL AGO SET OCT NOV DIC

EJEMPLO DE APLICACIN Relacin con el contexto tiempo = Informacin

LA INFORMACION QUE SE EXTRAE DE LOS DATOS SERA:

Las ventas mensuales de la empresa ABC S.A. crecen desde el mes de enero a diciembre de 2009
SI LOS DATOS SON CIERTOS, LA INFORMACION SERA CIERTA

EJEMPLO DE APLICACIN Inferencia de la Informacin

Ventas Mensuales
16

14
v e n t a s

y = 1.0052x + 0.4576 R = 0.9513

12 10

8
6 4

2
0 ENE FEB MAR ABR MAY JUN JUL AGO SET OCT NOV DIC

EJEMPLO DE APLICACIN Informacin + Inferencia = Inteligencia

El Informe de Inteligencia ser: Para el mes de enero de 2011, las ventas de la empresa ABC S.A. probablemente ser de un monto de 13.52 Miles de nuevos soles

Y=1.0052 * 13 + 0.4576 = 13.52

EJEMPLO DE APLICACIN Construccin del escenario

En la construccin del escenario ingresan otras variables relevantes del contexto que se suman a la informacin de inteligencia.
ESCENARIO No. 01
Las ventas de la empresa ABC S.A. tiene una tendencia al crecimiento. Para el mes de enero 2011 probablemente las ventas sern de 13.52 m.n.s; sin embargo el cambio de gobierno local podra variar las necesidades de los clientes y disminuir las ventas. Como la economa esta en crecimiento; es altamente probable que la demanda sea estable en el transcurso del ao 2011.

DATOS
Dato proviene del vocablo latn datum, es una representacin mediante smbolos numricos, alfabticos o de otra clase de la caracterstica de algo. generalmente provienen de fenmenos y experiencias La caracterstica es una cualidad que determina los rasgos de una persona o cosa y que lo distingue del resto.

INFORMACION
La informacin es un conjunto organizado de datos, que constituyen mensajes de ciertos fenmenos o entidades (sistemas).

CARACTERISTICA DE LOS DATOS


La principal caracterstica de los datos es su VARIABILIDAD, Es decir TOMA VALORES DIFERENTES, aun cuando los procesos, las maquinas y los sistemas sean iguales, el producto final presenta variabilidad (Campo del Control de Calidad).

VARIACIONES NO SISTEMATICAS
Mediciones de Varillas X = 40 cms.

MUESTRA 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

VALOR 39.96 39.92 40.04 39.91 40.01 40.01 39.96 40.01 39.97 40.06 40.01 39.96 40.03 40.03 40.00 40.05 40.00 39.93 40.01 40.01

Mediciones Realizadas
40.08

40.06
40.04 40.02 40.00 39.98 39.96 39.94 39.92 39.90

10

15

20

25

POBLACION
Se denomina poblacin o universo a cualquier conjunto TOTAL de elementos de los cuales estamos interesados en obtener informacin precisa.

INFORMACION DE UNA POBLACION


Hay dos formas de obtener informacin de una poblacin: 1. Realizar un CENSO 2. Realizar un MUESTREO

CENSO
CENSO es el proceso de realizar observaciones a TODA la poblacin. Cuando dicha poblacin es pequea es razonable realizar un censo. Realizar un CENSO es tomar datos a TODOS los elementos de una poblacin

MUESTRA
Se llama MUESTRA, a todo subconjunto de una poblacin. Cuando las poblaciones no son pequeas, es casi imposible realizar un censo, por falta de tiempo y recursos (especialmente econmicos). Por tanto se puede conocer a la poblacin a partir de una muestra.

VARIABLE
Una variable es una funcin X que a cada elemento de una poblacin le hace corresponder un numero real. Mediante la variable, el investigador operacionaliza los conceptos; transforma en cifras las caractersticas de los elementos de la poblacin.

VARIABLES
1. VARIABLE: Ocupacin (Variable cualitativa) La variable ocupacin, asigna valores 1,2,3 y 4 segn corresponda: 1: Obrero 2: Tcnico escala etiqueta 3: Profesional 4: Ninguno

VARIABLES
1. VARIABLE: Edad (aos) : variable cuantitativa La variable EDAD, asigna valores de 25, 33, 45, 33 segn corresponda a cada entrevistado: 1: 25 2: 33 escala entrevistado 3: 45 4: 33

ESCALAS
Son los diferentes tipos de valores que se asignan a los elementos de una poblacin. Las escalas se clasifican en:
1. Escala Nominal 2. Escala Ordinal 3. Escala de Razn

ESCALA NOMINAL
Es aquella escala que asigna un numero a cada elemento de la poblacin o muestra, dicho numero funciona solo como ETIQUETA. Ejemplo: Variable: especialidad del estudiante Letras = 1 Ciencias = 2 etiquetas

ESCALA NOMINAL
CARACTERISTICAS
1. No existe ningn orden entre datos 2. La distancia entre dos valores no tiene sentido. 3. No existe preferencia entre datos

TRATAMIENTO DE DATOS

1. Solo Frecuencia ( % de datos por categora)

ESCALA NOMINAL

Ver ejem1 en SPSS

ESCALA ORDINAL
Se tiene una escala ordinal cuando el ORDEN de los nmeros asignados a los elementos de la poblacin o muestra, refleja diferentes grados del atributo en estudio. Ejemplo: Variable: Grado de instruccin Primaria = 1 Secundaria = 2 Superior = 3

ESCALA ORDINAL
CARACTERISTICAS

1. Entre los datos existe una relacin de orden: mayor o igual, menor o igual. 2. La ordenacin significa diferentes niveles.
3. Diferencia aritmtica no tienen sentido. TRATAMIENTO DE DATOS 1. Solo Frecuencia (% de datos).

ESCALA ORDINAL

Ver ejem2 SPSS

ESCALA DE RAZON
La escala de razn, es una escala donde los cocientes o razones de los nmeros asignados reflejan las cuantas de las propiedades que se miden. Ejemplo: Variable: Sueldos mensuales 1 800 1 100

2 200

ESCALA DE RAZON
CARACTERISTICAS
1. Tiene sentido hablar de orden. 2. El cero indica ausencia de propiedad.

3. Las operaciones de multiplicacin y divisin de datos tiene interpretacin racional.


TRATAMIENTO DE DATOS

1. Media, mediana, multiplicacin, divisin de datos. En SPSS aparece como escala.

ESCALA DE RAZON

Ver ejem3 en SPSS

ANALISIS DESCRIPTIVO DE DATOS

GRAFICAS DE VARIABLES
1. Son tcnicas para comenzar a descubrir lo que dicen los datos. 2. Indican de manera rpida el comportamiento de las unidades que se observan. 3. La exploracin ayuda al investigador a identificar algn modelo probabilstico.

GRAFICO DE BARRAS
Es el grafico que considera todos los datos de la variable para elaborar el grafico de frecuencias. No es practico para el grafico de muchos datos, por lo que no se observara su comportamiento con claridad. Emplear para pocos datos.

DIAGRAMA DE BARRAS

HISTOGRAMA DE FRECUENCIAS

HISTOGRAMA DE FRECUENCIAS

14 clases por defecto Del SPSS

HISTOGRAMA DE FRECUENCIA
1. NUMERO DE CLASES (k) Regla de Sturges: k = 1+3.3log(n) n = numero de datos = 51 k = 1+3.3log(51) = 6.63 : k = 7
Recomendable: Entre 5 y 15 clases

2. TAMAO DE INTERVALO DE CLASE (TIC) TIC = Rango / k Rango = mayor valor menor valor Rango = 15 1 = 14 TIC = 14/7 : TIC = 2

HISTOGRAMA DE FRECUENCIAS
TABLA DE FRECUENCIAS
1 2 3 4 5 Interva l o de cl a s e

No. De Intervalos

Lim. Infer.

Lim. Super.

Marca de Clase

Frecuencia

1 2 3 4 5 6 7
3 = 2 + TIC

1 3 5 7 9 11 13 Total
4 = (2 + 3) /2

3 5 7 9 11 13 15

2 4 6 8 10 12 14

9 14 15 5 3 3 2 51

Ver ejem4 en SPSS

HISTOGRAMA DE FRECUENCIA

7 clases calculadas

HISTOGRAMA DE FRECUENCIA
TABLA DE FRECUENCIAS
1 2 3 4 5 6

No. De Intervalos

Interva l o de cl a s e

Lim. Infer.

Lim. Super.

Marca de Clase

Frecuencia

frecuencia %

1 2 3 4 5 6 7
3 = 2 + TIC

1 3 5 7 9 11 13 Total
4 = (2 + 3) /2

3 5 7 9 11 13 15

2 4 6 8 10 12 14
6 = 5 / total

9 14 15 5 3 3 2 51

18% 27% 29% 10% 6% 6% 4% 100%

MEDIDAS DE TENDENCIA CENTRAL La media


La media es un punto de equilibrio entre los valores que estn por debajo y por encima de dicha media Para datos NO AGRUPADOS

MEDIDAS DE TENDENCIA CENTRAL La media


PARA DATOS AGRUPADOS Y1 = marcas de clase F1 = frecuencias absolutas Fr = frecuencias relativas N = Tamao de datos

MEDIDAS DE TENDENCIA CENTRAL La media


PROPIEDADES DE LA MEDIA 1. La suma de las desviaciones respecto de la media es cero. 2. La media puede asumir cualquier valor real 3. La media es afectada por los valores extremos. ! IMPORTANTE !

MEDIDAS DE TENDENCIA CENTRAL La media


DATOS (Peso en Kg.)

18 11 15 14 16 21 10 17 120
Dato extremo

MEDIDAS DE TENDENCIA CENTRAL La media


DATOS (Peso en Kg.)
18 11 15 14 16 21 10 17

SIN el valor extremo

MEDIDAS DE TENDENCIA CENTRAL La mediana


La mediana es el valor que DIVIDE en dos partes aproximadamente iguales al conjunto ordenado de observaciones. Si n es Impar Si n es Par

LA MEDIANA NO ES AFECTADA POR LOS VALORES EXTREMOS

MEDIDAS DE TENDENCIA CENTRAL La mediana

mediana

MEDIDAS DE TENDENCIA CENTRAL Evaluacin Conjunta de la Media y La Mediana


La mediana es mas representativo

Ejem5 del SPSS


Posible error de toma de datos

MEDIDAS DE TENDENCIA CENTRAL La Moda

La moda es el valor que mas veces se repite Ver ejem6 SPSS

También podría gustarte