Está en la página 1de 59

Anlisis de datos

Universidad del Valle de Mxico

Jos Alberto Nuncio Esquivel


alberto_nuncio@yahoo.com

Bienvenida

Jos Alberto Nuncio Esquivel


alberto_nuncio@yahoo.com

Presentacin de cada uno de los alumnos:


-

Nombre.
Cuatrimestre
Empresa donde laboran.
Que puesto tienen.
Cuanto tiempo tienen laborando en esa empresa.
Pregunta extra.

Anlisis de datos
OBJETIVO GENERAL

El estudiante analizar los distintos criterios para el manejo de datos como correlaciones,
regresiones, anlisis de varianza, estadstica no paramtrica y modelos de prediccin con
el fin de distinguir la mejor herramienta en un caso prctico de su rea profesional.

Anlisis de datos
Materia
Clave
Horas de Clase
Horas de estudio
Tcnica didctica
Horario de clases
Lugar
Horario de Asesoras

Anlisis de datos
:

s/n

3 horas semanales
4.5 horas por cada 3 horas de clases
Presencial
Lunes y Mircoles 19:00 20:30
Campus Saltillo Saln____
Por definir segn sea el caso
NDICE DE UNIDADES

1.
2.
3.
4.
5.

Correlacin y regresin lineal


Regresin mltiple y polinomial
Anlisis de varianza
Estadstica no paramtrica
Modelos de prediccin y series de tiempo

NDICE DE UNIDADES
1.
2.
3.
4.
5.

Correlacin y regresin lineal


Regresin mltiple y polinomial
Anlisis de varianza
Estadstica no paramtrica
Modelos de prediccin y series de tiempo

INDICE DE UNIDADES
1.

Correlacin y regresin lineal

1.

Regresin mltiple y polinomial

1.

1.

1.

OBJETIVO ESPECFICO POR UNIDADES


El estudiante analizar los diagramas de dispersin y el
coeficiente de correlacin r, para determinar si dos variables
estn correlacionadas.

Anlisis de varianza

El estudiante identificar el anlisis de regresin para verificar


los KPIVs (causas crticas o poco significativas) con el fin de
determinar los mejores niveles de operacin de R2 (cuanto ms
alto mejor).

Estadstica no paramtrica

El estudiante usar un anlisis de varianza (ANOVA) de una va


y de dos vas para determinar si las variables de entrada
afectan de forma significativa la salida promedio.

Modelos de prediccin y series de tiempo

El estudiante analizar la aplicacin de la estadstica no


paramtrica a un conjunto de datos especfico con el fin de
apreciar las ventajas de esta herramienta.
El estudiante usar un mtodo slido para la construccin de
modelos y as obtener la ecuacin predictiva ms confiable
posible en una situacin determinada.

Alguna duda?

ACTIVIDADES DE ENSEANZA APRENDIZAJE BAJO LA


CONDUCCIN DE UN ACADMICO

Presentar dibujos y/o grficas para explicar un modelo


terico

Presentar ejemplos de aplicacin

Presentar casos de estudio con estructura metodolgica


Fomentar la participacin del estudiante en clase
Formar equipos de trabajo para el anlisis y solucin de
problemas

ACTIVIDADES DE APRENDIZAJE INDEPENDIENTES

Realizar investigacin documental y analizar textos,


identificando elementos aplicados a la realidad
profesional

Realizar visitas a plantas industriales extra clase

Realizar prcticas de aplicacin de conceptos tericos

Resolver problemas para la aplicacin de modelos

Formular soluciones para proyectos reales

Explicar estructura y funcionamiento de software


especializado

Realizar trabajos
problemas reales

Presentar estrategias de solucin de problemas

Simular en software especializado el comportamiento


de sistemas reales

Trabajar con la tcnica de aprendizaje basado en


problemas

Alguna duda?

de

investigacin

aplicados

Evaluacin:

La evaluacin del curso es de carcter integral, acumulativo, formativo, sumativo, participativo y de aplicacin continua a
los estudiantes durante el desarrollo del curso, por medio del cual se exploran y valoran los avances de las unidades de
aprendizaje, a travs de la elaboracin de trabajos, ensayos, investigaciones, prcticas, participaciones en clase y
cualquiera otra forma de evaluacin que se estime conveniente.
Cabe sealar que la evaluacin del aprendizaje se adaptar a la metodologa y estrategias de enseanza-aprendizaje
que se utilicen.
Acreditacin:
El curso se acredita con dos evaluaciones parciales en las cuales se considerarn tanto las pruebas objetivas como
los productos elaborados dentro del proceso de enseanza-aprendizaje.

Como se evaluar

Fechas importantes
Inicio de clases
Primera evaluacin

16/Junio/14
04/Agosto/14

Revisin Examen y
Firma de Acta parcial
Segunda evaluacin

06/Agosto/14

Revisin Examen y
Firma de Acta parcial
Proyecto Final
Asueto

21 y 23/Septiembre/2014

17/Septiembre/2014

3, 8 y el 10 de Septiembre 2014
Ninguno

Polticas del Curso


Estructura de la clase:

De manera aleatoria y sin previo aviso, se designar a un alumno para que haga un resumen de la clase anterior, de no
ms de cinco minutos.
De la misma forma, se podr aplicar un examen rpido de las lecturas asignadas o de la clase anterior al comienzo de la
sesin.
El profesor har una exposicin general del tema a tratar en cada sesin.
Es obligatoria la participacin de todos los alumnos en las discusiones y ejercicios de clase.

Polticas de Evaluacin
La calificacin final est compuesta por:
La calificacin parcial de la primera y segunda evaluacin:

Primera evaluacin
Segunda evaluacin
Proyecto final

40
40
20

40% 50%
40 % 50%
5 % 20%

Evaluacin Parcial
Examen parcial
Ejercicios, Ensayos,
Investigaciones, tareas
Exmenes rpidos
Participacin

50%
30%
10%
10%

Quieren modificar algo aqu???

50 % 70%

10% 20%
10 % 20%
10 % 20%

Asistencia y puntualidad

La tolerancia para entrar al saln de clase ser de 10 minutos.


Una vez comenzado el examen rpidos solo se dar le tiempo estipulado, sin excepcin por retardo.
3 retardos amerita una falta.
El lmite de faltas para tener derecho a examen final es el equivalente a dos semanas de clases (4
faltas en total del curso).
Las faltas deben ser justificadas mnimo una clase antes. Queda sujeta a juicio de maestro.

Trabajos, exmenes y tareas extemporneas

Slo se aceptarn las tareas, trabajos y proyectos que se entreguen en tiempo y en forma.
El examen extemporneo se realizar, previa autorizacin de los directores de Carrera y de
Departamento, sobre una calificacin de 80.
La solicitud del examen se deber realizar con el Director de Carrera correspondiente.

Reglas de comportamiento
Queda estrictamente prohibido fumar e ingerir alimentos y/o bebidas en el saln de clase,
as como el uso de celulares o cualquier otro equipo de comunicacin.
La computadora porttil slo se utilizar dentro del saln de clases para las actividades
acadmicas diseadas para la materia. Fuera de estas razones, por ningn otro motivo se
autorizar su uso durante el desarrollo de la clase.
El profesor asume que el alumno conoce el Reglamento General de Alumnos vigente y el
Reglamento Acadmico para los programas de Profesional, por lo que todas las actividades
durante el cuatriimestre se regirn conforme a lo establecido en dichos reglamentos.

Alguna duda???

Bibliografa.
1- John E. Freud y Gary A. Simon, Estadista elemental, 8va edicin, Edit. Pearson Prentice Hall.
2- Johnson Kuby, Estadistica elemental, 3 edicin, Edit. Thomson.
3- Lincoln L. Chao, Introduccin a la estadstica, Editorial Continental.
4- Mendenhall-Beaver-Beaver, Introduccin a la probabilidad y estadstica, 13 edicin, CENGAGE
Learning.
5- Jos Juan Gngora Corts y Roberto Hernndez Ramrez, Estadstica descriptiva, Trillas.
6- Mario F. Triola, Estadstica, 10 edicin, Edit. Pearson Addison Wesley.
7- Montgomery, Control estadstico de la calidad, 3 edicin, Limusa Wiley.
8- Douglas Montgomery, introduction to statistical quality control, 7 edition, Edit. Wiley.
9- Adrew Sleeper, Design for Six Sigma statistics, Edit. Mc. Graw-Hill.
10- Robert P. Neuman and Roland R. Cavanagh, The Six Sigma Way, Mc. Graw-Hill.
11- Ron S. Kenett-Shelemyahu Zacks, Estadstica Inustrial Moderna, Edit. Thomson.
12- Michael L. George, Lean Six Sigma, Mc. Graw-Hill.
13- Thomas Pyzdek, The Six Sigma Handbook, Mc. Graw-Hill.

1- Introduccin al anlisis
de datos
Universidad del Valle de Mxico

Jos Alberto Nuncio Esquivel


alberto_nuncio@yahoo.com

Antecedentes histricos.
Al igual que ha ocurrido con otras muchas disciplinas, a lo largo del tiempo se ha pensado
que la estadstica es un procedimiento extraordinariamente complicado. Cuando leemos
artculos en los que aparecen resultados estadsticos nos queda la impresin de que lo dicho
en ellos es una verdad absoluta e incontrovertible que est apoyada por todo un aparato
matemtico. Esto no es forzosamente cierto, se puede adquirir con relativa facilidad un
conocimiento bsico de la estadstica
La estadstica fue fundada por John Graunt, en un
pequeo libro Natural and political Observations made
upon the Bells of Mortality. Este libro fue el primer
intento para interpretar fenmenos biolgicos de masa y
de la conducta social: a partir de datos numricos
escribir las cifras brutas de nacimientos y defunciones en
Londres, de 1604 a 1661. Treinta aos ms tarde, la
Royal Society public en su Philosophical Transactions
un artculo sobre tasas de mortalidad escrito por el
eminente
astrnomo
Edmund
Halley.
Ambas
publicaciones constituyen la base de todo trabajo
posterior sobre esperanza de vida,

Antecedentes histricos.
En el famoso libro de Jacob Bernoulli, Aos Conjectandi, aparece un teorema de
importancia cardinal para la Teora de Probabilidades, comnmente llamado Teorema de
Bernoulli, y tambin conocido como Ley de los grandes nmeros, nombre que le fue dado
por el matemtico francs, Simeon Poisson (1781-1840). Este teorema fue el primer
intento para deducir medidas estadsticas a partir de probabilidades individuales.

Junto con Arqumedes y Newton, Gauss es uno de los tres grandes de la Matemtica.
Ellos aportaron conceptos muy tiles en sus distintas ramas tanto en su forma pura como
aplicada.

Funciones de la estadstica.
Los conceptos y temas de la estadstica se utilizan en la actualidad en un gran nmero de
ocupaciones. Las tcnicas estadsticas constituyen una parte integral de las actividades de
investigacin en distintas reas del saber humano.

Con frecuencia escuchamos comentarios como los siguientes:


Se ha demostrado estadsticamente que el mayor porcentaje de las ventas de automviles se
registran en el primer trimestre del ao.
La explotacin de petrleo crudo en el ltimo trimestre del ao de 1993 ascendi a 285
millones de barriles, cuyo producto fue de 3698 millones de dlares.
Estadsticamente se ha demostrado que el huevo produce el colesterol en las personas que
consumen mucho este producto.
Se ha comprobado estadsticamente, que la pasta dental de mayor aceptacin por el pblico
es la que produce la fbrica Colgate-Palmolive.
Todas estas expresiones nos indican que la Estadstica es una herramienta que ayuda a
conocer la realidad.

Justificacin

Los conceptos y los mtodos estadsticos no solo son tiles, sino en verdad
indispensables para comprender el mundo que nos rodea. Nos proporcionan formas de
adquirir nuevas perspectivas del comportamiento de muchos fenmenos con que nos
encontramos de la ingeniera y las ciencias.
La disciplina de la estadstica ensea como razonar lgicamente y tomar decisiones
informadas en presencia de la incertidumbre y la variacin. Sin estas dos habra poca
necesidad de los mtodos estadsticos o de los profesionales de la estadstica.

Justificacin
NO necesitan
mayor anlisis
Anlisis de
datos
DOE

Mtodos
estadsticos

Toma de
decisiones
diaria

Estadstica

Necesitan
mayor anlisis

Variacin

Presencia
Incertidumbre

Seleccin de proveedores
Rechazo de un producto
Tamao correcto de
muestra.
Existe diferencia
significativa al usar tal o
cual mtodo?
Cambios de
material/molde.
Rendimiento
maquina/trabajadores.

1.1 - Conceptos
Estadstica
Qu es la estadstica?

Es una de las herramientas mas utilizadas en la investigacin cientfica.


Herramienta indispensable en instituciones gubernamentales, educativas, de
negocios, en la banca , etc.
La Estadstica es el estudio cientfico relativo al conjunto de mtodos
encaminados a la obtencin, representacin y anlisis de observaciones numricas,
con el fin de describir la coleccin de datos obtenidos, as como inferir
generalizaciones acerca de las caractersticas de todas las observaciones y tomar las
decisiones ms acertadas en el campo de su aplicacin.

1.1 - Conceptos
Cules son las dos grandes divisiones de la estadstica?

Estadstica
descriptiva

Estadstica
inferencial.

1.1 - Conceptos
Estadstica
descriptiva

Consiste en procedimientos usados para resumir y describir las


caractersticas importantes de un conjuntos de mediciones.

Presenta tcnicas para describir un conjunto de datos

Ejemplos?

Media
Desviacin
Varianza
Error de la media
Coeficiente de variacin
Cuartiles
Percentiles
Moda
Mediana
Mnimo
Mximo
Rango
Kurtosis

1.1 - Conceptos
Ejercicio 1.1

Mediciones de edad, estatura y peso de alumnos.

M16

Diga cada uno su genero y estatura y peso. Construya una tabla en Excel de los datos
proporcionados. Anota en tu cuaderno o en un archivo de Excel.
NOTA: Al final guardaremos el archivo como Datos personales.xlsx
-

N:
Media :
Desviacin :
Varianza:
Coeficiente de variacin:
Cuartiles
Percentiles
Moda :
Mediana:
Mnimo :
Mximo:
Rango:
Kurtosis :

1 dia

1.1 - Conceptos
Estadstica
inferencial

Consta de procedimientos usados para hacer inferencias acerca de las


caractersticas de la poblacin, a partir de informacin contenida en una
muestra extrada de la misma poblacin.
Hacer inferencias
Sacar conclusiones
Hacer predicciones

Estadstica
inferencial

Ejemplos?
-

Prueba t una muestra


Prueba T pareada
Prueba T dos muestras
Recesin lineal simple
Regresin polinomica
simple.
Regresin polinomia
mltiple.
Ajuste de ecuacin.
Diseos de experimentos.
Prueba de normalidad
Etc.

Divisiones de la estadstica

Procesos Estocsticos

Estadstica
inferencial.

Random process

Estadstica
descriptiva

Procesos Determinsticos

Para lograr modelar correctamente un proceso estocstico es necesario


comprender
numerosos
conceptos
de
probabilidad
y estadstica.
Dentro del conjunto de procesos estocsticos se encuentran, por ejemplo, el
tiempo de funcionamiento de una mquina entre avera y avera, su tiempo de
reparacin y el tiempo que necesita un operador humano para realizar una
determinada operacin. El objetivo es utilizar la posible inercia en el
comportamiento de la serie datos con el n proveer su evolucin futura.

Variables continuas
Procesos Estocsticos
Variables discretas

Ejemplos de variables
Variables continuas continuas

Variables discretas

Divisiones de la estadstica

Procesos Estocsticos

Procesos Determinsticos

Es un modelo matemtico donde las mismas entradas producirn invariablemente


las mismas salidas, no contemplndose la existencia del azar ni el principio de
incertidumbre.
Ejemplos???

Caida libre de un objeto


1
= 2
2

Por ejemplo, la planificacin de una lnea de produccin, en


cualquier proceso industrial, es posible realizarla con la
implementacin de un sistema de gestin de procesos que
incluya un modelo determinista en el cual estn cuantificadas
las materias primas, la mano de obra, los tiempos de produccin
y los productos finales asociados a cada proceso.

Cul es mas difcil modelar, un proceso estocstico o un determinstico y porque?

Ejercicio grupal.
Procesos Determinsticos
Procesos Estocsticos
Ejercicio 1.2

Genera Y idnticas o salidas iguales.


Genera diferentes salidas a pesar de tener las mismas condiciones

Cada alumno elaborara rpidamente un ejemplo de un proceso


estocstico y el siguiente compaero un proceso determinstico,
as sucesivamente. Toma apuntes!!!

Estadstica paramtrica y no paramtrica


Parmetro:

Es una caracterstica de la poblacin de inters que queremos estimar.


La media, desviacin, los residuales, etc, son algunos ejemplos.

Paramtrica
Es una rama de la estadstica que comprende los procedimientos estadsticos y de decisin
estn basados en las distribuciones de los datos reales. Estas son determinadas usando
un
nmero
finito
de
parmetros.
por ejemplo, si conocemos que la altura de las personas sigue una distribucin normal,
pero desconocemos cul es la media y la desviacin de dicha normal. La media y la
desviacin tpica de la desviacin normal son los dos parmetros que queremos estimar.
La mayora de los procedimientos paramtricos requiere conocer la distribucin para las
mediciones.

Estadstica paramtrica y no paramtrica


NO Paramtrica
Es una rama de la estadstica que estudia las pruebas y modelos estadsticos cuya distribucin
subyacente no se ajusta a los llamados criterios paramtricos. Su distribucin no puede ser
definida a priori, pues son los datos observados los que la determinan. La utilizacin de estos
mtodos se hace recomendable cuando no se puede asumir que los datos se ajusten a una
distribucin conocida.
Las principales pruebas no paramtricas son las siguientes:
Prueba de Pearson
Prueba binomial
Prueba de Anderson-Darling
Prueba de Cochran
Prueba de Cohen kappa
Prueba de Fisher
Prueba de Friedman
Prueba de Kendall
Prueba de Kolmogrov-Smirnov

Variables y datos.
Variable

Es una caracterstica que cambia o se modifica con el tiempo y/o para diferentes
individuos u objetos en consideracin.

Ejemplos :
- Temperatura corporal cambia con el tiempo.
- Edad cambia con el tiempo.
- Ingresos $$$ cambia por empresa y con el tiempo
y por otros factores
Poblacin

Conjunto de todas las mediciones de inters para el investigador.

Muestra.

Subconjunto de mediciones seleccionadas de la poblacin de inters.

Poblacin

Muestra

Variables cualitativas
Miden una cualidad o
caracterstica en cada
unidad experimental.

Variables cuantitativas
Miden una cantidad
numrica en cada
unidad experimental.

Tipo de variables

Variables cualitativas

Variables cuantitativas

Datos categricos

Ordinal

Nominal

Variables discreta

Variables continua

Es aquella que agrupa los elementos en categoras que no pueden ser


ordenados.
Nominal

Ejemplos:
- Nacionalidad: Aleman, Espaol,
Mexicano, Ruso.
- Colores: Rojo, Verde, Azul
- Metodo 1 , Metodo 2

Variables cualitativas
Es aquella que agrupa los elementos en categoras que pueden ser
ordenados.
Ordinal

Ejemplos:
- Nivel de ingles: Bajo, Medio, Alto.
- Peso: Flaco, promedio, robusto.
-

Variables discretas

Asume solo un nuero finito o contable de valores.

- Numero de empleados
- Puertas de Acceso A,B o C.
Variables
cuantitativas.

Variables continuas

Toma todos los valores infinitos que correspondan a los


puntos sobre un inrvalo lineal.
- Temperatura de un horno.
- Tiempo de un marchista en una carrera.

Identificacin de variables. Identifique individualmente las variables, 5 min.


Ejercicio 1.3

5 minutos para desarrollar este ejercicio, de manera individual o colectiva,


despus procedemos a comentarlos.

A- Identifique si es una variable cualitativa o cuantitativa.


1- Tiempo que toma ensamblar una pieza.
Cuant y continua
Cuant y discreta
2- Numero de trabajadores en un turno.
3- Calificacin de un poltico recin electo. (Bueno, Regular o Malo). Cual y ordinal
4- Calificacin de un examen de estadstica. Cuant y continua
5- Estado o Entidad Federativa en el que naci una persona. Cual y nomimnal
B- Identifique si es una variable continua o discreta.
d
1- Poblacin en Saltillo Coahuila.
2- Peso de aluminio reciclado. c
c
4- Tiempo de entrega
5- Numero de accidentes en el mes pasado. d
d
6- Numero de colaboradores en un equipo de trabajo
7- Produccin en kilogramo de hierro.
c
8- Produccin en numero de maquilas liberadas por calidad.

Estadsticas descriptivas
Las estadsticas descriptivas son algunas medidas numricas, que se emplean
comnmente para describir un conjunto de datos. El objetivo de las estadsticas
descriptivas es ser usadas para una inferencia estadstica, si parten de una muestra
aleatoria y representativa.

Existen dos grupos:


Medidas de tendencia central
Son las medidas con la
disposicin para agruparse en el
centro o de ciertos valores
numricos.

Medidas de variabilidad
Son las medidas con la
dispersin de las observaciones
en le conjunto.

Medidas de tendencia central

1- La media.

Esta es una medida apropiada de tendencia central apra mucho conjuntos de


datos. Sin embargo este valor puede ser afectado por la existencia de algunos
valores extremos, o comnmente llamados valores atipicos

Considere el siguiente ejemplo:


Usted quiere seleccionar materia prima, y considere dos proveedores, el proveedor A
le otorga 4 muestras del producto: 0, 25, 75, y 100.
El ultimo en llegar,,, Calcule la media en el pizarrn, aplique la formula.

Medidas de tendencia central

2- La mediana.
Es el valor para el cual, cuando todas las observaciones se ordenan de manera creciente, la mitad de estas es
menor que este valor y la otra mitad mayor.
Nota: Si el numero de observaciones es impar, la mediana es el valor de la observacin que se encuentra a la
mitad del conjunto ordenado. Si el numero es par se considera la mediana como el promedio aritmtico de
los valores de las dos observaciones que se encuentren a la mitad del conjunto ordenado.

3- La moda.
Es el valor de observacin que ocurre con mayor frecuencia en un conjunto de datos.

Considere el siguiente ejemplo:


Usted quiere seleccionar materia prima, y considere dos proveedores, el proveedor A le
otorga 4 muestras del producto: 10, 34, 56,23, 53, 45, 23, 45, 26, y 31.
La ultima persona que
paso diga un numero del 115
Calcule la media, mediana y
la moda.

Medidas de variacin
Las medidas de tendencia central proporcionan una buena informacin acerca del conjunto de
datos, pero no proporciona ninguna idea de la variabilidad. Considere el siguiente ejemplo:
Usted quiere seleccionar materia prima, y considere dos proveedores, el proveedor A le
otorga 4 muestras del producto: 0, 25, 75, y 100.Y el proveedor B, 48,49, 51 y 52.
Qu indica la Media?
No tiene significancia elegir uno u otro?

Es el promedio del cuadrado de las distancias entre cada observacin y la media del
conjunto de observaciones.

1- La varianza.

Medidas de variacin

2- La desviacin estndar.

s=

Es la raz cuadrada de la varianza.


Se refiere sobre las varianza porque se expresa en las mismas
unidades que las observaciones.

La ultima persona que paso diga un numero del 1-15


Calcule la media, mediana y la moda, la varianza y deviacin estndar usando la formula
del ejercicio pasado (A mano). Adems calcule el rango!!. Para entregar en limpio la
siguiente clase.

Usted quiere seleccionar materia prima, y considere dos proveedores, el proveedor A le otorga 4
muestras del producto: 0, 25, 75, y 100.Y el proveedor B, 48,49, 51 y 52.

3- El rango.
Es el valor mximo menos el mnimo.

FORMARTO DE
TAREAS

1
Tarea

REQUISITOS MINIMOS DE PORTADA:


-

UVM
NOMBRE
NOMBRE DE LA MATERIA
NOMBRE DEL PROFESOR
FECHA

Entregar en hojas en blanco (no de cuaderno) grapadas. Puedes usar hojas milimtricas.
Hacer la 1 tarea a mano y de manera individua!
Fecha de entrega: Lunes 30 de Junio en hasta 10 minutos despus de comenzar la clase.
En este caso no se aceptan trabajos por correo.

Ejercicios individuales
1
Tarea

Ejercicio 1.4

Realiza siguientes ejercicios de estadsticas descriptivas.


Si no se terminan se entregaran la siguiente clase como tarea.

La demanda diaria de unidades de un producto durante 30 das de trabajo es:

38
67
28
49
47

1- Ejercicio de tarea estadisticas desciptivas


35
76
58
48
63
33
69
53
25
36
32
61
78
48
42
72
66
58
44
44

59
51
57
52
56

Calcula la media, mediana, desviacin estndar, moda, empleando los datos no agrupados.

Ejercicios individuales
1
Tarea

Ejercicio 1.4

Si tienes dudas pregunta al facilitador!!

Aqu se presentan 3 conjuntos de datos, calcula la media y la desviacin estndar para


cada conjunto de datos. Qu puedes concluir?.

2- Ejercicio de tarea estadsticas descriptivas


Grupo A
1
2
3
4
5
Grupo B
1
1
1
6
6
Grupo C -13
2
3
4
5

6
6
20

Ejercicios individuales
1
Tarea

Ejercicio 1.4

Utiliza las formulas! Se calificara el procedimiento manual.

Se seleccionaron de un proceso de fabricacin aleatoriamente 20 bateras y se llevo a cabo


una prueba para determinar la duracin de estas. Los siguientes datos representan el
tiempo de duracin en horas para las 20 bateras.:
Determine la media, mediana, desviacin estndar.

3- Ejercicio de tarea estadsticas descriptivas.


52.5
62.7
58.9
65.7
49.3
58.9
57.3
60.4
59.6
58.1
62.3
64.4
52.7
54.9
48.8
56.8
53.1
58.7
61.6
63.3

Ejercicios individuales
1
Tarea

Ejercicio 1.4

Utiliza las formulas! Se calificara el procedimiento manual.

En un conjunto de nmeros cuya media es 7.31 se le aaden los nmeros 4.47 y 10.15.
Cul es la media del nuevo conjunto de nmeros?

Calcule la media y desviacin estndar de los siguientes datos: 3, 8, 4, 10, 6 y 2.


Si todos los datos anteriores los multiplicamos por 3, tendran la misma media y varianza?

Ejercicios individuales
1
Tarea

Ejercicio 1.4

Describe que tipo y subtipo de variable (Cuant, cuali, discreta, cotinua,


nominal y ordinal)
1-Comida Favorita
2- Profesin que ejerces.
3- Numero de goles anotados.
4- Numero de alumnos en LX.
5- Color de tus ojos.
6- Coeficinete intelectul de una persona
7- Puesto Conseguido en una prueba deportiva (1, 2 y 3er lugar)
8- Medalla de una prueba deportiva (oro, plata, bornce)
9- Rechazo interno en "Pasa" y " No pasa"
10- Rechazo interno interno en porcentaje defectuoso
11- Peso de las personas
12- Numero de hijos
13- Deporte preferido
14- Piezas defectuosas por estacion de trabajo

2- Inferencia estadstica.
Pruebas de hiptesis.
Universidad del Valle de Mxico

Jos Alberto Nuncio Esquivel


alberto_nuncio@yahoo.com

Hiptesis estadstica
La prueba o contraste de una hiptesis estadstica es una parte importante de
la Estadstica inferencial.
Hiptesis estadstica

Es una afirmacin con respecto a alguna caracterstica


desconocida de una poblacin de inters. Es decir
probar una hiptesis estadstica es el decidir si la
afirmacin que se propone esta apoyada por evidencia
experimental que se obtiene atreves de una muestra
aleatoria.

Pasos o Procedimiento para las


pruebas de hiptesis
Pre-Estadisticos

1- Leer el problema.
2- Determinar que tipo de prueba es. (1 muetra, 2 muestras, 2 muestras pareadas).
3- Identificar el valor objetivo o target.
Prueba estadstica

1- Establecer la hiptesis nula Ho. (Presenta la igualdad).


2- Elegir una hiptesis alterna apropiada. (3 casos).
3- Elegir el nivel de significancia alfa (0.1, 0.05 y 0.01).
4- Calcular el valor de la estadstica apropiada ( en estos casos valor T).
5- Decidir, rechazar o no rechazar Ho. (Si Pvalue es menor o igual al nivel de
significancia alfa que se elijio.
6- Concluir en trminos del ejemplo o caso real.

Ejemplo practico
Para ilustrar la importancia de este y los siguientes temas, supngase el
siguiente ejemplo:
Suponga que se tiene inters en el tiempo promedio necesario para
terminar una unidad de produccin (suponga algn producto de su
empresa) en una lnea de armado.
Bajo condiciones normales de
operacin, el objetivo o la requisicin del cliente es tener un tiempo
promedio de armado por unidad de 10 minutos.
El gerente de la planta decide continuar con el proceso, a menos que
encuentre evidencia sustancial de que el tiempo promedio no sea 10
minutos.
La evidencia se obtendr de una muestra aleatoria de tamao n
obtenida de una distribucin. Cmo debe decidirse si continua o no el
proceso de produccin?

Ejemplo practico
La respuesta a este tipo de preguntas es el principal objetivo de estos temas.
Lo mas importante en esta hiptesis es determinar si el valor de la media de la
evidencia (muestra) = .
Entonces;
- Si la afirmacin estadstica esta de acuerdo con la evidencia experimental se
sumir que el valor promedio del objetivo es de 10 minutos.
- Pero,,, si la afirmacin no esta apoyada estadsticamente por la evidencia
muestral, el gerente de la planta puede detener el proceso para llevar acabo
ajustes necesarios.

Ejemplo practico
En este ejemplo se formulan las dos hiptesis necesarias para cada prueba de
inferencia estadstica. La hiptesis nula y la hipostasis alterna.

La afirmacin de que = se llama Hiptesis nula: Ho.


La hiptesis nula Ho siempre debe considerarse como verdadera a menos que
exista suficiente evidencia en contra, siempre abarca un solo valor!

La hiptesis alterna Ha es la contradictoria a Ho.


Es recomendable establecer la Ho mas especifica que la Ha.
Estadsticamente es correcto llegar a dos conclusiones:
- Rechazar Ho.
- No rechazar Ho.
: Hiptesis nula.
: Hiptesis alterna.

Veamos algunos ejemplos prcticos.

Por qu se rechaza a Ho? Y no se rechaza a Ha?


En un proceso judicial, la hiptesis nula Ho es inocente y la hiptesis alterna
Ha es culpable, si queremos demostrar que una persona es culpable o
inocente.
Si rechazamos la Ho implicara que el juicio ha sido capaz de proporcionar
evidencia suficiente para garantizar que es culpable.
Si no rechazamos Ho, el juicio no presenta evidencia sustancial para declararlo
culpable, por lo tanto queda inocente. Sin embargo! Esta decisin no implica
necesariamente que el acusado sea inocente, mas bien quiere decir que falta
evidencia sustancial que valide que es culpable.
La razn por la cual se rechaza a Ho (culpable) y no a Ha (inocente), es porque la
decisin sobre Ho debe considerarse mas fuerte! Esto debido al principio judicial
que nos dice que es peor condenar a una persona inocente que dejar ir a una
persona culpable. Si el veredicto es culpable, se desea tener un grado muy alto
de confiabilidad de que no se va a condenar una persona inocente.

Ejemplos de Ho y Ha
Ejemplo 1.
Supngase que en la ciudad de Saltillo existen dos estaciones de televisin: el
canal 6 y el canal 10. Se piensa que para las noticias de la tarde el auditorio se
encuentra dividido en partes iguales para ambos canales. Una compaa se
interesa en probar esta teora de la proporcin de televidentes para las noticias
de la tarde. Entonces la proporcin ser de 50% o de 0.5.

Las hiptesis son:

0 : = 0.5
: 0.5
El estudio se realiza de la siguiente manera; la compaa realiza encuestas a 18
residentes seleccionados al azar y pregunta que canal prefieren ver en las noticias
de la tarde.

Casos generales de probar Ho contra Ha

Caso 1

Caso 2

Caso 3

0 : = 9
: 9

0 : = 9
: < 9

0 : = 9
: > 9

Errores en aceptar o rechazar la hiptesis nula.

Error tipo I.
Se le llama as a la hiptesis nula cuando se rechaza pero es verdadera.
Error tipo II.
Se le llama as cuando la hiptesis nula se acepta pero realmente es falsa.

Situaciones posibles al probar una hiptesis estadstica

Al probar cualquier hiptesis estadstica se pueden presentar 4 situaciones


posibles que determinan si nuestra decisin es correcta o errnea.
Situaciones posibles al probar una hiptesis
Ho es Verdadera

Ho es Falsa

Aceptamos Ho

Decisin correcta

Error tipo II

Rechazamos Ho

Error tipo I

Decisin correcta

Error tipo I. Nivel de significancia


Se le llama as a la hiptesis nula cuando se rechaza pero es verdadera.
Error tipo II. Potencia de la prueba
Se le llama as cuando la hiptesis nula se acepta pero realmente es falsa.

Bibliografa.
1- John E. Freud y Gary A. Simon, Estadistca elemental, 8va edicin, Edit. Pearson Prentice Hall.
2- Johnson Kuby, Estadistica elemental, 3 edicin, Edit. Thomson.
3- Lincoln L. Chao, Introduccin a la estadstica, Editorial Continental.
4- Mendenhall-Beaver-Beaver, Introduccion a la probabilidad y estadstica, 13 edicin, CENGAGE Learning.
5- Jos Juan Gngora Corts y Roberto Hernndez Ramrez, Estadstica descriptiva, Trillas.
6- Mario F. Triola, Estadistica, 10 ediacion, Edit. Pearson Addison Wesley.
7- Montgomery, Control estadstico de la calidad, 3 edicin, Limusa Wiley.
8- Douglas Montgomery, introduction to statistical quality control, 7 edition, Edit. Wiley.
9- Adrew Sleeper, Design for Six Sigma statistics, Edit. Mc. Graw-Hill.
10- Robert P. Neuman and Roland R. Cavanagh, The Six Sigma Way, Mc. Graw-Hill.
11- Ron S. Kenett-Shelemyahu Zacks, Estadstica Inustrial Moderna, Edit. Thomson.
12- Michael L. George, Lean Six Sigma, Mc. Graw-Hill.
13- Thomas Pyzdek, The Six Sigma Handbook, Mc. Graw-Hill.
14- Geoff Tennant, Six Sigma Edit. Gower.
15- E. L. Grant and R. S. Leavenworth, Control Estadstico de calidad, Edit. Continental.

También podría gustarte