Está en la página 1de 11

Prueba de hipótesis y

Data Science
Subtítulo
Prueba de hipótesis
›  una regla que sirve para aceptar o rechazar la información de
Es
una población con respecto a la muestra tomada y funciona
para tomar una decisión basado en esta prueba. Analiza dos
hipótesis:
Alternativa ()
La mayoría de las veces representa la teoría que debe probarse.
Nula ()
Se opone a la hipótesis a la hipótesis alternativa.
Al rechazar esta hipótesis puede conducir aceptar la hipótesis
alternativa.
Tipo de prueba de hipótesis
› 
Prueba de una cola
Es donde la hipótesis alternativa es unilateral

Prueba de dos colas


Es donde la hipótesis alternativa es bilateral
Significancia
Es denotado como Alpha, es la probabilidad de rechazar la
hipótesis nula siendo verdadera. Por lo tanto, es un riesgo
tipo I y se desea que sea lo menor posible. La significancia
se relaciona con el valor P. Ya que, si el valor P es menor
que la significancia se puede rechazar la hipótesis nula. La
significancia por lo general es menor a 0.1.
Ejemplo
Una muestra aleatoria de 150 muertes registradas en Rusia
el año pasado mostró una vida promedio de 73 años.
Suponiendo una desviación estándar poblacional de 9
años, ¿esto parece indicar que la vida media actual es
mayor que 71 años? Utilice un nivel de significancia de
0.05.
Pasos para solución
› 
1. Determinar la hipótesis nula

› 2. Determinar la hipótesis alternativa

› 3. Establecer la significancia
›  Buscar la región
4.
n 150
significancia 0,05

media muestral 73
desviación 9

2,72
›5.  Calcular el valor P

6. Decidir si rechaza o no la hipótesis nula


Se rechaza la hipótesis nula porque el valor P es menor
que la significancia. Por lo tanto, se esta a favor de la
hipótesis de que la media actual es mayor a 71 años.
Data Science
Van Der Aalst (2016) afirman que:
“Surgió como una disciplina nueva e importante. Puede
verse como una fusión de disciplinas clásicas como
estadísticas, minería de datos, bases de datos y sistemas
distribuidos. Los enfoques existentes deben combinarse
para convertir la abundante información disponible en
valor para las personas, las organizaciones y la sociedad.”
Machine Learning
Russo y et al. (2016) afirma que:
“es un área de la inteligencia artificial que engloba un
conjunto de técnicas que hacen posible el aprendizaje
automático a través del entrenamiento con grandes
volúmenes de datos.”
Por otro lado, machine learning se ha utilizado en diversas
tareas como el reconocer un objeto en una imagen, esta
tarea la realiza mejor que un ser humano (Russo y et al.,
2016)
1. Van Der Aalst, W. (2016). Data science in action. In Process
mining (pp. 3-23). Springer, Berlin, Heidelberg.
2. Russo, C., Ramón, H. D., Alonso, N., Cicerchia, L. B.,
Esnaola, L., & Tessore, J. P. (2016). Tratamiento masivo de
REFERENCIAS datos utilizando técnicas de Machine Learning. In XVIII
Workshop de Investigadores en Ciencias de la Computación
(Entre Ríos, Argentina).

También podría gustarte