Está en la página 1de 22

"Año de la lucha contra la corrupción e impunidad"¨

UNIVERSIDAD PERUANA LOS ANDES


FACULTAD DE CIENCIAS DE LA SALUD

ESCUELA PROFESIONAL DE PSICOLOGIA

ASIGNATURA :
ESTADÍSTICA

TEMA:
“LA PRUEBA DE HIPOTESIS; PRUEBA DE HIPOTESIS CON T-STUDENT Y PRUEBA DE
HIPOTESIS CON CHI –CUADRADA, TIPOS DE MUESTREO”
DOCENTE: Lic. CASTRO ARROLLO Ulises
ESTUDIANTE:
SALVADOR VILCHEZ Joel Iván
PIAVIZAN CHAVEZ Priscila
VARGAS PACO Karen

CICLO: III

HYO-PERU

2019
DEDICATORIA

A Dios. Por este maravilloso espacio a pesar


de conocer íntegramente nuestra naturaleza
imperfecta nunca nos ha dejado, siempre nos
ha permitido llegar a un buen puerto y con
mucho decoro con bondad y amor.

Los Autores.
INTRODUCCION

Al realizar la investigación, casi nunca es posible estudiar a toda la población que te


interesa. Esta es la razón por la que los investigadores utilizan diversos tipos de
muestreo cuando pretenden recopilar datos y responder las preguntas de
investigación.

Una muestra es un subconjunto de la población que está siendo estudiada. Representa


la mayor población y se utiliza para sacar conclusiones de esa población. Es una técnica
de investigación ampliamente utilizada en las ciencias sociales como una manera de
recopilar información sin tener que medir a toda la población.
En estadística, el concepto “muestra” se utiliza para denominar a cualquier subconjunto
posible de una población determinada. Así, cuando se habla de una muestra se está
haciendo referencia a un conjunto determinado de sujetos que parten de un grupo más
grande (la población).

La estadística inferencial es la rama de esta disciplina que se ocupa de estudiar muestras


para llevar a cabo inferencias en relación a las poblaciones de las que estas parten. Se
opone a la estadística descriptiva, cuya tarea consiste, como su nombre indica, en
describir de forma detallada las características de la muestra, y por tanto idealmente
de la población.

No obstante, el proceso de inferencia estadística requiere que la muestra en cuestión


sea representativa de la población de referencia por tal de que sea posible generalizar
las conclusiones obtenidas a pequeña escala. Con el objetivo de favorecer esta tarea se
han desarrollado diversas técnicas de muestreo, es decir, de obtención o selección de
muestras.
INDICE

PORTADA i
DEDICATORIA ii
INTRODUCCION iii

I. CAPITULO
1. LA PRUEBA DE HIPOTESIS
1.1. Definición de la Prueba de Hipótesis 5
1.2. Definición de Estadístico de prueba: 6

II. CAPITULO
2. PRUEBA DE HIPOTESIS CON T-STUDENT 7
2.1. Metodología de la t-Student 7
2.2. Características de la distribución t 8

III. Capitulo
3. PRUEBA DE HIPOTESIS CON CHI –CUADRADA
3.1 Definición de Hipótesis con CHI –Cuadrada 15
3.2 Características 16

IV. Capitulo
4. MUESTREO 17
4.1 El muestreo en la estadística inferencial 17
4.2 Tipos de Muestreo 18

Conclusiones 21

Referencias bibliográficas 22
LA PRUEBA DE HIPOTESIS; PRUEBA DE HIPOTESIS CON T-STUDENT Y PRUEBA DE
HIPOTESIS CON CHI –CUADRADA, TIPOS DE MUESTREO.

PRUEBA DE HIPÓTESIS

¿Qué es una Hipótesis?


Hipótesis: Es una suposición acerca del valor de un parámetro de una población con
el propósito de discutir su validez.
Ejemplo de hipótesis acerca de un parámetro de una población son:
- El sueldo promedio de un profesional asciende a $2,625.
- El veinte por ciento de los consumidores utiliza aceite de oliva
¿Qué es una prueba de hipótesis?
Prueba de hipótesis: es un procedimiento, basado en la evidencia de la muestra y en
la teoría de las probabilidades, usado para determinar si la hipótesis es una afirmación
razonable y debería no ser rechazada o si no es razonable debería ser rechazada
Prueba de Hipótesis
Paso 1: Establecer la hipótesis nula y la alternativa

Paso 2: Seleccionar el nivel de significación

Paso 3: Identificar el estadístico de prueba

Paso 4: Formular una regla de decisión

Paso 5: Tomar una muestra, llegar a una decisión
↓ ↓
No realizar la hipótesis Rechazar la nula y aceptar la alternativa

Definiciones

Hipótesis nula H0: Una afirmación acerca del valor de un parámetro de la población.
Hipótesis Alternativa H1: Una afirmación que es aceptada si la muestra provee la
evidencia de que la hipótesis nula es falsa.
Nivel de significación: La probabilidad de rechazar la hipótesis nula cuando en realidad
es verdadera.
Error tipo I: Rechazar la nula cuando en realidad es verdadera.
Error tipo II: Aceptar la hipótesis nula cuando en realidad es falsa.

Estadístico de prueba:
Es un valor, determinado a partir de la información de la muestra, usado para decidir
si rechazar o no la hipótesis nula.
Valor crítico: El punto que divide la región entre el lugar en el que la hipótesis nula es
rechazada y la región donde la hipótesis nula es no rechazada.

Hipótesis nula unilateral a derecha


Distribución de muestreo para la estadística z
Una cola - nivel de significación 0.05

Hipótesis nula bilateral


Distribución de muestreo para la estadística z
A dos colas - nivel de significación 0,05
Prueba de hipótesis para la media de una Población, muestras grandes desviación
estándar población conocida
Cuando se plantean hipótesis par la media de la población, a partir de muestras
grandes y la desviación estándar poblacional es conocida, el estadístico de prueba está
dado por:
z = (X - μ)/(σ/√n)

PRUEBA DE HIPOTESIS CON T-STUDENT

La prueba t-Student se fundamenta en dos premisas; la primera: en la distribución de


normalidad, y la segunda: en que las muestras sean independientes. Permite comparar
muestras, N ≤ 30 y/o establece la diferencia entre las medias de las muestras. El análisis
matemático y estadístico de la prueba con frecuencia se minimiza para N > 30,
utilizando pruebas no paramétricas, cuando la prueba tiene suficiente poder
estadístico.

Metodología de la t-Student
1. Probar que cada una de las muestras tiene una distribución normal.
2. Obtener para cada una de las muestras: a) el tamaño de las muestras (n1 y n2), b) sus
respectivas medias (m1 y m2), c) sus varianzas (v1 y v2).
3. Probar que las varianzas sean homogéneas;
4. En caso de homogeneidad en esas varianzas:
a) establecer la diferencia entre las medias: m1-m2.
b) calcular la varianza común de las dos muestras.

vc = ((n1-1)v1 + (n2-1)v2)/(n1 + n2 - 2)

Es decir, la varianza común (vc) es igual a un promedio pesado de las varianzas de las
dos muestras en donde los pesos para ese promedio son iguales al tamaño, menos uno
(n-1) para cada una de las muestras, c) con esa varianza común, se calcula el error
estándar de la diferencia de las medias ESM= √ ((vc) (n1 + n2)/(n1n2)); 5. Finalmente, la
t-Student es igual al cociente de la diferencia de medias entre el ESM anterior; 6. De
acuerdo con nuestra hipótesis nula y alterna se debe demostrar que existe diferencia
entre las medias de las muestras, se consulta una tabla de t-Student con grado de
libertad igual a n1 + n2-2 y se calcula el valor de P.5

Características de la distribución t-Student


Tiene las siguientes propiedades:
- Es continua, campanular, y simétrica como la distribución z.
- Existe una familia de distribuciones t con media cero, pero con diferentes
desviaciones estándar.
- La distribución t es más aplanada y de colas más larga que la z.
- Tiende a la z para tamaños grandes de muestra.

Caso 1: Prueba de hipótesis para la media de una Población


Supongamos que una máquina empacadora de harina produce bolsas con un contenido
de 50 kg. Para controlar el funcionamiento de la máquina se tomó una muestra de 20
bolsas de harina y el peso medio resultó ser de 42 kg. con un desvío standard de 11 kgs.
¿Está la máquina trabajando correctamente? (α = 0.10)
En este caso, se debe considerar que la máquina está trabajando correctamente si
produce empaques que no excedan demasiado el peso promedio, ni por encima ni por
debajo de 50 kgs, así que se trata claramente de una prueba bilateral.

Caso 1: Prueba de hipótesis para la media de una población, tamaño muestral


pequeño y desviación estándar desconocida.
La estadística para el caso de una sola muestra es:
t = (X - μ)/(s/√n)
Resolución
Hipótesis. H0: μ = 50; H1: μ ≠ 50.
Nivel de significación. α = 0.10.
Estadística de prueba.
tn - 1 = (X - μ)/(sn - 1/√n)
Región crítica. Puesto que P(t19 < -1.729 ∪ t19 > +1.729) = 0.10, se rechazará H0 si t < -
1.729 ó t > +1.729.
Cálculos. n = 20, = 42, = 5 y
t19 = (42 - 50)/(11/√20) = -8/2,460 = - 3,25
Decisión. Dado que el valor del estadístico de prueba cae netamente en la región
crítica izquierda, H0 es rechazada a favor de H1.
Valor P
• Valor p: probabilidad de observar un valor de prueba más extremo que el valor
observado, dado que la hipótesis es nula es verdadera.
• Si el valor p es más chico que el nivel de significación la hipótesis nula es rechazada.
• Si el valor p es más grande que el nivel de significación la hipótesis nula no es
rechazada.
Prueba de hipótesis para dos medias
• Si un número grande de muestras aleatorias e independientes de dos poblaciones
normales es seleccionado, la distribución de la diferencia entre las medias de ambas
también es normal.


Caso 2: Prueba de diferencia entre medias con muestras independientes
Un investigador estaba interesado en comparar el efecto de 2 hormonas (A y B) de
crecimiento sobre la longitud total alcanzada por una leguminosa. Para ello se tomó
una muestra de 20 plantas, asignando al azar 10 a cada hormona. Los resultados en cm.
fueron los siguientes:
Hormona A: 10 10 13 12 10 8 12 11 16 15
Hormona B: 15 11 16 17 18 9 14 12 15 16
a) Determinar si hay diferencias significativas entre los crecimientos producidos por
ambas hormonas a un nivel del 5%.
b) Realizar el mismo análisis que en a), pero suponiendo que cada una de las parejas,
en el orden dado, tienen la misma ascendencia genética.

Resolución
Prueba t para dos muestras suponiendo varianzas iguales

Caso 3: Muestras relacionadas


En un estudio para predecir a partir del perímetro torácico el peso de novillos de raza
británica sin balanza, se compararon las evaluaciones hechas mediante una cinta
métrica de origen norteamericano con los obtenidos mediante el pesado por método
nacional. Las observaciones para cada animal fueron las siguientes:
Novillo Peso por método Peso por método
nacional norteamericano

1 335 347

2 362 359

3 338 359

4 329 334

5 333 341

6 371 391

7 356 334

8 341 341

9 334 347

10 335 314

a) ¿Qué tipo de análisis sería correcto realizar? ¿Por qué? ¿Por qué cree que el
experimento se diseñó de esa manera? ¿Cómo se debería haber hecho el experimento
para que lo correcto fuera otro análisis?
b) ¿Cuáles son las hipótesis que se postulan? ¿Qué significa cada una de ellas?
c) Utilizando un nivel de significación del 5%, ¿cuál es la región de rechazo para el
estadístico de prueba?
d) ¿A qué conclusión se llega? ¿En qué se basa dicha conclusión?
e) ¿Qué error se puede estar cometiendo al arribar a la conclusión anterior? ¿En qué
consiste dicho error en términos de este problema?
f) Construya un intervalo del 95% de confianza para estimar la diferencia promedio
entre los dos preparados.
g) ¿Era de esperar que el intervalo cubriera o no el valor 0? ¿Por qué?
Prueba t para medias de dos muestras emparejadas

Prueba t para dos muestras suponiendo varianzas iguales

Prueba t para dos muestras suponiendo varianzas desiguales


Prueba z para medias de dos muestras

Análisis de variancia - Caso de una sola variable. Varias Muestras


Una compañía de alimentos envasados desea probar 4 nuevos diseños de empaques
para un nuevo cereal para desayunos. Se seleccionaron 10 negocios con igual volumen
de ventas como unidades experimentales. A cada negocio se le consignó al azar un
diseño de empaque. Tres diseños de empaques se asignaron al azar a 3 negocios y el
otro diseño fue asignado a dos negocios. Todas las otras condiciones ajenas al
empaque, como precio, cantidad de estantes y localización de los mismos y esfuerzos
especiales de promoción, se mantuvieron constantes (homogéneos) para todos los
negocios del experimento. Las ventas, según número de casos, fueron registradas para
el período de estudio y los resultados se presentan en la siguiente tabla:
Número de ventas por negocio para cada uno de los 4 diseños
Diseño de empaques Negocios, repetición Total N° de negocios Media

1 2 3

1 12 18 3 33 3 11

2 14 12 13 39 3 13

3 19 17 21 57 3 19

4 24 30 24 78 3 26

Total 207 12 17,25


Análisis de varianza de un factor
RESUMEN
Grupos Cuenta Suma Promedio Varianza

1 3 33 11 57
2 3 39 13 1
3 3 57 19 4
4 3 78 26 12

PRUEBA DE HIPOTESIS CON CHI –CUADRADA

Esta prueba puede utilizarse incluso con datos medibles en una escala nominal. La
hipótesis nula de la prueba Chi-cuadrado postula una distribución de probabilidad
totalmente especificada como el modelo matemático de la población que ha generado
la muestra.

Para realizar este contraste se disponen los datos en una tabla de frecuencias. Para cada
valor o intervalo de valores se indica la frecuencia absoluta observada o empírica (Oi). A
continuación, y suponiendo que la hipótesis nula es cierta, se calculan para cada valor o
intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia esperada
(Ei=n·pi , donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o
intervalo de valores según la hipótesis nula).

El estadístico de prueba se basa en las diferencias entre la Oi y Ei y se define como:

Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es
suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5.
En la práctica se tolera un máximo del 20% de frecuencias inferiores a 5.

Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el


estadístico tomará un valor igual a 0; por el contrario, si existe una grande discrepancia
entre estas frecuencias el estadístico tomará un valor grande y, en consecuencia, se
rechazará la hipótesis nula. Así pues, la región crítica estará situada en el extremo
superior de la distribución Chi-cuadrado con k-1 grados de libertad.

Para realizar un contraste Chi-cuadrado la secuencia es:

Analizar: Pruebas no paramétricas

Chi-cuadrado
En el cuadro de diálogo Prueba chi-cuadrado se indica la variable a analizar en Contrastar
variables.

En Valores esperados se debe especificar la distribución teórica activando una de las dos
alternativas. Por defecto está activada Todas las categorías iguales que recoge la
hipótesis de que la distribución de la población es uniforme discreto. La opción Valores
requiere especificar uno a uno los valores esperados de las frecuencias relativas o
absolutas correspondientes a cada categoría, introduciéndolos en el mismo orden en el
que se han definido las categorías.

El recuadro Rango esperado presenta dos opciones: por defecto está activada Obtener
de los datos que realiza el análisis para todas las categorías o valores de la variable; la
otra alternativa, Usar rango especificado, realiza el análisis sólo para un deteminado
rango de valores cuyos límites Inferior y Superior se deben especificar en los recuadros
de texto correspondientes.

El cuadro de diálogo al que se accede con el botón Opciones ofrece la posibilidad de


calcular los Estadísticos Descriptivos y/o los Cuartiles, así como seleccionar la forma en
que se desea tratar los valores perdidos.

MUESTREO

Llamamos “muestreo” a los procedimientos estadísticos que se utilizan para seleccionar


muestras que resulten representativas de la población a la que pertenecen, y que
constituye el objeto de estudio de una investigación determinada.

El muestreo en la estadística inferencial

En estadística, el concepto “muestra” se utiliza para denominar a cualquier subconjunto


posible de una población determinada. Así, cuando se habla de una muestra se está
haciendo referencia a un conjunto determinado de sujetos que parten de un grupo más
grande (la población).

La estadística inferencial es la rama de esta disciplina que se ocupa de estudiar muestras


para llevar a cabo inferencias en relación a las poblaciones de las que estas parten. Se
opone a la estadística descriptiva, cuya tarea consiste, como su nombre indica, en
describir de forma detallada las características de la muestra, y por tanto idealmente de
la población.

No obstante, el proceso de inferencia estadística requiere que la muestra en cuestión


sea representativa de la población de referencia por tal de que sea posible generalizar
las conclusiones obtenidas a pequeña escala. Con el objetivo de favorecer esta tarea se
han desarrollado diversas técnicas de muestreo, es decir, de obtención o selección de
muestras.

Existen dos tipos principales de muestreo: el aleatorio o probabilístico y el no aleatorio,


también conocido como “no probabilístico”. A su vez cada una de estas dos grandes
categorías incluye diversas clases de muestreo que se distinguen en función de factores
como las características de la población de referencia o las técnicas de selección
empleadas.

Tipos de muestreo aleatorio o probabilístico:

Hablamos de muestreo aleatorio en los casos en que todos los sujetos que forman parte
de una población tienen la misma probabilidad de ser escogidos como parte de la
muestra. Los muestreos de esta clase son más populares y útiles que los no aleatorios,
principalmente porque tienen una elevada representatividad y permiten calcular el
error de la muestra.

1. Muestreo aleatorio simple


En este tipo de muestreo las variables relevantes de la muestra tienen la misma función
de probabilidad y son independientes entre ellas. La población tiene que ser infinita o
bien finita con reposición de elementos. El muestreo aleatorio simple es el que más se
utiliza en la estadística inferencial, pero es menos eficaz en muestras muy grandes.

2. Estratificado

El muestreo aleatorio estratificado consiste en dividir la población en estratos; un


ejemplo de esto sería estudiar la relación entre el grado de satisfacción vital y el nivel
socioeconómico. A continuación, se extrae un número determinado de sujetos de cada
uno de los estratos por tal de mantener la proporción de la población de referencia.

3. De conglomerados

En estadística inferencial los conglomerados son conjuntos de elementos poblacionales,


como pueden ser las escuelas o los centros hospitalarios públicos de un municipio. Al
llevar a cabo este tipo de muestreo se divide la población (en los ejemplos, una localidad
concreta) en varios conglomerados y se elige de forma aleatoria algunos de ellos para
estudiarlos.

4. Sistemático

En este caso se empieza dividiendo el número total de sujetos u observaciones que


conforman la población entre el que se quiere utilizar para la muestra. Posteriormente
se escoge un número al azar de entre los primeros y se va sumando de forma constante
este mismo valor; los elementos seleccionados pasarán a formar parte de la muestra.

Muestreos no aleatorios o no probabilísticos

Los muestreos no probabilísticos utilizan criterios con un bajo nivel de sistematización


que procuran asegurar que la muestra tenga un cierto grado de representatividad. Este
tipo de muestreos se emplean principalmente cuando no es posible llevar a cabo otros
de tipo aleatorio, lo cual es muy habitual a causa del elevado coste de los
procedimientos de control.

1. Intencional, opinático o de conveniencia

En el muestreo intencional el investigador escoge de forma voluntaria los elementos que


conformarán la muestra, dando por supuesto que esta será representativa de la
población de referencia. Un ejemplo que resultará familiar a los estudiantes de
psicología es la utilización de alumnos como muestra opinática por parte de profesores
universitarios.

2. Muestreo de bola de nieve o en cadena

En este tipo de muestreo los investigadores establecen contacto con sujetos


determinados; a continuación, estos consiguen a nuevos participantes para la muestra
hasta completarla. El muestreo de bola de nieve se usa generalmente cuando se trabaja
con poblaciones de difícil acceso, como en el caso de adictos a sustancias o de miembros
de culturas minoritarias.

3. Muestreo por cuotas o accidental

Hablamos de muestreo por cuotas cuando los investigadores escogen un número


concreto de sujetos que cumplan unas características determinadas (p. e. mujeres
españolas de más de 65 años con deterioro cognitivo severo) a partir de su conocimiento
sobre los estratos de la población. El muestreo accidental se usa con frecuencia en las
encuestas.
CONCLUSIONES

1. La t-Student es una prueba poderosa, en la que, aunque una de las muestras no tenga
distribución normal pero la otra sí y la razón de la varianza más grande a la más pequeña
sea < 2, esta prueba resulta adecuada al comparar dos medias. Es necesario mencionar
que la distribución t-test es similar a la distribución de Gauss cuando las muestras > 30.
El poder estadístico tiene mayor magnitud cuando las condiciones que se necesitan lo
cumplen ambas muestras, independientemente del tamaño. La prueba original
demostró que existe una curva que describe el comportamiento de la diferencia de
medias y permite calcular el área bajo la curva que representa la probabilidad de la
diferencia entre ellas.

2. El estadístico ji-cuadrado (o Chi cuadrado), que tiene distribución de probabilidad del


mismo nombre, sirve para someter a prueba hipótesis referidas a distribuciones de
frecuencias. En términos generales, esta prueba contrasta frecuencias observadas con
las frecuencias esperadas de acuerdo con la hipótesis nula. En este artículo se describe
el uso del estadístico ji-cuadrado para probar la asociación entre dos variables utilizando
una situación hipotética y datos simulados. Luego se describe su uso para evaluar cuán
buena puede resultar una distribución teórica, cuando pretende representar la
distribución real de los datos de una muestra determinada. A esto se le llama evaluar la
bondad de un ajuste. Probar la bondad de un ajuste es ver en qué medida se ajustan los
datos observados a una distribución teórica o esperada. Para esto, se utiliza una segunda
situación hipotética y datos simulados.

3. Del mismo modo que los estadísticos “z”, con su distribución normal y “t”, con su
distribución t de Student, nos han servido para someter a prueba hipótesis que
involucran a promedios y porcentajes, el estadístico ji-cuadrado (o chi cuadrado), que
tiene distribución de probabilidad del mismo nombre, nos servirá para someter a prueba
hipótesis referidas a distribuciones de frecuencias. En primer lugar usaremos el
estadístico ji-cuadrado para probar la asociación entre dos variables, y luego lo
usaremos para evaluar en qué medida se ajusta la distribución de frecuencias obtenida
con los datos de una muestra, a una distribución teórica o esperada.
REFERENCIAS BIBLIOGRAFICAS

1. By Student. The probable error of a mean. Biometrika. 1908; 6: 1-25.

2. Fagerland MW. t-tests, non-parametric tests, and large studies-a paradox of statistical
practice? BMC Med Res Methodol. 2012; 12: 78-85.

3. Dawson-Saunders B, Trapp Robert G. Bioestadística Médica. Editorial Manual


Moderno, 1993.

4. Wayne W. Daniel. Bioestadística base para el análisis de las ciencias de la salud. 4ª ed.
México, Limusa Wiley. 2002.

5. Zar Jerrold H. Biostatistical analysis. Prentice Hall. Inc. Fifth edition. New York, USA,
Prentice Hall, 2010.

6. Satterthwaite FE. An approximate distribution of estimates of variance components.


Biometrics Bul. 1946; 2: 110-114.

7. Welch BL. Generalization of "student's" problem when several different population


variances are involved. Biometrika. 1947; 34: 28-35.

También podría gustarte