Está en la página 1de 12

INTRODUCCIÓN A LA INVESTIGACIÓN TEST de Z

TEST Z Necesito 2 muestras. 2 grupos que pueden o no ser distintos.


Se usa para contrastar 2 muestras, cada muestra debe contener más de 30 Se utiliza para investigar por ej. Si una droga es mejor que otra o distinta
datos. para producir el mismo efecto. En este caos compararemos si es distinta.
𝑛 > 30 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 2 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
TEST de T STUDENT Grupo A Grupo B PLACEBO
EXPERIMENTAL o CONTROL
Contrastar 2 muestras con menos de 30 datos cada una
𝑛 < 30 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 2 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
TEST T PARA DATOS PAREADOS O APAREADOS.
Para un solo grupo, pero a ese grupo hay que hacerle algo antes y después
-4 -2 0 2 4 -4 -2 0 2 4
algo. Hay que someter al grupo a algo antes y después. Antes y después de
la experimentación
TEST de C H I 2 o J i2 los 2 grupos tienen la misma media, el intervalo va a ser casi el mismo. De un
Compara frecuencias de los datos, observadas, esperadas y aparecen las grupo el 95% va a tener una cantidad de arrugas y el otro va a ser igual
tablas de contingencia. antes de la experimentación. Los valores normales van a estar en el mismo
valor.
χ2

TEST CORRELACIÓN Y REGRESIÓN ¿Mi crema nueva es distinta al placebo?

Compara 2 variables q en general son numéricas continuas, pone una variable Respuesta: es dicotómica, porque puede ser o no distinta.
numérica continua y la pone en función de otra. Ej: que tiene q ver le peso con
NO es distinta: H 0: hipótesis nula
la altura, o la temperatura con la presión arterial. Para ver si hay algún tipo
de relación. Si hay asociación nos va a dar una función lineal, una recta. SI es distinta H 1 o H a: hipótesis alternativa
Comparando los grupos puedo saber cuando van a dar igual y cuando no lo media. Cuanto esta alejada la media del grupo experimental de la media del
va a hacer. grupo control en desvíos.
TEST Z Grupo B PLACEBO
Grupo A
Al grupo A lo someto a la crema y el de control a agua x ejemplo. Al mismo EXPERIMENTAL o CONTROL
tiempo x un periodo determinado. Sin informarles que producto recibieron.
Cuento las arrugas, las anoto, les saco el desvío y tengo el intervalo de
confianza para ese grupo.
𝑋̅ 𝐴 − 𝑋̅ 𝐵 -4 -2 0 2 4 -4 -2 0 2 4
𝒵=
2 2
√(𝐸𝑠𝐴 ) + (𝐸𝑠𝐵 )
NO Hipótesis nativa o nula.
𝑋̅ 𝐴 − 𝑋̅ 𝐵 𝐻0 = 𝑋 ̅𝐴 = 𝑋 ̅𝐵
𝒵=
𝑆𝐷𝐴 2 𝑆𝐷 2
SI Hipótesis alternativa, si me hubiera dado valores distintos x debajo de -2 o
√( ) + ( 𝐵) mayores a 2
√𝑛𝐴 √𝑛𝐵
̅𝐴 ≠ 𝑋
𝐻0 = 𝑋 ̅𝐵
𝑋̅ 𝐴 − 𝑋̅ 𝐵
𝒵=
2 2
√𝑆𝐷𝐴 + 𝑆𝐷𝐴
𝑁𝐴 𝑁𝐴

Z: compara las medias de cada grupo. Los desvíos y la cantidad de datos de


cada grupo- el resultado va a dar en desvíos. En términos de desvío estándar.
𝑍 = 𝑆𝐷

Siempre va a contrastar el grupo experimental con el placebo, determina cuan


desviado está el grupo experimental del grupo control, teniendo en cuenta la
Z=5,4 SD la media del experimental esta alejada del grupo placebo PASOS

Grupo B PLACEBO o CONTROL Pregunta


Planteo de hipótesis
0,05 Test conveniente, en este caso Z
P
5% 0,01 Comparo el resultado, el desvío con valores críticos de mi placebo, para saber
1% 0,001 el grado de significación
Y digo mi valor Z fue tanto, es o no significativo
1%0
Digo cual es el P, y si es mayor que o menor que
Analizar xq se alejó, si fue por asar x ejemplo. La probabilidad del valor
-6 -4 -2 0 1,72 4 5,4 6 hallado se identifica como P, es decir P es la probabilidad de que el valor
hallado en mi test, en este caso 5,4 pertenezca a la zona de igualdad.
Zona de normalidad Cuando mas me alejo mas baja va a ser la probabilidad. Porque me queda
diferencias no significativas
un 5% de probabilidades ya que la normalidad de la muestra representa el
95%, es decir 2 SD marca un límite. Ese 5% seria distinto a lo normal.
La crema es distinta xq se alejo de la zona de normalidad de los datos. Si 5,4 debería compararlo con el valor anterior, es decir que tiene menos
hubiera dado entre 2 y 4 es distinta xq se aleja de la zona de normalidad. probabilidad que 4 cuyo porcentaje es del 0,001.
1,7 sería mayor al 5%
Mientras mas me alejo de la zona es mas distinta en mayor medida, la
5,4 P ˂ 0,001
probabilidad de permanecer a la zona de normalidad es mucho menor. La
Que hipótesis se cumple, la alternativa o la nula. Pero debo decir que o se
probabilidad se aleja, el grado de diferencias
acepta la nula o se rechaza la nula. No puedo decir que se cumple la
Z= 1,7, no hay diferencia significativa, alternativa.
Se rechaza la H 0 con un Z=5,4
-2 y 2 se llaman valores críticos. La hipótesis nula se acepta cuando los valores estén dentro de la normalidad.
Z= 2,38 es una diferencia significativa P ˂ 0,05 Conclusión: respuesta a la pregunta. Las diferencias son altamente
significativas, la crema es distinta y el grado de certeza es del 99,99%, es
Z=3,15 diferencia muy significativa decir a 1 de cada 1000 personas es probable que no le haga efecto.
Z= 5,4 diferencia altamente significativa
ÁREAS BAJO LA CURVA NORMAL ESTÁNDAR desde 0 a Z
Z 0 1 2 3 4 5 6 7 8 9
0.0 0000 0040 0080 0120 0160 0199 0239 0279 0319 0359
0.1 0398 0438 0478 0517 0557 0596 0636 0675 0714 0754
0.2 0793 0832 0871 0910 0948 0987 1026 1064 1103 1141
0.3 1179 1217 1255 1293 1331 1368 1406 1443 1480 1517
0.4 1554 1591 1628 1664 1700 1736 1772 1808 1844 1879
0.5 1915 1950 1985 2019 2054 2088 2123 2157 2190 2224
0.6 2258 2291 2324 2357 2389 2422 2454 2486 2518 2549
0.7 2580 2612 2642 2673 2704 2734 2764 2794 2823 2852
0.8 2881 2910 2939 2967 2996 3023 3051 3078 3106 3133
0.9 3159 3186 3212 3239 3264 3289 3315 3340 3365 3389
1.0 3413 3438 3461 3485 3508 3531 3554 3577 3599 3621
1.1 3643 3665 3686 3708 3729 3749 3770 3790 3810 3830
1.2 3849 3869 3888 3907 3925 3944 3962 3980 3997 4015
1.3 4032 4049 4066 4082 4099 4115 4131 4147 4162 4177
1.4 4192 4207 4222 4236 4251 4265 4279 4292 4306 4319
1.5 4332 4345 4357 4370 4882 4894 4406 4418 4429 4441
1.6 4452 4463 4474 4481 4495 4505 4515 4525 4535 4545
1.7 4554 4564 4573 4582 4591 4599 4608 4616 4625 4633
1.8 4641 4649 4656 4664 4671 4678 4686 4603 4699 4706
1.9 4713 4719 4726 4732 4738 4744 4750 4756 4761 4767
2.0 4772 4778 4783 4788 4793 4798 4803 4808 4812 4817
2.1 4821 4826 4830 4834 4838 4842 4846 4850 4854 4857
2.2 4861 4864 4868 4871 4875 4878 4881 4884 4887 4890
2.3 4893 4896 4898 4901 4904 4906 4909 4911 4913 4916
2.4 4918 4920 4922 4925 4927 4929 4931 4932 4934 4936
2.5 4938 4940 4941 4943 4945 4946 4948 4949 4951 4952
2.6 4953 4955 4956 4957 4959 4960 4961 4962 4963 4964
2.7 4965 4966 4967 4968 4969 4970 4971 4972 4973 4974
2.8 4974 4975 4976 4977 4977 4978 4979 4979 4980 4981
2.9 4981 4982 4982 4983 4984 4984 4985 4985 4986 4986
3.0 4987 4987 4987 4988 4988 4989 4989 4989 4990 4990
3.1 4990 4991 4991 4991 4992 4992 4992 4992 4993 4993
3.2 4993 4993 4994 4994 4994 4994 4994 4995 4995 4995
3.3 4995 4995 4995 4996 4996 4996 4996 4996 4996 4997
3.4 4997 4997 4997 4997 4997 4997 4997 4997 4997 4998
3.5 4998 4998 4998 4998 4998 4998 4998 4998 4998 4998
3.6 4998 4998 4999 4999 4999 4999 4999 4999 4999 4999
3.7 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999
3.8 4999 4999 4999 4999 4999 4999 4999 4999 4999 4999
3.9 5000 5000 5000 5000 5000 5000 5000 5000 5000 5000
Los valores que me dio el test los tengo que comparar con los 3 valores críticos
T STUDENT que se van a relacionar con los niveles 0,05; 0,01; y del 1/1000 (0,001)
Contrastar 2 muestras con menos de 30 datos cada una Los valores determinan:
𝑛 < 30 𝑑𝑎𝑡𝑜𝑠 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 2 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 El grado de significación. Significativo, muy significativo, altamente
significativo.
P: probabilidad de q el valor hallado pertenezca a la zona de igualdad o
1° Plantear hipótesis normalidad.
2° Tomar los datos
H0 Aceptación o rechazo de la hipótesis nula (H0), es decir, el grupo experimental es
distinto al placebo xq el valor hallado da por afuera del intervalo de confianza.
Ha
Conclusión
3° Test conveniente, en este caso T
En T pasa lo mismo, pero los 3 valores los da la tabla.
̅𝐀 − 𝐗
𝐗 ̅𝐁 𝒏𝒂 + 𝒏𝒃
𝐭= 𝒙√
𝐒̂
𝐀𝐁 𝒏𝒂 + 𝒏𝒃

Desvió combinado Xa-Xb, se calcula teniendo en cuenta los desvíos de cada


grupo y los datos de cada uno. T vincula la cantidad de datos, los desvíos de
cada grupo y las medias de cada uno de los grupos, las relaciona y el resultado
va a dar en desvíos, igual que Z. esa cantidad de desvíos quiere decir cuan
desviado esta el grupo experimental del grupo placebo.

𝑆𝐷𝑎 2 𝑥(𝑛𝑎 − 1) + 𝑆𝐷𝑏 2 𝑥(𝑛𝑏 − 1)


̂
SAB = √
𝑛𝑎 + 𝑛𝑏 − 2
TABLA DE DISTRIBUCIÓN DE t Los renglones se llaman grado de libertad., la primera columna es T, y ese
n 0.05 0.02 0.01 0.001 numero se corresponde con el grado de libertad. (GL)
1 2.706 3.821 63.657 636.619
2 4.303 6.965 9.925 31.598
3 3.182 4.541 5.841 12.941 𝒏𝒂 + 𝒏𝒃 − 𝟐
4 2.776 3.747 4.604 8.610
5 2.571 3.365 4.032 6.859
6 2.447 3.143 3.707 5.959
𝐺𝐿 = 10 + 8 − 2
7 2.365 2.998 3.499 5.405 𝐺𝐿 = 16
8 2.306 2.896 3.355 5.041
9 2.262 2.821 3.250 4.781
10 2.228 2.764 3.169 4.587
11 2.201 2.718 3.106 4.437
12 2.179 2.681 3.055 4.318 Grupo A Grupo B PLACEBO
13 2.160 2.650 3.012 4.221 EXPERIMENTAL o CONTROL
14 2.145 2.624 2.977 4.140
15 2.131 2.602 2.917 4.073 0,05
16 2.120 2.583 2.921 4.015 na=10 nb=8 0,01
17 2.110 2.567 2.898 3.965
18 2.101 2.552 2.878 3.922 0,001
19 2.093 2.539 2.861 3.883 -4 -2 0 2 4
-4 -2 0 2 4
20 2.086 2.528 2.845 3.850 2,130 2,921 4,015
21 2.080 2.518 2.831 3.819
22 2.074 2.508 2.819 3.792 n 0.05 0.01 0.001
23 2.069 2.350 2.807 3.767 16 2.120 2.921 4.015
24 2.064 2.492 2.797 3.745
25 2.060 2.485 2.787 3.725
26 2.056 2.479 2.779 3.707 Ojo en el grafico hay que correr los números, porque 0,05 y 0,01 estaría n
27 2.052 2.473 2.771 3.690 entre 2 y 3 del eje X
28 2.048 2.467 2.763 3.674
29 2.045 2.462 2.756 3.659
30 2.042 2.457 2.750 3.646
40 2.021 2.423 2.704 3.551
60 2.000 2.390 2.660 3.460
120 1.980 2.58 2.617 3.373
T PARA DATOS APAREADOS O PAREADOS Reposo: frecuencia antes del ejercicio
Para un solo grupo, pero a ese grupo hay que hacerle algo antes y después algo. Una vez que tenemos los datos restamos: Después – Antes
Hay que someter al grupo a algo antes y después. Antes y después de la
experimentación. Hacer la media aritmética de las diferencias

Hay que tomarle valores antes de hacerle algo y después de hacerle algo. 𝑑̅ = 40,8
𝐝̅
La fórmula es la media aritmética de la diferencia sobre el error estándar de la 𝐭=
diferencia. 𝐄𝐒𝐃 𝐝
𝟒𝟎, 𝟖
𝐝̅ 𝐭=
𝐭= 𝐄𝐒𝐃 𝐝
𝐄𝐒𝐃 𝐝

SD
ESD =
√𝑛 n=5 0,05
Ejemplo: ¿la frecuencia cardiaca aumenta con el ejercicio? Normal
0,01
0,001
H0 = No aumenta
Ha = Si Aumenta -4 -2 0 2 4
2.776 4.604 8.610

Después Antes Los valores se buscan en la tabla de T, luego de buscar los grados de libertad
Ejercicio Reposo Diferencia
108 68 40 𝐠𝐋 = 𝐧 − 𝟏
110 77 33
122 82 40 n 0.05 0.01 0.001
130 90 40 4 2.776 4.604 8.610
130 79 51 Esos valores los comparo con el valor de t hallado
204 Terminar de resolver
TABLA JI CUADRADA / CHI CUADRADA /X2
Grados de 0.1 0.05 0.025 0.01 0.005
libertad
1 2.71 3.84 5.02 6.63 7.88
2 4.61 5.99 7.38 9.21 10.60
3 6.25 7.81 9.35 11.34 12.84
4 7.78 9.49 11.14 13.28 14.86
5 9.24 11.07 12.83 15.09 16.75
6 10.64 12.59 14.45 16.81 18.55
7 12.02 14.07 16.01 18.48 20.28
8 13.36 15.51 17.53 20.09 21.95
9 14.68 16.92 19.02 21.67 23.59
10 15.99 18.31 20.48 23.21 25.19
11 17.28 19.68 21.92 24.73 26.76
12 18.55 21.03 23.34 26.22 28.30
13 19.81 22.36 24.74 27.69 29.82
14 21.06 23.68 26.12 29.14 31.32
15 22.31 25.00 27.49 30.58 32.80
16 23.54 26.30 28.85 32.00 34.27
17 24.77 27.59 30.19 33.41 35.72
18 25.99 28.87 31.53 34.81 37.16
19 27.20 30.14 32.85 36.19 38.58
20 28.41 31.41 34.17 37.57 40.00
21 29.62 32.67 35.48 38.93 41.40
22 30.81 33.92 36.78 40.29 42.80
23 32.01 35.17 38.08 41.64 44.18
24 33.20 36.42 39.36 42.98 45.56
25 34.38 37.65 40.65 44.31 46.93
26 35.56 38.89 41.92 45.64 48.29
27 36.74 40.11 43.19 46.96 49.65
28 37.92 41.34 44.46 48.28 50.99
29 39.09 42.56 45.72 49.59 52.34
30 40.26 43.77 46.98 50.89 53.67
40 51.81 55.76 59.34 63.69 66.77
50 63.17 67.50 71.42 76.15 79.49
60 74.40 79.08 83.30 88.38 91.95
70 85.53 90.53 95.02 100.43 104.21
80 96.58 101.88 106.63 112.33 116.32
90 107.57 113.15 118.14 124.12 128.30
100 118.50 124.34 129.56 135.81 140.17
TEST de C H I 2 o J i2 Tabla de contingencia de 2 x 2
CHI CUADRADO Ejemplo prueba de antibióticos
Compara frecuencias de los datos, observadas, esperadas y aparecen las Mejoraron No mejoraron Total
tablas de contingencia. pacientes
Vincula frecuencias de aparición de datos, A 36 𝑓0 9 𝑓0 45 Marginal
45𝑥109 45𝑥29
𝑓𝑒 = = 35,54 𝑓𝑒 = = 9,456
Sumatoria de las frecuencias observadas, menos las frecuencias esperadas, esa 138 138
diferencia al cuadrado y luego dividirlas x la frecuencia esperada. B 73 𝑓0 20 𝑓0 93 Marginal
93𝑥109 93𝑥29
𝑓𝑒 = = 73,456 𝑓𝑒 = = 19,543
138 138
109 29 138 Total
(𝒇𝟎 − 𝒇𝒆)𝟐
𝛘𝟐 = ∑ general
𝒇𝒆
Marginal Marginal
Ejemplo de Laplace: para calcular probabilidad
Si tiro 6 veces un dado, Probabilidad de sacar si se cumple a raja tabla seria Los subtotales se llaman marginales.
así. Probabilidad teórica vs probabilidad experimental
Observar que la tabla tiene sumatorias, con lo cual si faltan datos podría
Teórica Experimentación calcularlos.
1 1 2 0
2 1 2 1 ¿Hay diferencia de aparición de datos entre los antibióticos probados A y B?
3 1 2 2 FRECUENCIA ESPERADA: se calcula como el producto de los marginales, dividido
4 1 2 0 el total general.
5 1 2 2
6 1 2 7 Cuando tengo las 2 frecuencias voy a la formula. Y después sumo todo y eso
6 tiros 12 tiros 12 tiros será el Chi cuadrado.
(𝑓0 − 𝑓𝑒)2
χ2 = ∑ +
𝑓𝑒
En la tabla se demuestra que se va mucho lo observado, que es lo experimental,
de lo esperado, que es lo teórico, y que podría haber una causa x lo cual el 6 se (𝑓0 − 𝑓𝑒)2

aleja tanto de lo esperado en teoría. 𝑓𝑒
Grados de libertad para chi cuadrado CORRELACIÓN Y REGRESIÓN
𝐠𝐋 = (𝐍°𝐟𝐢𝐥𝐚 − 𝟏)𝒙(𝐍°𝐜𝐨𝐥 − 𝟏) Compara 2 variables q en general son numéricas continuas, pone una variable
numérica continua y la pone en función de otra. Ej: que tiene q ver le peso con
gL = (2 − 1)𝑥(2 − 1) la altura, o la temperatura con la presión arterial. Para ver si hay algún tipo
gL = 1𝑥1 de relación. Si hay asociación nos va a dar una función lineal, una recta.

gL = 1 buscar en la tabla para ver si hay diferencia significativa Vincula 2 variables que en general son cuantitativas continuas. Cada una
puede estar en un eje determinado. X, Y. Ej: peso, altura, presión, temperatura.
Grados de libertad 0.05 0.01 0.005
Que tiene que ver la presión con la altura: tomo un paciente mido la altura y
1 3.84 6.63 7.88 le mido la presión
Diagrama de dispersión

Y Pr Valores Y
142
140
138
136
134
132
130
128
0 0,5 1 1,5 2 2,5
X
Buscar el grado de asociación que pueden tener, la idea es buscar una función Suponiendo que tomamos los otros datos y nos da una recta
lineal,
Valores Y
Función lineal: necesito 2 puntos y ahí trazo una recta. Tengo la pendiente y
5
la ordenada al origen.
4,5
𝒚 = 𝒂𝒙 + 𝒃 4
3,5
a= 3
2,5
𝒏 ∑ 𝒙𝒚 − ∑𝒙∑𝒚 2
𝒂=
𝒏 ∑𝒙 𝟐 − (∑𝒙)𝟐 1,5
1
∑𝒚 − 𝒂∑𝒙 0,5
𝒃= 0
𝒏 0 1 2 3 4 5
De acuerdo a los valores encontrados puedo tener una recta de regresión, y en
la recta pueden pasar varias cosas. Si me da así y hago mi formula de correlación me voy a dar cuenta que el valor
Índice de correlación de Spearman que toma va a ser 1, porque la asociación de variables diría que es perfecta. Y
al ser perfecta dan todos los valores dentro de esa recta.
Este índice puede dar entre cero y 1. Y también puede ser entre cero y -1
-1 o 1, porque puede ser que la recta sea descendente o ascendente. Entonces si
̅) (𝒚 − 𝒚
∑(𝒙 − 𝒙 ̅)
𝚪= es una recta ascendente según el índice de spearman los valores estarán entre 0
̅)𝟐 √(𝒚 − 𝒚
√(𝒙 − 𝒙 ̅)𝟐 y 1, descendente entre -1 y 0.
Va a ser 1 cuando esos puntos me den dentro de esa recta.
Puntos fuera de la recta no coinciden, están mas dispersos de ese valor, al haber 𝑍 = Γ𝑥√𝑛
un poco más de dispersión los valores ya no son 1, pueden ser 0,98; 0,95; 0,96 y
Esta formula da la cantidad de desvíos y puedo averiguar si está muy lejos de
esos valores van bajando a medida que se encuentren mas dispersos a la recta
la normalidad. Si tomamos z y tiene mas de 3 desvíos el grado de significación
que encontré.
altamente significativo, etc. cuando hay un grado de significación muy
5 marcado el Z es cada vez más lejano.
4
Si hay mucha asociación significa que es probable que eso se halla dado por
3 una causa, hay grandes probabilidades de que se alago con mucha asociación,
2 mucha asociación de esa variable, pero no se está demostrando con esto. Si los
1
puntos se dispersan Z disminuye. Va a tender a ser cero, el valor de “r” va a
tender a ser cero. No hay asociación de variables o es muy poquita.
0
0 1 2 3 4 5

Entonces va a tener a ser cero cuando no pueda encontrar en mis valores una
recta. Va a haber un cumulo de puntos.
Apunte de Sade, hay una parte donde muestra las asociaciones: perfectas, muy
buenas, buenas, regulares, malas. Malas: como que no hay asociación de
variables.
Asociación perfecta: línea de puntos dentro de la recta
Suponiendo que da en la recta o no, a medida que aumenta la variable altura,
la presión también aumenta. Cuando una variable es proporcional a la otra se
demuestra q hay asociación de variables muy marcada, el índice de spearman
va a tener a ser 1, pero no se esta demostrando CAUSALIDAD. Lo q se esta
diciendo es que es ASOCIACIÓN, q puede ser en mayor o menor medida ese
grado de asociación. No puedo decir que la presión es mas alta porque el
individuo es más alto, NO se demuestra CAUSA, se demuestra la asociación que
hay.

También podría gustarte