Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TRABAJO DE INVESTIGACION
ESTADÍSTICA II
Profesor: Estudiante:
Yoser Saa Robetsy Araujo
CD. 215096
CI. 30826840
ii
ÍNDICE GENERAL
Pág.
INTRODUCCIÓN ……………… 1
ESTIMACION DE PARAMETROS
Definición de Muestreo ……………… 2
Tipos de Muestreo ……………… 2
Definición de Estimador ……………… 6
Definición de Parámetro ……………… 6
Definición de Estimación de Parámetro ……………… 7
Tipos de Estimadores ……………… 7
Métodos de los Mínimos Cuadrados ……………… 10
Ejercicios ……………… 12
PRUEBA DE HIPOTESIS
Definición de Hipótesis ……………… 15
Tipos de Hipótesis ……………… 16
Prueba de Hipótesis ……………… 18
Hipótesis para la Muestra ……………… 19
Hipótesis para la Varianza ……………… 20
Docimasia de Hipótesis ……………… 22
Potencia de Test ……………… 22
Ejercicios ……………… 23
PRUEBA DE PROPORCIONES
Definición ……………… 24
ii
DISTRIBUCION CHI-CUADRADO
Definición ……………… 28
Formula de calculo ……………… 28
Nivel de Significancia ……………… 29
Grados de Libertad ……………… 30
Tabla e Distribución ……………… 31
Regla de Decisión ……………… 32
Aplicaciones de Bondad de Ajustes ……………… 32
Prueba de Independencia ……………… 33
Tabla de Contingencia ……………… 34
Prueba de Homogeneidad ……………… 34
DISTRIBUCIÓN T-STUDENT
Definición ……………… 35
Formula de calculo ……………… 35
Ejercicio ……………… 36
iii
INTRODUCCION
1
ESTIMACIÓN DE PARÁMETROS
Muestreo
Tipos de Muestreo
Muestreo Probabilístico
2
procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica
cuando la población que estamos manejando es muy grande.
3
estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo
aleatorio simple o el estratificado para elegir los elementos concretos que
formarán parte de la muestra. En ocasiones las dificultades que plantean son
demasiado grandes, pues exige un conocimiento detallado de la población.
(Tamaño geográfico, sexos, edades,...)
4
extraída sea representativa, ya que no todos los sujetos de la población
tienen la misma probabilidad de ser elegidos.
Definición de Estimador
Definición de Parámetro
6
medida descriptiva numérica calculada a partir de datos de muestra"
(Mendenhall y Sincich, 2007: 39).
En estadística descriptiva se busca realizar análisis de conjuntos de
datos, que por lo general están basados en muestras obtenidas a partir de
cierta población. Las medidas características que se calculan a partir de los
datos pasan a ser descripciones de los mismos. De hecho, si se está
tratando con muestras, corresponden a estimaciones de las medidas
características poblacionales, las que pueden ser sus parámetros o
funciones de ellos.
Tipos de Estimadores
7
correspondiente parámetro. Esto se conoce con el nombre de estimación de
parámetros, y se puede hacer de dos formas:
ECM( ) =
9
porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo
de confianza".
Por lo tanto, si se seleccionan 100 muestras de una población y se
calcula la media de las muestras para intervalos de confianza del 95% para
cada muestra; se observa que aproximadamente 95 de los 100 intervalos de
confianza contienen la media poblacional. El nivel de confianza es la
probabilidad de que el parámetro poblacional se encuentre dentro del
intervalo; los niveles de confianza más ampliamente usados son 0.95 y 0.99,
sin embargo puede usarse cualquier probabilidad cercana a 1.
Estimación por intervalos con muestras pequeñas (n ≤ 30).Como se ha
indicado anteriormente, para poder utilizar la distribución normal es necesario
que las muestras sean grandes (n > 30) y conocer la desviación estándar. Si
no se conoce σ se utiliza s, pero si además la muestra es pequeña, los
resultados no serán satisfactorios. En estos casos se utiliza la distribución T
de Student, cuyas características son que es una distribución continua, tiene
forma de campana y es simétrica, es una familia de curvas todas con la
misma media de cero, pero sus desviaciones estándar difieren de acuerdo al
tamaño de la muestra, y que es más baja y dispersa que la distribución
normal. Cuando el tamaño de la muestra se incrementa, la distribución t se
aproxima a la normal.
10
suma de cuadrados de las diferencias ordenadas (llamadas residuos) entre
los puntos generados por la función y los correspondientes datos.
Su expresión general se basa en la ecuación de una recta y = mx + b.
Donde m es la pendiente y b el punto de corte, y vienen expresadas de la
siguiente manera:
11
independiente y una variable dependiente. En el análisis de regresión, las
variables dependientes se designan en el eje y vertical y las variables
independientes se designan en el eje x horizontal. Estas designaciones
formarán la ecuación para la línea de mejor ajuste, que se determina a partir
del método de mínimos cuadrados.
Ejemplos:
Veamos el gráfico:
12
Necesitamos encontrar una recta y = mx + b. Debemos aplicar el
método de mínimos cuadrados. Como ya sabemos entonces, primero
centraremos el valor (x ∙ y):
13
Ahora podemos obtener los valores de las sumatorias de cada columna:
Sustituimos en cada una de las expresiones:
Observemos el gráfico:
14
Vemos que la recta corta al eje y en 11,48 y en el eje x en 13,57. Por lo
tanto, si queremos saber dónde corta en el eje x igualamos la ecuación y = 0:
Despejamos x:
Prueba de Hipótesis
Hipótesis
15
razones claras por las que uno cree que algo es posible y finalmente se pone
en conclusión.
Según Izcara (2014), las hipótesis son explicaciones tentativas de un
fenómeno investigado, formuladas a manera de proposiciones. Una hipótesis
debe desarrollarse con una mente abierta y dispuesta a aprender, pues de lo
contrario se estaría tratando de imponer ideas, lo cual es completamente
erróneo.
Aun cuando una hipótesis es errónea, no por eso se debe decir que fue
una pérdida de tiempo haber planteado dicha hipótesis o que fue
completamente infructífera, pues es gracias a la prueba de las hipótesis que
se llega progresivamente a la verdad respecto a algún fenómeno. Al
confirmar que una hipótesis es falsa, se hace una contribución al
conocimiento y es un paso más que permite ir escalando en la búsqueda de
la verdad (San Martín, 2014).
Según Sabino (2014) plantea que se define la hipótesis como un intento
de explicación o una respuesta «provisional» a un fenómeno. Su función
consiste en delimitar el problema que se va a investigar según algunos
elementos, tales como: el tiempo, el lugar, las características de los sujetos.
Peiró y Bernal (2012).Sobre esta definición debe aclarase que el primer
punto a desarrollar en un trabajo de investigación no es la hipótesis, sino el
planteamiento del problema, ya que sin este no existirían elementos para
formularla. Una hipótesis puede usarse como una propuesta provisional que
no se pretende demostrar estrictamente, o puede ser una predicción que
debe ser verificada por el método científico.
Tipos de Hipótesis
16
introductorias, explican que una hipótesis es un enunciado que se propone
como base para describir y/o explicar por qué o cómo se produce un
fenómeno o conjunto de fenómenos relacionados; de acuerdo con este
criterio se pueden formular hipótesis descriptivas e hipótesis explicativas.
Explican que las primeras anticipan el tipo de variables que se espera
encontrar en el fenómeno investigado, los valores y las diferentes cualidades
que ellas presentan. Las segundas avanzan en la explicitación del por qué se
relacionan entre sí distintas variables.
Ambos tipos de hipótesis se pueden producir, utilizando procedimientos
deductivos o inductivos. Sobre estos dos procedimientos se precisa lo
siguiente:
- Las hipótesis inductivas se generan a partir de la observación de los
fenómenos. Del análisis de casos particulares, se van estableciendo
generalizaciones y formulando proposiciones. El proceso comienza con la
observación de casos, luego se elaboran hipótesis acerca de las
regularidades que se detectan en los casos observados, y finalmente se
relacionan diferentes proposiciones con lo que se configuran las teorías.
- Las hipótesis deductivas surgen por un proceso inverso. El
investigador parte de la teoría, de una premisa general considerada como
verdadera, de la cual va a deducir consecuencias observacionales. La
verdad de la premisa está avalada por la fortaleza de la teoría en la que se
apoya.
Después de hechas estas aclaraciones por Juni y Urbano, se pasa a
relacionar los tipos de hipótesis:
· Hipótesis correlacionales: son aquellas que establecen relaciones
entre dos o más variables. Permiten determinar si dos o más variables están
asociadas entre sí y su grado de asociación estadística. No permiten
establecer la dirección causal de la relación entre las variables (cuál es la
variable causal y cuál la variable efecto). Pueden existir diversas hipótesis
17
que vinculen a varias variables entre sí. No establecen en forma directa la
causa, sino que valoran el grado de relación de las variables.
Dentro de esta clase suelen incluirse las hipótesis de diferencias de
grupos. Si el investigador no tiene bases suficientes para presuponer a favor
de qué grupo será la diferencia en ciertas variables observadas, formula una
hipótesis simple. Cuando tiene la información empírica, establece la
magnitud de las diferencias entre los grupos y verifica si en ambos las
variables aparecen relacionadas. El análisis estadístico de este tipo de
hipótesis se apoya en las medidas de la estadística descriptiva y en el
análisis de correlaciones, del cual recibe su nombre.
· Hipótesis de causalidad: este tipo de hipótesis no solo establece
relaciones entre las variables, sino la naturaleza causal de las mismas.
Indican cuál de las variables puede ser considerada como causa, predictor a
o variable independiente, y cuál puede ser considerada efecto, variable
dependiente u observada.
La causalidad incluye los otros niveles: la descripción y correlación, a la
vez que se apoya en ellos. Si no hay correlación entre las variables no tiene
sentido plantear el estudio de la causalidad. Un rasgo propio de este tipo de
hipótesis es que establece una relación temporal entre los fenómenos. La
variable independiente (causal) precede temporalmente a la variable
dependiente (efecto). Las variables intervinientes son aquellas que se
presentan durante el proceso causal y cuya presencia puede transformar los
valores de cualquiera de ellas o de ambas.
Prueba de Hipótesis
18
hipótesis alternativa. La hipótesis nula es la afirmación que se está
comprobando. Normalmente la hipótesis nula es una afirmación de "sin
efecto" o "sin diferencia". La hipótesis alternativa es la afirmación que se
desea ser capaz de concluir que es verdadera basándose en la evidencia
proporcionada por los datos de la muestra.
Basándose en los datos de la muestra, la prueba determina cuando
rechazar la hipótesis nula. Se utiliza un p-valor, para realizar esa
determinación. Si el p-valor es menos que el nivel de significación (conocido
como α o alfa), entonces se puede rechazar la hipótesis nula. Un error
común suele ser que las pruebas de hipótesis estadísticas están diseñadas
para seleccionar la más probable de dos hipótesis.
Sin embargo, al diseñar una prueba de hipótesis, se configura la
hipótesis nula como la que se quiere rechazar. Dado que se fija que el nivel
de significación sea pequeño antes del análisis (normalmente, un valor de
0.05 funciona correctamente), Cuando se rechaza la hipótesis nula, se tiene
una prueba estadística de que la alternativa es cierta. Por el contrario, si no
se rechaza la hipótesis nula, no se tiene prueba estadística de que la
hipótesis nula sea cierta. Esto es debido a que no se ha fijado la probabilidad
de que se acepte falsamente que la hipótesis nula sea pequeña.
19
indica que "no hay cambio" Podemos rechazar o aceptar Ho. La hipótesis
nula es una afirmación que no se rechaza a menos que los datos maestrales
proporcionen evidencia convincente de que es falsa. El planteamiento de la
hipótesis nula siempre contiene un signo de igualdad con respecto al valor
especificado del parámetro.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la
hipótesis nula. Es una afirmación que se acepta si los datos maestrales
proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le
conoce también como la hipótesis de investigación. El planteamiento de la
hipótesis alternativa nunca contiene un signo de igualdad con respecto al
valor especificado del parámetro.
Paso 2: Seleccionar el nivel de significancia: Nivel de significancia:
Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota
mediante la letra griega α, también es denominada como nivel de riesgo, este
término es más adecuado ya que se corre el riesgo de rechazar la hipótesis
nula, cuando en realidad es verdadera. Este nivel está bajo el control de la
persona que realiza la prueba. Si suponemos que la hipótesis planteada es
verdadera, entonces, el nivel de significación indicará la probabilidad de no
aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza
(1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es
verdadera en la población.
Hipótesis para la Varianza
20
El Anova requiere el cumplimiento los siguientes supuestos:
Media Global:
Variación Total:
Variación Intra-grupos:
21
Variación Inter-grupos:
Docimasia de hipótesis
Potencia de un Test
Prueba de Proporciones
24
Prueba de Proporciones de una Muestra
25
Posteriormente este valor es comparado con el valor de Z, obtenido a
partir de una tabla normal a un nivel de significación seleccionado. Como
ocurrió con la prueba de medias de una muestra, las pruebas de
proporciones pueden ser de una o dos colas.
Ejemplo ilustrativo
26
Como en los datos aparece el tamaño de la población, se debe verificar
si el tamaño de la nuestra es mayor que el 5%. Se remplaza valores en la
siguiente fórmula:
Decisión:
27
Distribución Chi-Cuadrado
Esta prueba puede utilizarse incluso con datos medibles en una escala
nominal. La hipótesis nula de la prueba Chi-cuadrado postula una
distribución de probabilidad totalmente especificada como el modelo
matemático de la población que ha generado la muestra.
Para realizar este contraste se disponen los datos en una tabla de
frecuencias. Para cada valor o intervalo de valores se indica la frecuencia
absoluta observada o empírica (Oi). A continuación, y suponiendo que la
hipótesis nula es cierta, se calculan para cada valor o intervalo de valores la
frecuencia absoluta que cabría esperar o frecuencia esperada (Ei=n·pi ,
donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo valor o
intervalo de valores según la hipótesis nula). El estadístico de prueba se
basa en las diferencias entre la Oi y Ei y se define como:
28
En este sentido, se debe recordar que la prueba Chi-cuadrado (x2) o Ji-
cuadrado fue sugerida por Carl Pearson como una forma de valorar la
bondad del ajuste de unos datos a una distribución de probabilidad conocida,
y se ha establecido como el procedimiento de elección para el contraste de
hipótesis. Esta prueba estadística se emplea en el análisis de dos o más
grupos, y de dos o más variables. Desde entonces, se ha convertido en una
prueba muy aceptada y aplicable a múltiples usos, cuando se dispone de
datos independientes de tipo nominal. Ella ofrece un test general sobre la
existencia de diferencias entre las categorías que agrupan a los datos de la
variable dependiente.
Formula:
Nivel de Significancia
29
• VI: consumo de alcohol 2 grupos independientes (no consumir y
consumir alcohol)• VD: recaída en el consumo de tabaco Nivel de medición
de la variable dependiente: nominal
• Ho: No hay diferencia en la proporción de fumadores que recayeron
en el consumo de tabaco entre bebedores y no bebedores (P1= P2)• Prueba
estadística: Prueba chi cuadrada• Regla de decisión: Si p ≤ 0.05 se rechaza
Ho
Nota: El nivel de significancia que se establece en ciencias sociales y
en psicología normalmente es 0.05, este puede variar en la regla de decisión
a 0.01 y 0.001 si se requiere mayor certeza en la prueba de hipótesis.
Grados de Libertad
30
31
La regla de Decisión
Ejemplos
32
Estadísticos
33
Tabla de Contingencia
Prueba de Homogeneidad
34
Distribución T – Student
Formula:
35
alternativa, tomada como la distribución marginal de la primera variable de
una distribución "normal-gamma" ; en este sentido la expresión de su función
de densidad vendría dada por :
Ejemplo:
Caso clínico:
Determina si el peso levantado (2kg y 5kg) durante la abducción del
miembro superior registrada mediante un goniómetro electrónico tiene
influencia en el dolor de hombro que padecen los pacientes con contractura
del trapecio superior y que han recibido un tratamiento de fuerza. La
puntuación de dolor se ha registrado con una escala visual analógica (EVA).
1- Identifica las variables independientes y dependientes así como la
hipótesis nula y la alternativa
2- ¿Qué tipo de variable son según criterio estadístico/escala de medida?
3- Selecciona la prueba estadística a aplicar. Justifica brevemente la
respuesta.
36
Caso clínico resuelto
37
Conclusión
38
Referencias Bibliográficas
39
40