Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Autoras:
Angeolys Rodríguez 215005
María Rojas 225160
Gianmar Martínez 225181
Profesor: Yocer Saa
2
ÍNDICE
INTRODUCCIÓN 2
ÍNDICE 3
ESTIMACIÓN DE PARAMETROS 4
Tipos de muestreo 5
Estimador 7
Parámetro 7
Estimación de parámetros 7
Estimadores puntuales 8
PRUEBA DE HIPÓTESIS 11
Hipótesis 11
Tipos de hipótesis 11
Prueba de hipótesis 12
Docimasia de hipótesis 13
Potencia de un test 14
PRUEBA DE PROPORCIONES 15
3
DISTRIBUCIÓN CHI-CUADRADO 23
Fórmula de cálculo 23
Examinar las diferencias entre los conteos esperados y los conteos observados para
determinar qué niveles de las variables pueden tener el mayor impacto sobre la
asociación. 24
Grados de libertad 24
Regla de decisión 29
Prueba de independencia 30
Prueba de homogeneidad 31
Tabla de contingencia 31
DISTRIBUCIÓN T-STUDENT 32
CONCLUSIÓN 34
REFERENCIAS 35
4
ESTIMACIÓN DE PARAMETROS
Tipos de muestreo
Muestreo aleatorio o probabilístico
Este tipo de muestreo es uno de los más utilizados en las investigaciones. Se
comprende de aquí todos los sujetos o elementos de la población pueden pasar a
formar parte de la muestra, pues tienen la misma probabilidad de ser escogidos.
Podemos encontrar:
5
población que se presenta entre el total de sujetos que requieren para la muestra; para
después elegir a uno de los primeros de estos sujetos al azar y posteriormente se va
sumando de una forma secuencial o constante el mismo valor para elegir a los sujetos
requeridos.
Muestreo estratificado
Los investigadores dividen a la población en grupos o estratos que tengan relación
o compartan características similares y posteriormente se selecciona al azar o
aleatoriamente a los sujetos finales de los grupos o estratos formados. La distribución
de la muestra tomada de la población llamada “fijación” y se pueden conocer como:
afijación simple, afijación proporcional, afijación óptima.
Muestreo por conglomerados
En este método, la población ya se encuentra dividida en grupos o estratos
formados naturalmente y a partir de estos se toman la cantidad de sujetos que sean
necesarios de cada uno para así formar la muestra.
6
esta forma hasta cumplir con el tamaño de muestra o cantidad de sujetos que se
necesitan.
Muestreo discrecional
Mediante este método, se aplica una técnica parecida a la del método intencional,
pues el investigador recluta a los sujetos según sus criterios; pero en este caso, los
busca de acuerdo a lo que piensen que estos sujetos puedan aportar a la investigación.
Estimador
Un estimador es un estadístico (una función de la muestra) utilizado para estimar
un parámetro desconocido de la población. Para cara parámetro debe existir varios
estimadores diferentes. En general, se elige el estimador que posea mejores
propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez;
el valor de un estimador proporciona una estimación puntual del valor del parámetro
en estudio, se realiza la estimación mediante un intervalo, es decir, se obtiene un
intervalo.
Parámetro
Un parámetro estadístico, es un valor que intenta resumir en un solo número una
determinada característica de una variable estadística, también es conveniente señalar
que los parámetros se les conoce como estadísticos descriptivos. Este es un pilar en la
estadística, gracias a los parámetros podemos conocer la situación de la realidad, pues
permite interpretar y resumir un gran número de datos que se extraen al analizar una
determinada muestra estadística.
La media, la moda, la mediana, así como las principales medidas de tendencia central,
por ejemplo, son parámetros estadísticos. Permiten interpretar unos datos que se
extraen de una determinada población. Asimismo, las medidas de posición no central,
como serían los deciles, los percentiles o los cuartiles, también son parámetros
estadísticos. Clasificando a la población en grupos, nos permite interpretar datos y
analizar la población.
7
Estimación de parámetros
La estimación de parámetros es un método que consiste en asignar un valor al
parámetro o al conjunto de parámetros que caracterizan el campo sujeto al estudio. La
fórmula matemática que lo determina se denomina estimador. Para obtener
estimaciones adaptadas a esa realidad, se crean intervalos de confianza. Es decir,
rangos entre los que están esos valores estimados con cierto grado de confianza.
Estimadores puntuales
Un estimador de un parámetro poblacional es una función de los datos muestrales.
En pocas palabras, es una fórmula que depende de los valores obtenidos de una
muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto de
un parámetro. Por ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como estimación puntual
la talla media de los individuos de la muestra.
8
porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de
confianza".
Propiedades de los buenos estimadores
Sesgo:
se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor
esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que
un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su
esperanza igual al parámetro que se desea estimar.
Eficiencia:
Diremos que un estimador es más eficiente o más preciso que otro estimador, si la
varianza del primero es menor que la del segundo. La eficiencia de los estimadores
está limitada por las características de la distribución de probabilidad de la muestra de
la que proceden.
Consistencia
También llamada robustez, se utilizan cuando no es posible emplear estimadores
de mínima varianza, el requisito mínimo deseable para un estimador es que a medida
que el tamaño de la muestra crece, el valor del estimador tiende a ser el valor del
parámetro, propiedad que se denomina consistencia.
Convergencia
Para estudiar las características de un estimador no solo basta con saber el sesgo y
la varianza, sino que además es útil hacer un análisis de su comportamiento y
estabilidad en el largo plazo, esto es, su comportamiento asintótico. Cuando hablamos
de estabilidad en largo plazo, se viene a la mente el concepto de convergencia. Luego,
podemos construir sucesiones de estimadores y estudiar el fenómeno de la
convergencia.
Comportamiento Asintótico: En el caso de las variables aleatorias, existen diversos
tipos de convergencia, dentro de las cuales podemos distinguir:
-Convergencia en probabilidad (o débil).
-Convergencia casi segura (o fuerte).
9
-Convergencia en media cuadrática.
-Convergencia en distribución.
2.500 X
= x=25 niños
10.000 100
10
7.000 y
= x=70 adultos
10.000 100
500 z
= x=25 ancianos
10.000 100
PRUEBA DE HIPÓTESIS
Hipótesis
Una hipótesis es una proposición o enunciado que se considera cierto de entrada,
aunque aún no haya podido probarse, y que por lo tanto constituye una especulación o
una conjetura de trabajo, carente de confirmación o refutación mediante la
experiencia. Las hipótesis pueden plantearse con mayor o menor basamento en lo
real, pero sirven como un primer paso en la investigación, la cual buscará demostrarla
o refutarla. Esto, sin embargo, deberá hacerse mediante evidencia empírica o
mediante una argumentación sustentada, dependiendo de si estamos ante una
investigación cuantitativa o cualitativa.
Tipos de hipótesis
Hipótesis de investigación
Son proposiciones tentativas acerca de las posibles relaciones entre dos o más
variables y que cumplen con los cinco requisitos anteriormente mencionados. Se les
suele simbolizar como Hi o H1, H2, H3. También se les denomina como hipótesis de
trabajo.
Hipótesis nulas
Constituyen proposiciones acerca de la relación entre variables, sólo que sirven para
refutar o negar lo que afirma la hipótesis de investigación. Debido a que este tipo de
hipótesis resulta la contrapartida de la hipótesis de investigación, hay prácticamente
11
tantas clases de hipótesis nulas como de investigación. Las hipótesis nulas se
simbolizan así: Ho.
Hipótesis alternativas
Son posibilidades alternas ante la hipótesis de investigación y nula. Se simbolizan
como Ha y sólo pueden formularse cuando efectivamente hay otras posibilidades
además de las hipótesis de investigación nula. De no ser así, no pueden existir.
Hipótesis estadística
Las hipótesis estadísticas son la transformación de las hipótesis de investigación,
nulas y alternativas en símbolos estadísticos. Se pueden formular sólo cuando los
datos del estudio que se van a recolectar y analizar para probar o rechazar las
hipótesis son cuantitativos (números, porcentajes, promedios). Hay tres tipos de
hipótesis estadística que corresponden a clasificaciones de las hipótesis de
investigación y nula: de estimación, de correlación y de diferencia de medias
Prueba de hipótesis
Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar
una afirmación acerca de una población dependiendo de la evidencia proporcionada
por una muestra de datos. Una prueba de hipótesis examina dos hipótesis opuestas
sobre una población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el
enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que
"no hay efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se
desea poder concluir que es verdadero de acuerdo con la evidencia proporcionada por
los datos de la muestra.
12
Se identifica el estadístico de prueba
Paso 4
Se formula la regla de decisión
Paso 5
Se toma una muestra y se decide
No se rechaza Ho o se rechaza Ho y se acepta Hi
Hipótesis para la varianza
En situaciones como control estadístico de la calidad, de antemano se conocen los
parámetros de referencia del proceso bajo control. La actividad para decidir si en un
momento dado, el proceso está bajo de control, es la confrontación permanente de los
datos obtenidos con la hipótesis sobre la centralidad del proceso (media) sobre la
magnitud de su variabilidad (varianza). La varianza como medida de dispersión es
importante dado que nos ofrece una mejor visión de dispersión de datos; así podemos
determinar una franja de confianza, con la base en el cual podríamos tomar decisiones
al respecto. Para esto entonces debemos conocer nuestro estadístico de prueba
considerando que la población sigue una distribución normal.
( n−1 ) s 2
x 2= 2
gl=n−1
σ
Distribución de probabilidad normal, para lo cual usamos el siguiente estadístico
de prueba: este estadístico de prueba se le conoce como Hi cuadrada. Es frecuente
que se desee comprobar si la variación o dispersión de una variable ha tenido aluna
modificación, lo cual se hace con la prueba de hipótesis para la varianza.
Docimasia de hipótesis
hipótesis estadística es una afirmación respecto de una característica poblacional,
esta sentencia puede ser “docimada” (probada) usando una muestra aleatoria extraída
de esa población. En muchas ocasiones es necesario decidir entre una afirmación de
la forma θ = θ 0 (Hipótesis nula) u otra que puede tomar las siguientes formas 0 0 0 θ
≠ θ, θ > θ, θ < θ (Hipótesis alternativa). En símbolos:
13
H 0 : θ=θ 0
H 1 : θ≠ θ 0
Ó
H 1 :θ >θ 0
H 1 :θ <θ 0
Potencia de un test
La potencia de una prueba de hipótesis en estadística se refiere a la probabilidad
de rechazar una hipótesis nula que es falsa; dicho de otra forma, representa la
probabilidad de aceptar una hipótesis alternativa como verdadera cuando así lo es. En
nuestro ejemplo, sería la probabilidad de que, si los dos grupos son efectivamente
diferentes, la prueba de comparación de sus niveles de bienestar que hemos
realizado–una prueba t para muestras independientes- nos diga que no es lo mismo
ser dueño de un caniche que de una cobra. En este sentido, la potencia de la prueba
refleja la “sensibilidad” de un contraste de hipótesis, esto es, su capacidad para
detectar diferencias significativas existentes entre los grupos.
Ejercicios
Una empresa está interesada en lanzar un nuevo producto al mercado. Tras realizar
una campaña publicitaria, se toma la muestra de 1 000 habitantes, de los cuales, 25 no
conocían el producto. A un nivel de significación del 1% ¿apoya el estudio las
siguientes hipótesis?
a)Más del 3% de la población no conoce el nuevo producto.
b) Menos del 2% de la población no conoce el nuevo producto
Datos:
n = 1000
x = 25
14
Donde:
x = ocurrencias
n = observaciones
x
=¿ proporción de la muestra
n
p0=¿¿ proporción propuesta
Solución:
a)
a = 0,01
b)
a = 0,01
15
PRUEBA DE PROPORCIONES
16
a partir de un valor propuesto. Y ambas pruebas se basan en la distribución normal
estándar para valores críticos. Quizá la única diferencia real entre las ambas radica en
la forma corno se obtiene la desviación estándar de la distribución de muestreo. Esta
prueba comprende el cálculo del valor estadístico de prueba Z
17
Ejemplo
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta
aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la
proporción real de los estudiantes universitarios trabajan es mayor de lo que se
afirma, si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de
ellos trabajan. La muestra fue tomada de 10000 estudiantes. Los datos son:
18
Prueba de proporciones de dos muestras
El objetivo de una prueba de dos muestras es determinar si las dos muestras
independientes fueron tomadas de dos poblaciones, las cuales presentan la misma
proporción de elementos con determinada característica. La prueba se concentra en la
diferencia relativa (diferencia dividida entre la desviación estándar de la distribución
de muestreo) entre las dos proporciones muestrales. Diferencias pequeñas denotan
únicamente la variación casual producto del muestreo (se acepta H0), en tanto que
grandes diferencias significan lo contrario (se rechaza H0). El valor estadístico de
prueba (diferencia relativa) es comparado con un valor tabular de la distribución
normal, a fin de decidir si H0 es aceptada o rechazada. Una vez más, esta prueba se
asemeja considerablemente a la prueba de medias de dos muestras. La hipótesis nula
en una prueba de dos muestras es
Ejemplo:
Se ponen a prueba la enseñanza de la estadística empleando Excel y Winstats.
19
un nivel de significación de 0,05 que los estudiantes que están a favor de la nueva
enseñanza de la estadística es la misma en los dos paralelos? Los datos son:
20
Ejemplo
-El siguiente valor 3.4 representa el tamaño de una tabla r.k
Determine el número de grados de libertad y obtenga el valor crítico en el nivel 0,05
se significación.
Solución:
21
-La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas al
lanzar un dado 60 veces. Contrastar la hipótesis de que el dado es bueno, con un
nivel de significación de 0,01.
Frecuencia observada 6 8 9 15 14 8
Frecuencia esperada 10 10 10 10 10 10
22
DISTRIBUCIÓN CHI-CUADRADO
Sirve para someter a prueba hipótesis referidas a distribuciones de frecuencias. En
términos generales, esta prueba contrasta frecuencias observadas con las frecuencias
esperadas de acuerdo con la hipótesis nula.
Fórmula de cálculo
Nivel de significancia
Determinar si la asociación entre las variables es estadísticamente significativa
Para determinar si las variables son independientes, compare el valor p con el
nivel de significancia. Por lo general, un nivel de significancia (denotado como α o
alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un
riesgo de 5% de concluir que existe una asociación entre las variables cuando no hay
una asociación real.
Valor p ≤ α: Las variables tienen una asociación estadísticamente significativa
(Rechazar H0)
Si el valor p es menor que o igual al nivel de significancia, usted rechaza la hipótesis
nula y concluye que hay una asociación estadísticamente significativa entre las
variables.
Valor p > α: No se puede concluir que las variables están asociadas (No se puede
rechazar H0)
Si el valor p es mayor que el nivel de significancia, usted no puede rechazar la
hipótesis nula, porque no hay suficiente evidencia para concluir que las variables
están asociadas.
23
Examinar las diferencias entre los conteos esperados y los conteos observados
para determinar qué niveles de las variables pueden tener el mayor impacto
sobre la asociación.
Para determinar qué niveles de las variables tienen el mayor impacto, compare los
conteos observados y esperados o examine la contribución a chi-cuadrada.
Al examinar las diferencias entre los conteos observados de celda y los conteos
esperados de celda, podrá ver qué variables tienen las mayores diferencias, lo que
podría indicar dependencia. También puede comparar las contribuciones al
estadístico de chi-cuadrada para ver qué variables tienen los valores más grandes que
podrían indicar dependencia.
Grados de libertad
Para esta prueba, los grados de libertad son el número de celdas de la tabla de dos
factores de las variables categóricas que pueden variar, dadas las restricciones de los
totales marginales de las filas y columnas. Entonces cada “observación” en este caso
es la frecuencia en una celda.
Considere el ejemplo más simple: una tabla 2 x 2, con dos categorías y dos niveles
por cada categoría:
Categoría A Total
? 6
Categoría B
15
Total 10 11 21
No importa que valores se utilizan para los totales marginales de las filas y las
columnas. Una vez que se hayan establecido estos valores, solo hay un valor de celda
que puede cambiar (mostrado aquí con un signo de interrogación, pero puede ser
cualquiera de las cuatro celdas). Una vez que ingrese un número para una celda, los
números de las otras celdas son predeterminados por los totales de las filas y las
columnas. No pueden variar libremente. De manera que la prueba de independencia
chi-cuadrada tiene solo 1 grado de libertad para una tabla 2x2.
24
Grados de libertad: regresión
los grados de libertad generalmente son iguales al número de observaciones
(elementos de información) menos el número de parámetros estimados. Cuando se
lleva a cabo una regresión, se estima un parámetro para todos los términos del
modelo, y cada uno consume un grado de libertad. Por lo tanto, incluir una cantidad
excesiva de términos en un modelo de regresión múltiple reduce los grados de
libertad disponibles para estimar la variabilidad de los parámetros. De hecho, si la
cantidad de datos no es suficiente para el número de términos en su modelo, es
posible que ni siquiera haya suficientes grados de libertad (GL) para el término de
error y no es posible calcular valores p ni valores F. Obtendrá una salida como esta:
Si esto sucede, necesita recolectar más datos (para incrementar los grados de
libertad) o quitar términos de su modelo (con el propósito de reducir el número de
grados de libertad requeridos). Entonces, los grados de libertad sí tienen efectos
reales y tangibles en el análisis de los datos, a pesar de existir en el inframundo del
dominio de un vector aleatorio.
25
397 57 982 93 58 5 2 6 1 4 2 5 9 0 28
0,21 1,38 3,21 4,60 5,99 7,37 7,82 9,21 10,5 12,4 13,8
2 0,0100 0,020 0,051 0,103
1 6 9 5 1 8 4 0 97 29 16
0,58 2,36 4,64 6,25 7,81 9,34 9,83 11,3 12,8 14,7 16,2
3 0,072 0,115 0,216 0,352
4 6 2 1 5 8 7 45 38 96 66
1,06 3,35 5,98 7,77 9,48 11,1 11,6 13,2 14,8 16,9 18,4
4 0,207 0,297 0,484 0,711
4 7 9 9 8 43 68 77 60 24 67
1,61 4,35 7,28 9,23 11,0 12,8 13,3 15,0 16,7 18,9 20,5
5 0,412 0,554 0,831 1,145
0 1 9 6 70 33 88 86 50 07 15
2,20 5,34 8,55 10,6 12,5 14,4 15,0 16,8 18,5 20,7 22,4
6 0,676 0,872 1,237 1,635
4 8 8 45 92 49 33 12 48 91 58
2,83 6,34 9,80 12,0 14,0 16,0 16,6 18,4 20,2 22,6 24,3
7 0,989 1,239 1,690 2,167
3 6 3 17 67 13 22 75 78 01 22
3,49 7,34 11,0 13,3 15,5 17,5 18,1 20,0 21,9 24,3 26,1
8 1,344 1,646 2,180 2,733
0 4 30 62 07 35 68 90 55 52 24
4,16 8,34 12,2 14,6 16,9 19,0 19,6 21,6 23,5 26,0 27,8
9 1,735 2,088 2,700 3,325
8 3 42 84 19 23 79 66 89 56 77
4,86 9,34 13,4 15,9 18,3 20,4 21,1 23,2 25,1 27,7 29,5
10 2,156 2,558 3,247 3,940
5 2 42 87 07 83 61 09 88 22 88
5,57 10,3 14,6 17,2 19,6 21,9 22,6 24,7 26,7 29,3 31,2
11 2,603 3,053 3,816 4,575
8 41 31 75 75 20 18 25 57 54 64
6,30 11,3 15,8 18,5 21,0 23,3 24,0 26,2 28,3 30,9 32,9
12 3,074 3,571 4,404 5,226
4 40 12 49 26 37 54 17 00 57 09
7,04 12,3 16,9 19,8 22,3 24,7 25,4 27,6 29,8 32,5 34,5
13 3,565 4,107 5,009 5,892
2 40 85 12 62 36 72 88 19 35 28
7,79 13,3 18,1 21,0 23,6 26,1 26,8 29,1 31,3 34,0 36,1
14 4,075 4,660 5,629 6,571
0 39 51 64 85 19 73 41 19 91 23
15 4,601 5,229 6,262 7,261 8,54 14,3 19,3 22,3 24,9 27,4 28,2 30,5 32,8 35,6 37,6
26
7 39 11 07 96 88 59 78 01 28 97
9,31 15,3 20,4 23,5 26,2 28,8 29,6 32,0 34,2 37,1 39,2
16 5,142 5,812 6,908 7,962
2 38 65 42 96 45 33 00 67 46 52
10,0 16,3 21,6 24,7 27,5 30,1 30,9 33,4 35,7 38,6 40,7
17 5,697 6,408 7,564 8,672
85 38 15 69 87 91 95 09 18 48 90
10,8 17,3 22,7 25,9 28,8 31,5 32,3 34,8 37,1 40,1 42,3
18 6,265 7,015 8,231 9,390
65 38 60 89 69 26 46 05 56 36 12
10,11 11,6 18,3 23,9 27,2 30,1 32,8 33,6 36,1 38,5 41,6 43,8
19 6,844 7,633 8,907
7 51 38 00 04 44 52 87 91 82 10 20
10,85 12,4 19,3 25,0 28,4 31,4 34,1 35,0 37,5 39,9 43,0 45,3
20 7,434 8,260 9,591
1 43 37 38 12 10 70 20 66 97 72 15
10,28 11,59 13,2 20,3 26,1 29,6 32,6 35,4 36,3 38,9 41,4 44,5 46,7
21 8,034 8,897
3 1 40 37 71 15 71 79 43 32 01 22 97
10,98 12,33 14,0 21,3 27,3 30,8 33,9 36,7 37,6 40,2 42,7 45,9 48,2
22 8,643 9,542
2 8 41 37 01 13 24 81 59 89 96 62 68
11,68 13,09 14,8 22,3 28,4 32,0 35,1 38,0 38,9 41,6 44,1 47,3 49,7
23 9,260 10,196
9 1 48 37 29 07 72 76 68 38 81 91 28
12,40 13,84 15,6 23,3 29,5 33,1 36,4 39,3 40,2 42,9 45,5 48,8 51,1
24 9,886 10,856
1 8 59 37 53 96 15 64 70 80 59 12 79
13,12 14,61 16,4 24,3 30,6 34,3 37,6 40,6 41,5 44,3 46,9 50,2 52,6
25 10,520 11,524
0 1 73 37 75 82 52 46 66 14 28 23 20
13,84 15,37 17,2 25,3 31,7 35,5 38,8 41,9 42,8 45,6 48,2 51,6 54,0
26 11,160 12,198
4 9 92 36 95 63 85 23 56 42 90 27 52
14,57 16,15 18,1 26,3 32,9 36,7 40,1 43,1 44,1 46,9 49,6 53,0 55,4
27 11,808 12,879
3 1 14 36 12 41 13 95 40 63 45 23 76
15,30 16,92 18,9 27,3 34,0 37,9 41,3 44,4 45,4 48,2 50,9 54,4 56,8
28 12,461 13,565
8 8 39 36 27 16 37 61 19 78 93 11 92
29 13,121 14,256 16,04 17,70 19,7 28,3 35,1 39,0 42,5 45,7 46,6 49,5 52,3 55,7 58,3
27
7 8 68 36 39 87 57 22 93 88 36 92 01
16,79 18,49 20,5 29,3 36,2 40,2 43,7 46,9 47,9 50,8 53,6 57,1 59,7
30 13,787 14,953
1 3 99 36 50 56 73 79 62 92 72 67 03
17,53 19,28 21,4 30,3 37,3 41,4 44,9 48,2 49,2 52,1 55,0 58,5 61,0
31 14,458 15,655
9 1 34 36 59 22 85 32 26 91 03 36 98
18,29 20,07 22,2 31,3 38,4 42,5 46,1 49,4 50,4 53,4 56,3 59,8 62,4
32 15,134 16,362
1 2 71 36 66 85 94 80 87 86 28 99 87
19,04 20,86 23,1 32,3 39,5 43,7 47,4 50,7 51,7 54,7 57,6 61,2 63,8
33 15,815 17,074
7 7 10 36 72 45 00 25 43 76 48 56 70
19,80 21,66 23,9 33,3 40,6 44,9 48,6 51,9 52,9 56,0 58,9 62,6 65,2
34 16,501 17,789
6 4 52 36 76 03 02 66 95 61 64 08 47
20,56 22,46 24,7 34,3 41,7 46,0 49,8 53,2 54,2 57,3 60,2 63,9 66,6
35 17,192 18,509
9 5 97 36 78 59 02 03 44 42 75 55 19
21,33 23,26 25,6 35,3 42,8 47,2 50,9 54,4 55,4 58,6 61,5 65,2 67,9
36 17,887 19,233
6 9 43 36 79 12 98 37 89 19 81 96 85
22,10 24,07 26,4 36,3 43,9 48,3 52,1 55,6 56,7 59,8 62,8 66,6 69,3
37 18,586 19,960
6 5 92 36 78 63 92 68 30 92 83 33 46
22,87 24,88 27,3 37,3 45,0 49,5 53,3 56,8 57,9 61,1 64,1 67,9 70,7
38 19,289 20,691
8 4 43 35 76 13 84 96 69 62 81 66 03
23,65 25,69 28,1 38,3 46,1 50,6 54,5 58,1 59,2 62,4 65,4 69,2 72,0
39 19,996 21,426
4 5 96 35 73 60 72 20 04 28 76 94 55
24,43 26,50 29,0 39,3 47,2 51,8 55,7 59,3 60,4 63,6 66,7 70,6 73,4
40 20,707 22,164
3 9 51 35 69 05 58 42 36 91 66 18 02
25,21 27,32 29,9 40,3 48,3 52,9 56,9 60,5 61,6 64,9 68,0 71,9 74,7
41 21,421 22,906
5 6 07 35 63 49 42 61 65 50 53 38 45
25,99 28,14 30,7 41,3 49,4 54,0 58,1 61,7 62,8 66,2 69,3 73,2 76,0
42 22,138 23,650
9 4 65 35 56 90 24 77 92 06 36 54 84
43 22,859 24,398 26,78 28,96 31,6 42,3 50,5 55,2 59,3 62,9 64,1 67,4 70,6 74,5 77,4
28
5 5 25 35 48 30 04 90 16 59 16 66 19
27,57 29,78 32,4 43,3 51,6 56,3 60,4 64,2 65,3 68,7 71,8 75,8 78,7
44 23,584 25,148
5 7 87 35 39 69 81 01 37 10 93 74 50
28,36 30,61 33,3 44,3 52,7 57,5 61,6 65,4 66,5 69,9 73,1 77,1 80,0
45 24,311 25,901
6 2 50 35 29 05 56 10 55 57 66 79 77
29,16 31,43 34,2 45,3 53,8 58,6 62,8 66,6 67,7 71,2 74,4 78,4 81,4
46 25,041 26,657
0 9 15 35 18 41 30 17 71 01 37 81 00
29,95 32,26 35,0 46,3 54,9 59,7 64,0 67,8 68,9 72,4 75,7 79,7 82,7
47 25,775 27,416
6 8 81 35 06 74 01 21 85 43 04 80 20
30,75 33,09 35,9 47,3 55,9 60,9 65,1 69,0 70,1 73,6 76,9 81,0 84,0
48 26,511 28,177
5 8 49 35 93 07 71 23 97 83 69 75 37
31,55 33,93 36,8 48,3 57,0 62,0 66,3 70,2 71,4 74,9 78,2 82,3 85,3
49 27,249 28,941
5 0 18 35 79 38 39 22 06 19 31 67 51
32,35 34,76 37,6 49,3 58,1 63,1 67,5 71,4 72,6 76,1 79,4 83,6 86,6
50 27,991 29,707
7 4 89 35 64 67 05 20 13 54 90 57 61
Regla de decisión
Una regla de decisión es un conjunto de condiciones que clasifican los registros.
La regla predice un resultado en el campo de destino.
La visualización de las reglas de decisión le ayuda a determinar qué condiciones
es más probable que generen un resultado específico. Por ejemplo, tenga en cuenta
algunas reglas de decisión hipotéticas que podrían predecir el abandono. Estas reglas
podrían identificar las clasificaciones según los rangos de edad de los clientes y el
número de reclamaciones anteriores. A partir de esas reglas, podría observar que los
clientes que no tienen ninguna reclamación o tienen sólo 1 y son clientes mayores de
50 son más propensos a abandonar.
La regla de decisión corresponde a una rama en un árbol de decisiones.
29
La aplicación de la regla de decisión de la primera manera consiste en rechazar la
Hipótesis Nula si la probabilidad de observar el estadístico de contraste es igual o
menor a la probabilidad criterio (habitualmente 0.05 o 0.01).
Prueba de independencia
La prueba de independencia de Chi-Cuadrado busca una asociación entre dos
variables categóricas dentro de la misma población.
A diferencia de la prueba de bondad de ajuste, la prueba de independencia no
compara una única variable observada con una población teórica, sino dos variables
dentro de un conjunto de muestras entre sí.
Prueba de homogeneidad
La prueba de homogeneidad de Chi-Cuadrado se organiza y ejecuta exactamente
igual que la prueba de independencia.
La principal diferencia que hay que recordar entre ambas es que la prueba de
independencia busca una asociación entre dos variables categóricas dentro de la
misma población, mientras que la prueba de homogeneidad determina si la
30
distribución de una variable es la misma en cada una de varias poblaciones
(asignando así la propia población como segunda variable categórica).
Tabla de contingencia
Una tabla de contingencia es una herramienta utilizada en la rama de la estadística,
la cual consiste en crear al menos dos filas y dos columnas para representar datos
categóricos en términos de conteos de frecuencia.
La tabla de contingencia es una de las herramientas analíticas más útiles y un pilar de
la industria de la investigación de mercados.
Ejemplo:
DISTRIBUCIÓN T-STUDENT
Es una distribución de probabilidad que surge del problema de estimar la media de
una población normalmente distribuida cuando el tamaño de la muestra es pequeño.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya
que también la podemos utilizar con muestras aleatorias de tamaño grande.
En el pasado, cuando el tamaño de la muestra era grande, esto no suponía un
problema para los estadísticos. Utilizaron la desviación típica de la muestra s como
una estimación de σ y procedieron como antes para calcular un intervalo de confianza
con resultados suficientemente cercanos. Sin embargo, los estadísticos se encontraron
31
con problemas cuando el tamaño de la muestra era pequeño. El pequeño tamaño de la
muestra provocó imprecisiones en el intervalo de confianza.
Formula:
Ejercicios:
-Se aplica una prueba de autoestima a 25 personas quienes obtienen una calificación
promedio de 62.1 con una desviación estándar de 5.83. Se sabe que el valor correcto
de la prueba debe ser mayor a 60. ¿Existe suficiente evidencia para comprobar que no
hay problemas de autoestima en el grupo seleccionado?
H1 > 60;
H0 =< 60.
Paso 2. Determinar el nivel de significancia alfa: alfa = 0.05.
Paso 3. Resultados de la evidencia muestral: X = 62.1; s = 5.83
32
Paso 4. Aplicar la distribución de probabilidad calculando T:
El resultado de la ecuación es 1.8. Dado que 1.8 es mayor que 1.7109 cae en la
región de H1 y se acepta la hipótesis alternativa. Si buscamos el valor de 1.8 bajo la
curva normal encontraremos que es de 0.0359 el cual es menor que 0.05. La
conclusión es que no hay problemas de autoestima en el grupo estudiado. Esto con el
diseño de la investigación presentado.
CONCLUSIÓN
La estadista podemos concluir que forma parte indispensable en amplios campos
de desarrollo como sociedad, en aplicaciones empresariales, sociales y en estudios de
mercadeo por dar algunos ejemplos, teniendo así un avance significativo, en pro de
encontrar la eficiencia y mayor exactitud en la metodología aplicada. Dichos métodos
los cuales fueron fuente de estudios en este trabajo, nos dejan evidencia del progreso
constante y marcado por encontrar la mayor exactitud en nuestros procesos
metodológicos.
33
REFERENCIAS
Muestreo (2020) [página web en línea] disponible en: https://economipedia.com/
definiciones/muestreo.html
34
Coll, M. (2017). Parámetro estadístico. [página web disponible] disponible en:
https://economipedia.com/definiciones/parametro-estadistico.html
Jesús, V.; Paola, N. & Sarah, R. Hipótesis. (2010). [página web disponible]
disponible en: https://danielvalencia21cr.wixsite.com/estadistica/blank-9
Cruz, R. (2004). Pruebas de Hipótesis para una muestra. [página web disponible]
disponible en: https://www.monografias.com/trabajos30/prueba-de-hipotesis/prueba-
de-hipotesis
35
36