Está en la página 1de 36

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN


INSTITUTO UNIVERSITARIO DE TECNOLOGÍA PARA LA INFORMÁTICA
ESTADÍSTICA II
SECCIÓN: AB

ESTIMACIÓN DE PARÁMETROS- PRUEBA DE HIPÓTESIS- PRUEBA DE


PROPORCIÓN- DISTRIBUCIÓN T-STUDENT

Autoras:
Angeolys Rodríguez 215005
María Rojas 225160
Gianmar Martínez 225181
Profesor: Yocer Saa

Valencia, marzo de 2023


INTRODUCCIÓN
Desde el nacimiento de la primera sociedad, el hombre ha tenido la necesidad de
contabilizar y agrupar sus recursos, desde la manera más instintiva llegando a los
métodos más avanzados que encontramos en la actualidad, métodos los cuales han
ido de la mano con el avance y la evolución de nosotros mismos como conjunto
social, buscando la mejor optimización de los procesos. A continuación,
procederemos a mencionar de manera progresiva algunos métodos estadísticos, con el
fin de conocer su génesis y función activa en nuestra materia. Se detallarán uno por
uno los procesos que se deben de aplicar para conseguir un resultado de tipo
estadístico. Explicando desde su definición, hasta como se aplican en los diversos
casos posibles de presentar, conocer cada uno de estos pasos nos permitirá interpretar
fácilmente cada ejercicio y extraer de manera efectiva los datos requeridos para
avanzar en los estudios que se deban realizar. Adaptando nuestro intelecto además de
las fórmulas correspondientes a cada uno.

2
ÍNDICE

INTRODUCCIÓN 2

ÍNDICE 3

ESTIMACIÓN DE PARAMETROS 4

Tipos de muestreo 5

Muestreo aleatorio o probabilístico 5

Estimador 7

Parámetro 7

Estimación de parámetros 7

Estimadores puntuales 8

Estimadores por intervalo 8

Propiedades de los buenos estimadores 8

Métodos de los mínimos cuadrados para la obtención de estimadores 9

PRUEBA DE HIPÓTESIS 11

Hipótesis 11

Tipos de hipótesis 11

Prueba de hipótesis 12

Hipótesis para la muestra 12

Hipótesis para la varianza 13

Docimasia de hipótesis 13

Potencia de un test 14

PRUEBA DE PROPORCIONES 15

¿Cómo se debe mostrar una Proporción? 16

3
DISTRIBUCIÓN CHI-CUADRADO 23

Fórmula de cálculo 23

Determinar si la asociación entre las variables es estadísticamente significativa 23

Examinar las diferencias entre los conteos esperados y los conteos observados para
determinar qué niveles de las variables pueden tener el mayor impacto sobre la
asociación. 24

Grados de libertad 24

Tabla de distribución de chi-cuadrado 25

Regla de decisión 29

¿Para que se utiliza una prueba de chi cuadrado? 30

Prueba de bondad de ajuste 30

Prueba de independencia 30

Prueba de homogeneidad 31

Tabla de contingencia 31

DISTRIBUCIÓN T-STUDENT 32

CONCLUSIÓN 34

REFERENCIAS 35

4
ESTIMACIÓN DE PARAMETROS

El muestreo es un proceso mediante el cual se selecciona un grupo de


observaciones que pertenecen a una población. Esto, con el fin de realizar un estudio
estadístico. El muestreo es necesario por el hecho de que las poblaciones pueden ser
demasiado grandes y no factible tomar datos de todos los individuos; el objetivo es
que la muestra sea representativa. Es decir, que sus indicadores como la media de
edad, el ingreso promedio, el porcentaje de hombres y de mujeres, entre otros, sea el
mismo, o muy similar al de la población.

Tipos de muestreo
Muestreo aleatorio o probabilístico
Este tipo de muestreo es uno de los más utilizados en las investigaciones. Se
comprende de aquí todos los sujetos o elementos de la población pueden pasar a
formar parte de la muestra, pues tienen la misma probabilidad de ser escogidos.
Podemos encontrar:

 Muestreo aleatorio simple


En este método de muestreo lo principales es tener una idea clara de cuantos
sujetos serán necesarios para completar el tamaño de la muestra que se va a
investigar, pues este consiste en que cada sujeto de la población se le debe asignar un
número, para que mediante algún sorteo, o generando números aleatorios con ayuda
de rifas se lore dar a conocer los números de los sujetos seleccionados que serán
tomados como muestra.
 Muestreo Sistemático
Se basa en que los sujetos que conforman a la población son enumerados, pero en
lugar de dar a conocer los que serán incluidos mediante el azar en este caso incluyen
otra técnica. Luego de ser enumerados, los investigadores dividen el total de la

5
población que se presenta entre el total de sujetos que requieren para la muestra; para
después elegir a uno de los primeros de estos sujetos al azar y posteriormente se va
sumando de una forma secuencial o constante el mismo valor para elegir a los sujetos
requeridos.

 Muestreo estratificado
Los investigadores dividen a la población en grupos o estratos que tengan relación
o compartan características similares y posteriormente se selecciona al azar o
aleatoriamente a los sujetos finales de los grupos o estratos formados. La distribución
de la muestra tomada de la población llamada “fijación” y se pueden conocer como:
afijación simple, afijación proporcional, afijación óptima.
 Muestreo por conglomerados
En este método, la población ya se encuentra dividida en grupos o estratos
formados naturalmente y a partir de estos se toman la cantidad de sujetos que sean
necesarios de cada uno para así formar la muestra.

Muestreo no aleatorio o no probabilístico


Mediante esta técnica de muestreo, en comparación del muestreo probabilístico las
muestras no se recogen por medio de procesos donde a los sujetos se les brinde las
mismas posibilidades de ser seleccionados.
 Muestreo por cuotas
Mediante este método los investigadores se encargan de incluir en la muestra solo
a un grupo determinado de sujetos que cumplen con ciertos requisitos o condiciones
específicas.
 Muestreo intencional o de conveniencia
Mediante este método, el investigador se encarga de elegir de acuerdo a sus
propios criterios o alcances a los sujetos que formaran parte de la muestra.
 Muestreo por bola de nieve
En este método se hace contacto con algún sujeto en específico y este se encargará
de buscar a otros sujetos o nuevos participantes consecutivamente. Haciéndolo de

6
esta forma hasta cumplir con el tamaño de muestra o cantidad de sujetos que se
necesitan.
 Muestreo discrecional
Mediante este método, se aplica una técnica parecida a la del método intencional,
pues el investigador recluta a los sujetos según sus criterios; pero en este caso, los
busca de acuerdo a lo que piensen que estos sujetos puedan aportar a la investigación.
Estimador
Un estimador es un estadístico (una función de la muestra) utilizado para estimar
un parámetro desconocido de la población. Para cara parámetro debe existir varios
estimadores diferentes. En general, se elige el estimador que posea mejores
propiedades que los restantes, como insesgadez, eficiencia, convergencia y robustez;
el valor de un estimador proporciona una estimación puntual del valor del parámetro
en estudio, se realiza la estimación mediante un intervalo, es decir, se obtiene un
intervalo.

Parámetro
Un parámetro estadístico, es un valor que intenta resumir en un solo número una
determinada característica de una variable estadística, también es conveniente señalar
que los parámetros se les conoce como estadísticos descriptivos. Este es un pilar en la
estadística, gracias a los parámetros podemos conocer la situación de la realidad, pues
permite interpretar y resumir un gran número de datos que se extraen al analizar una
determinada muestra estadística.
La media, la moda, la mediana, así como las principales medidas de tendencia central,
por ejemplo, son parámetros estadísticos. Permiten interpretar unos datos que se
extraen de una determinada población. Asimismo, las medidas de posición no central,
como serían los deciles, los percentiles o los cuartiles, también son parámetros
estadísticos. Clasificando a la población en grupos, nos permite interpretar datos y
analizar la población.

7
Estimación de parámetros
La estimación de parámetros es un método que consiste en asignar un valor al
parámetro o al conjunto de parámetros que caracterizan el campo sujeto al estudio. La
fórmula matemática que lo determina se denomina estimador. Para obtener
estimaciones adaptadas a esa realidad, se crean intervalos de confianza. Es decir,
rangos entre los que están esos valores estimados con cierto grado de confianza.

Estimadores puntuales
Un estimador de un parámetro poblacional es una función de los datos muestrales.
En pocas palabras, es una fórmula que depende de los valores obtenidos de una
muestra, para realizar estimaciones. Lo que se pretende obtener es el valor exacto de
un parámetro. Por ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como estimación puntual
la talla media de los individuos de la muestra.

Estimadores por intervalo


La estimación por intervalos consiste en establecer el intervalo de valores donde es
más probable se encuentre el parámetro. La obtención del intervalo se basa en las
siguientes consideraciones:
 Si conocemos la distribución muestral del estimador podemos obtener las
probabilidades de ocurrencia de los estadísticos muestrales.
 Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halle dentro de los intervalos de la
distribución muestral.
 El problema es que el parámetro poblacional es desconocido, y por ello el
intervalo se establece alrededor del estimador. Si repetimos el muestreo un
gran número de veces y definimos un intervalo alrededor de cada valor del
estadístico muestral, el parámetro se sitúa dentro de cada intervalo en un

8
porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de
confianza".
Propiedades de los buenos estimadores
 Sesgo:
se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor
esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que
un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su
esperanza igual al parámetro que se desea estimar.

 Eficiencia:
Diremos que un estimador es más eficiente o más preciso que otro estimador, si la
varianza del primero es menor que la del segundo. La eficiencia de los estimadores
está limitada por las características de la distribución de probabilidad de la muestra de
la que proceden.
 Consistencia
También llamada robustez, se utilizan cuando no es posible emplear estimadores
de mínima varianza, el requisito mínimo deseable para un estimador es que a medida
que el tamaño de la muestra crece, el valor del estimador tiende a ser el valor del
parámetro, propiedad que se denomina consistencia.
 Convergencia
Para estudiar las características de un estimador no solo basta con saber el sesgo y
la varianza, sino que además es útil hacer un análisis de su comportamiento y
estabilidad en el largo plazo, esto es, su comportamiento asintótico. Cuando hablamos
de estabilidad en largo plazo, se viene a la mente el concepto de convergencia. Luego,
podemos construir sucesiones de estimadores y estudiar el fenómeno de la
convergencia.
Comportamiento Asintótico: En el caso de las variables aleatorias, existen diversos
tipos de convergencia, dentro de las cuales podemos distinguir:
-Convergencia en probabilidad (o débil).
-Convergencia casi segura (o fuerte).

9
-Convergencia en media cuadrática.
-Convergencia en distribución.

Métodos de los mínimos cuadrados para la obtención de estimadores de


parámetros
El método de los mínimos cuadrados se utiliza para calcular la recta de regresión
lineal que minimiza los residuos, esto es, las diferencias entre los valores reales y los
estimados por la recta. Se revisa su fundamento y la forma de calcular los coeficientes
de regresión con este método.
Ejercicios
Enunciado n° 1
1)En cierto barrio se quiere hacer un estudio para conocer mejor el tipo de
actividades de ocio que gustan más a sus habitantes. Para ellos van a ser
encuestados 100 individuos elegidos al azar.
-Explicar qué procedimiento de selección sería más adecuado utilizar: muestreo
con o sin reposición. ¿por qué?
-Como los gustos cambian con la edad y se sabe que en el barrio viven 2.5000
niños, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra
anterior utilizando un muestreo estratificado. Determinar el tamaño muestral
correspondiente a cada estrato.
Para efectuar un muestreo aleatorio estratificado, será necesario que la muestra
refleje fielmente los estratos existentes en la población; deben considerarse los
estratos formados por: niños, adultos y ancianos.
El tamaño muestral de cada estrato deberá ser proporcional a la presencia del
mismo en la población original:

POBLACIÓN TOTAL 2.500 + 7.000 + 500 = 10.000

2.500 X
= x=25 niños
10.000 100

10
7.000 y
= x=70 adultos
10.000 100

500 z
= x=25 ancianos
10.000 100

PRUEBA DE HIPÓTESIS
Hipótesis
Una hipótesis es una proposición o enunciado que se considera cierto de entrada,
aunque aún no haya podido probarse, y que por lo tanto constituye una especulación o
una conjetura de trabajo, carente de confirmación o refutación mediante la
experiencia. Las hipótesis pueden plantearse con mayor o menor basamento en lo
real, pero sirven como un primer paso en la investigación, la cual buscará demostrarla
o refutarla. Esto, sin embargo, deberá hacerse mediante evidencia empírica o
mediante una argumentación sustentada, dependiendo de si estamos ante una
investigación cuantitativa o cualitativa.

Tipos de hipótesis
 Hipótesis de investigación
Son proposiciones tentativas acerca de las posibles relaciones entre dos o más
variables y que cumplen con los cinco requisitos anteriormente mencionados. Se les
suele simbolizar como Hi o H1, H2, H3. También se les denomina como hipótesis de
trabajo.
 Hipótesis nulas
Constituyen proposiciones acerca de la relación entre variables, sólo que sirven para
refutar o negar lo que afirma la hipótesis de investigación. Debido a que este tipo de
hipótesis resulta la contrapartida de la hipótesis de investigación, hay prácticamente

11
tantas clases de hipótesis nulas como de investigación. Las hipótesis nulas se
simbolizan así: Ho.
 Hipótesis alternativas
Son posibilidades alternas ante la hipótesis de investigación y nula. Se simbolizan
como Ha y sólo pueden formularse cuando efectivamente hay otras posibilidades
además de las hipótesis de investigación nula. De no ser así, no pueden existir.
 Hipótesis estadística
Las hipótesis estadísticas son la transformación de las hipótesis de investigación,
nulas y alternativas en símbolos estadísticos. Se pueden formular sólo cuando los
datos del estudio que se van a recolectar y analizar para probar o rechazar las
hipótesis son cuantitativos (números, porcentajes, promedios). Hay tres tipos de
hipótesis estadística que corresponden a clasificaciones de las hipótesis de
investigación y nula: de estimación, de correlación y de diferencia de medias

Prueba de hipótesis
Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar
una afirmación acerca de una población dependiendo de la evidencia proporcionada
por una muestra de datos. Una prueba de hipótesis examina dos hipótesis opuestas
sobre una población: la hipótesis nula y la hipótesis alternativa. La hipótesis nula es el
enunciado que se probará. Por lo general, la hipótesis nula es un enunciado de que
"no hay efecto" o "no hay diferencia". La hipótesis alternativa es el enunciado que se
desea poder concluir que es verdadero de acuerdo con la evidencia proporcionada por
los datos de la muestra.

Hipótesis para la muestra


Paso 1
Se plantean la hipótesis nula y alternativa.
Paso 2
Se selecciona el nivel de significancia
Paso 3

12
Se identifica el estadístico de prueba
Paso 4
Se formula la regla de decisión
Paso 5
Se toma una muestra y se decide
No se rechaza Ho o se rechaza Ho y se acepta Hi
Hipótesis para la varianza
En situaciones como control estadístico de la calidad, de antemano se conocen los
parámetros de referencia del proceso bajo control. La actividad para decidir si en un
momento dado, el proceso está bajo de control, es la confrontación permanente de los
datos obtenidos con la hipótesis sobre la centralidad del proceso (media) sobre la
magnitud de su variabilidad (varianza). La varianza como medida de dispersión es
importante dado que nos ofrece una mejor visión de dispersión de datos; así podemos
determinar una franja de confianza, con la base en el cual podríamos tomar decisiones
al respecto. Para esto entonces debemos conocer nuestro estadístico de prueba
considerando que la población sigue una distribución normal.

( n−1 ) s 2
x 2= 2
gl=n−1
σ
Distribución de probabilidad normal, para lo cual usamos el siguiente estadístico
de prueba: este estadístico de prueba se le conoce como Hi cuadrada. Es frecuente
que se desee comprobar si la variación o dispersión de una variable ha tenido aluna
modificación, lo cual se hace con la prueba de hipótesis para la varianza.

Docimasia de hipótesis
hipótesis estadística es una afirmación respecto de una característica poblacional,
esta sentencia puede ser “docimada” (probada) usando una muestra aleatoria extraída
de esa población. En muchas ocasiones es necesario decidir entre una afirmación de
la forma θ = θ 0 (Hipótesis nula) u otra que puede tomar las siguientes formas 0 0 0 θ
≠ θ, θ > θ, θ < θ (Hipótesis alternativa). En símbolos:

13
H 0 : θ=θ 0

H 1 : θ≠ θ 0
Ó
H 1 :θ >θ 0

H 1 :θ <θ 0

Potencia de un test
La potencia de una prueba de hipótesis en estadística se refiere a la probabilidad
de rechazar una hipótesis nula que es falsa; dicho de otra forma, representa la
probabilidad de aceptar una hipótesis alternativa como verdadera cuando así lo es. En
nuestro ejemplo, sería la probabilidad de que, si los dos grupos son efectivamente
diferentes, la prueba de comparación de sus niveles de bienestar que hemos
realizado–una prueba t para muestras independientes- nos diga que no es lo mismo
ser dueño de un caniche que de una cobra. En este sentido, la potencia de la prueba
refleja la “sensibilidad” de un contraste de hipótesis, esto es, su capacidad para
detectar diferencias significativas existentes entre los grupos.

Ejercicios
Una empresa está interesada en lanzar un nuevo producto al mercado. Tras realizar
una campaña publicitaria, se toma la muestra de 1 000 habitantes, de los cuales, 25 no
conocían el producto. A un nivel de significación del 1% ¿apoya el estudio las
siguientes hipótesis?
a)Más del 3% de la población no conoce el nuevo producto.
b) Menos del 2% de la población no conoce el nuevo producto
Datos:
n = 1000
x = 25

14
Donde:

x = ocurrencias
n = observaciones
x
=¿ proporción de la muestra
n
p0=¿¿ proporción propuesta
Solución:
a)

a = 0,01

b)

a = 0,01

15
PRUEBA DE PROPORCIONES

Es el número de observaciones con una característica en particular entre la


población de referencia. El numerador siempre está incluido en el denominador. Las
pruebas de proporciones son adecuadas cuando los datos que se están analizando
constan de cuentas o frecuencias de elementos de dos o más clases. El objeto de estas
pruebas es evaluar las afirmaciones con respecto a una proporción (o porcentaje) de
población. Las pruebas se basan en la premisa de que una proporción muestral (es
decir, x ocurrencias en n observaciones, o x/n) será igual a la proporción verdadera de
la población si se toman márgenes o tolerancias para la variabilidad muestral.
Las pruebas suelen enfocarse en la diferencia entre un número esperado de
ocurrencias, suponiendo que una afirmación es verdadera, y el número observado
realmente. La diferencia se compara con la variabilidad prescrita mediante una
distribución de muestreo que tiene como base el supuesto de que H0 es realmente
verdadera. En muchos aspectos, las pruebas de proporciones se parecen a las pruebas
de medias, excepto que, en el caso de las primeras, los datos muestrales se consideran
como cuentas en lugar de como mediciones

¿Cómo se debe mostrar una Proporción?


Prueba de proporciones de una muestra
Cuando el objetivo del muestreo es evaluar la validez de una afirmación con
respecto a la proporción de una población, es adecuado utilizar una prueba de una
muestra.
La metodología de prueba depende de si el número de observaciones de la muestra es
grande o pequeño. Como se habrá observado anteriormente, las pruebas de grandes
muestras de medias y proporciones son bastante semejantes. De este modo, los
valores estadísticos de prueba miden la desviación de un valor estadístico de muestra

16
a partir de un valor propuesto. Y ambas pruebas se basan en la distribución normal
estándar para valores críticos. Quizá la única diferencia real entre las ambas radica en
la forma corno se obtiene la desviación estándar de la distribución de muestreo. Esta
prueba comprende el cálculo del valor estadístico de prueba Z

Posteriormente este valor es comparado con el valor de Z, obtenido a partir de una


tabla normal a un nivel de significación seleccionada. Como ocurrió con la prueba de
medias de una muestra, las pruebas de proporciones pueden ser de una o dos colas.

17
Ejemplo
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta
aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la
proporción real de los estudiantes universitarios trabajan es mayor de lo que se
afirma, si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de
ellos trabajan. La muestra fue tomada de 10000 estudiantes. Los datos son:

Como en los datos aparece el tamaño de la población, se debe verificar si el


tamaño de la nuestra es mayor que el 5%. Se remplaza valores en la siguiente
fórmula:

18
Prueba de proporciones de dos muestras
El objetivo de una prueba de dos muestras es determinar si las dos muestras
independientes fueron tomadas de dos poblaciones, las cuales presentan la misma
proporción de elementos con determinada característica. La prueba se concentra en la
diferencia relativa (diferencia dividida entre la desviación estándar de la distribución
de muestreo) entre las dos proporciones muestrales. Diferencias pequeñas denotan
únicamente la variación casual producto del muestreo (se acepta H0), en tanto que
grandes diferencias significan lo contrario (se rechaza H0). El valor estadístico de
prueba (diferencia relativa) es comparado con un valor tabular de la distribución
normal, a fin de decidir si H0 es aceptada o rechazada. Una vez más, esta prueba se
asemeja considerablemente a la prueba de medias de dos muestras. La hipótesis nula
en una prueba de dos muestras es

Ejemplo:
Se ponen a prueba la enseñanza de la estadística empleando Excel y Winstats.

Para determinar si los estudiantes difieren en términos de estar a favor de la nueva


enseñanza se toma una muestra de 20 estudiantes de dos paralelos. De paralelo A 18
están a favor, en tanto que del paralelo B están a favor 14. ¿Es posible concluir con

19
un nivel de significación de 0,05 que los estudiantes que están a favor de la nueva
enseñanza de la estadística es la misma en los dos paralelos? Los datos son:

las hipótesis son:

Calculando la proporción muestral se obtiene:

20
Ejemplo
-El siguiente valor 3.4 representa el tamaño de una tabla r.k
Determine el número de grados de libertad y obtenga el valor crítico en el nivel 0,05
se significación.
Solución:

21
-La siguiente tabla muestra las frecuencias observadas y las frecuencias esperadas al
lanzar un dado 60 veces. Contrastar la hipótesis de que el dado es bueno, con un
nivel de significación de 0,01.

Cara del dado 1 2 3 4 5 6

Frecuencia observada 6 8 9 15 14 8

Frecuencia esperada 10 10 10 10 10 10

22
DISTRIBUCIÓN CHI-CUADRADO
Sirve para someter a prueba hipótesis referidas a distribuciones de frecuencias. En
términos generales, esta prueba contrasta frecuencias observadas con las frecuencias
esperadas de acuerdo con la hipótesis nula.

Fórmula de cálculo

Nivel de significancia
Determinar si la asociación entre las variables es estadísticamente significativa
Para determinar si las variables son independientes, compare el valor p con el
nivel de significancia. Por lo general, un nivel de significancia (denotado como α o
alfa) de 0.05 funciona adecuadamente. Un nivel de significancia de 0.05 indica un
riesgo de 5% de concluir que existe una asociación entre las variables cuando no hay
una asociación real.
Valor p ≤ α: Las variables tienen una asociación estadísticamente significativa
(Rechazar H0)
Si el valor p es menor que o igual al nivel de significancia, usted rechaza la hipótesis
nula y concluye que hay una asociación estadísticamente significativa entre las
variables.
Valor p > α: No se puede concluir que las variables están asociadas (No se puede
rechazar H0)
Si el valor p es mayor que el nivel de significancia, usted no puede rechazar la
hipótesis nula, porque no hay suficiente evidencia para concluir que las variables
están asociadas.

23
Examinar las diferencias entre los conteos esperados y los conteos observados
para determinar qué niveles de las variables pueden tener el mayor impacto
sobre la asociación.
Para determinar qué niveles de las variables tienen el mayor impacto, compare los
conteos observados y esperados o examine la contribución a chi-cuadrada.
Al examinar las diferencias entre los conteos observados de celda y los conteos
esperados de celda, podrá ver qué variables tienen las mayores diferencias, lo que
podría indicar dependencia. También puede comparar las contribuciones al
estadístico de chi-cuadrada para ver qué variables tienen los valores más grandes que
podrían indicar dependencia.

Grados de libertad
Para esta prueba, los grados de libertad son el número de celdas de la tabla de dos
factores de las variables categóricas que pueden variar, dadas las restricciones de los
totales marginales de las filas y columnas. Entonces cada “observación” en este caso
es la frecuencia en una celda.
Considere el ejemplo más simple: una tabla 2 x 2, con dos categorías y dos niveles
por cada categoría:

Categoría A Total
? 6
Categoría B
15
Total 10 11 21

No importa que valores se utilizan para los totales marginales de las filas y las
columnas. Una vez que se hayan establecido estos valores, solo hay un valor de celda
que puede cambiar (mostrado aquí con un signo de interrogación, pero puede ser
cualquiera de las cuatro celdas). Una vez que ingrese un número para una celda, los
números de las otras celdas son predeterminados por los totales de las filas y las
columnas. No pueden variar libremente. De manera que la prueba de independencia
chi-cuadrada tiene solo 1 grado de libertad para una tabla 2x2.

24
Grados de libertad: regresión
los grados de libertad generalmente son iguales al número de observaciones
(elementos de información) menos el número de parámetros estimados. Cuando se
lleva a cabo una regresión, se estima un parámetro para todos los términos del
modelo, y cada uno consume un grado de libertad. Por lo tanto, incluir una cantidad
excesiva de términos en un modelo de regresión múltiple reduce los grados de
libertad disponibles para estimar la variabilidad de los parámetros. De hecho, si la
cantidad de datos no es suficiente para el número de términos en su modelo, es
posible que ni siquiera haya suficientes grados de libertad (GL) para el término de
error y no es posible calcular valores p ni valores F. Obtendrá una salida como esta:

Si esto sucede, necesita recolectar más datos (para incrementar los grados de
libertad) o quitar términos de su modelo (con el propósito de reducir el número de
grados de libertad requeridos). Entonces, los grados de libertad sí tienen efectos
reales y tangibles en el análisis de los datos, a pesar de existir en el inframundo del
dominio de un vector aleatorio.

Tabla de distribución de chi-cuadrado


0,02 0,00 0,00 0,00
0,995 0,99 0,975 0,95 0,9 0,5 0,2 0,1 0,05 0,02 0,01
5 5 2 1
1 0,0000 0,0001 0,000 0,003 0,01 0,45 1,64 2,70 3,84 5,02 5,41 6,63 7,87 9,55 10,8

25
397 57 982 93 58 5 2 6 1 4 2 5 9 0 28
0,21 1,38 3,21 4,60 5,99 7,37 7,82 9,21 10,5 12,4 13,8
2 0,0100 0,020 0,051 0,103
1 6 9 5 1 8 4 0 97 29 16
0,58 2,36 4,64 6,25 7,81 9,34 9,83 11,3 12,8 14,7 16,2
3 0,072 0,115 0,216 0,352
4 6 2 1 5 8 7 45 38 96 66
1,06 3,35 5,98 7,77 9,48 11,1 11,6 13,2 14,8 16,9 18,4
4 0,207 0,297 0,484 0,711
4 7 9 9 8 43 68 77 60 24 67
1,61 4,35 7,28 9,23 11,0 12,8 13,3 15,0 16,7 18,9 20,5
5 0,412 0,554 0,831 1,145
0 1 9 6 70 33 88 86 50 07 15
2,20 5,34 8,55 10,6 12,5 14,4 15,0 16,8 18,5 20,7 22,4
6 0,676 0,872 1,237 1,635
4 8 8 45 92 49 33 12 48 91 58
2,83 6,34 9,80 12,0 14,0 16,0 16,6 18,4 20,2 22,6 24,3
7 0,989 1,239 1,690 2,167
3 6 3 17 67 13 22 75 78 01 22
3,49 7,34 11,0 13,3 15,5 17,5 18,1 20,0 21,9 24,3 26,1
8 1,344 1,646 2,180 2,733
0 4 30 62 07 35 68 90 55 52 24
4,16 8,34 12,2 14,6 16,9 19,0 19,6 21,6 23,5 26,0 27,8
9 1,735 2,088 2,700 3,325
8 3 42 84 19 23 79 66 89 56 77
4,86 9,34 13,4 15,9 18,3 20,4 21,1 23,2 25,1 27,7 29,5
10 2,156 2,558 3,247 3,940
5 2 42 87 07 83 61 09 88 22 88
5,57 10,3 14,6 17,2 19,6 21,9 22,6 24,7 26,7 29,3 31,2
11 2,603 3,053 3,816 4,575
8 41 31 75 75 20 18 25 57 54 64
6,30 11,3 15,8 18,5 21,0 23,3 24,0 26,2 28,3 30,9 32,9
12 3,074 3,571 4,404 5,226
4 40 12 49 26 37 54 17 00 57 09
7,04 12,3 16,9 19,8 22,3 24,7 25,4 27,6 29,8 32,5 34,5
13 3,565 4,107 5,009 5,892
2 40 85 12 62 36 72 88 19 35 28
7,79 13,3 18,1 21,0 23,6 26,1 26,8 29,1 31,3 34,0 36,1
14 4,075 4,660 5,629 6,571
0 39 51 64 85 19 73 41 19 91 23
15 4,601 5,229 6,262 7,261 8,54 14,3 19,3 22,3 24,9 27,4 28,2 30,5 32,8 35,6 37,6

26
7 39 11 07 96 88 59 78 01 28 97
9,31 15,3 20,4 23,5 26,2 28,8 29,6 32,0 34,2 37,1 39,2
16 5,142 5,812 6,908 7,962
2 38 65 42 96 45 33 00 67 46 52
10,0 16,3 21,6 24,7 27,5 30,1 30,9 33,4 35,7 38,6 40,7
17 5,697 6,408 7,564 8,672
85 38 15 69 87 91 95 09 18 48 90
10,8 17,3 22,7 25,9 28,8 31,5 32,3 34,8 37,1 40,1 42,3
18 6,265 7,015 8,231 9,390
65 38 60 89 69 26 46 05 56 36 12
10,11 11,6 18,3 23,9 27,2 30,1 32,8 33,6 36,1 38,5 41,6 43,8
19 6,844 7,633 8,907
7 51 38 00 04 44 52 87 91 82 10 20
10,85 12,4 19,3 25,0 28,4 31,4 34,1 35,0 37,5 39,9 43,0 45,3
20 7,434 8,260 9,591
1 43 37 38 12 10 70 20 66 97 72 15
10,28 11,59 13,2 20,3 26,1 29,6 32,6 35,4 36,3 38,9 41,4 44,5 46,7
21 8,034 8,897
3 1 40 37 71 15 71 79 43 32 01 22 97
10,98 12,33 14,0 21,3 27,3 30,8 33,9 36,7 37,6 40,2 42,7 45,9 48,2
22 8,643 9,542
2 8 41 37 01 13 24 81 59 89 96 62 68
11,68 13,09 14,8 22,3 28,4 32,0 35,1 38,0 38,9 41,6 44,1 47,3 49,7
23 9,260 10,196
9 1 48 37 29 07 72 76 68 38 81 91 28
12,40 13,84 15,6 23,3 29,5 33,1 36,4 39,3 40,2 42,9 45,5 48,8 51,1
24 9,886 10,856
1 8 59 37 53 96 15 64 70 80 59 12 79
13,12 14,61 16,4 24,3 30,6 34,3 37,6 40,6 41,5 44,3 46,9 50,2 52,6
25 10,520 11,524
0 1 73 37 75 82 52 46 66 14 28 23 20
13,84 15,37 17,2 25,3 31,7 35,5 38,8 41,9 42,8 45,6 48,2 51,6 54,0
26 11,160 12,198
4 9 92 36 95 63 85 23 56 42 90 27 52
14,57 16,15 18,1 26,3 32,9 36,7 40,1 43,1 44,1 46,9 49,6 53,0 55,4
27 11,808 12,879
3 1 14 36 12 41 13 95 40 63 45 23 76
15,30 16,92 18,9 27,3 34,0 37,9 41,3 44,4 45,4 48,2 50,9 54,4 56,8
28 12,461 13,565
8 8 39 36 27 16 37 61 19 78 93 11 92
29 13,121 14,256 16,04 17,70 19,7 28,3 35,1 39,0 42,5 45,7 46,6 49,5 52,3 55,7 58,3

27
7 8 68 36 39 87 57 22 93 88 36 92 01
16,79 18,49 20,5 29,3 36,2 40,2 43,7 46,9 47,9 50,8 53,6 57,1 59,7
30 13,787 14,953
1 3 99 36 50 56 73 79 62 92 72 67 03
17,53 19,28 21,4 30,3 37,3 41,4 44,9 48,2 49,2 52,1 55,0 58,5 61,0
31 14,458 15,655
9 1 34 36 59 22 85 32 26 91 03 36 98
18,29 20,07 22,2 31,3 38,4 42,5 46,1 49,4 50,4 53,4 56,3 59,8 62,4
32 15,134 16,362
1 2 71 36 66 85 94 80 87 86 28 99 87
19,04 20,86 23,1 32,3 39,5 43,7 47,4 50,7 51,7 54,7 57,6 61,2 63,8
33 15,815 17,074
7 7 10 36 72 45 00 25 43 76 48 56 70
19,80 21,66 23,9 33,3 40,6 44,9 48,6 51,9 52,9 56,0 58,9 62,6 65,2
34 16,501 17,789
6 4 52 36 76 03 02 66 95 61 64 08 47
20,56 22,46 24,7 34,3 41,7 46,0 49,8 53,2 54,2 57,3 60,2 63,9 66,6
35 17,192 18,509
9 5 97 36 78 59 02 03 44 42 75 55 19
21,33 23,26 25,6 35,3 42,8 47,2 50,9 54,4 55,4 58,6 61,5 65,2 67,9
36 17,887 19,233
6 9 43 36 79 12 98 37 89 19 81 96 85
22,10 24,07 26,4 36,3 43,9 48,3 52,1 55,6 56,7 59,8 62,8 66,6 69,3
37 18,586 19,960
6 5 92 36 78 63 92 68 30 92 83 33 46
22,87 24,88 27,3 37,3 45,0 49,5 53,3 56,8 57,9 61,1 64,1 67,9 70,7
38 19,289 20,691
8 4 43 35 76 13 84 96 69 62 81 66 03
23,65 25,69 28,1 38,3 46,1 50,6 54,5 58,1 59,2 62,4 65,4 69,2 72,0
39 19,996 21,426
4 5 96 35 73 60 72 20 04 28 76 94 55
24,43 26,50 29,0 39,3 47,2 51,8 55,7 59,3 60,4 63,6 66,7 70,6 73,4
40 20,707 22,164
3 9 51 35 69 05 58 42 36 91 66 18 02
25,21 27,32 29,9 40,3 48,3 52,9 56,9 60,5 61,6 64,9 68,0 71,9 74,7
41 21,421 22,906
5 6 07 35 63 49 42 61 65 50 53 38 45
25,99 28,14 30,7 41,3 49,4 54,0 58,1 61,7 62,8 66,2 69,3 73,2 76,0
42 22,138 23,650
9 4 65 35 56 90 24 77 92 06 36 54 84
43 22,859 24,398 26,78 28,96 31,6 42,3 50,5 55,2 59,3 62,9 64,1 67,4 70,6 74,5 77,4

28
5 5 25 35 48 30 04 90 16 59 16 66 19
27,57 29,78 32,4 43,3 51,6 56,3 60,4 64,2 65,3 68,7 71,8 75,8 78,7
44 23,584 25,148
5 7 87 35 39 69 81 01 37 10 93 74 50
28,36 30,61 33,3 44,3 52,7 57,5 61,6 65,4 66,5 69,9 73,1 77,1 80,0
45 24,311 25,901
6 2 50 35 29 05 56 10 55 57 66 79 77
29,16 31,43 34,2 45,3 53,8 58,6 62,8 66,6 67,7 71,2 74,4 78,4 81,4
46 25,041 26,657
0 9 15 35 18 41 30 17 71 01 37 81 00
29,95 32,26 35,0 46,3 54,9 59,7 64,0 67,8 68,9 72,4 75,7 79,7 82,7
47 25,775 27,416
6 8 81 35 06 74 01 21 85 43 04 80 20
30,75 33,09 35,9 47,3 55,9 60,9 65,1 69,0 70,1 73,6 76,9 81,0 84,0
48 26,511 28,177
5 8 49 35 93 07 71 23 97 83 69 75 37
31,55 33,93 36,8 48,3 57,0 62,0 66,3 70,2 71,4 74,9 78,2 82,3 85,3
49 27,249 28,941
5 0 18 35 79 38 39 22 06 19 31 67 51
32,35 34,76 37,6 49,3 58,1 63,1 67,5 71,4 72,6 76,1 79,4 83,6 86,6
50 27,991 29,707
7 4 89 35 64 67 05 20 13 54 90 57 61

Regla de decisión
Una regla de decisión es un conjunto de condiciones que clasifican los registros.
La regla predice un resultado en el campo de destino.
La visualización de las reglas de decisión le ayuda a determinar qué condiciones
es más probable que generen un resultado específico. Por ejemplo, tenga en cuenta
algunas reglas de decisión hipotéticas que podrían predecir el abandono. Estas reglas
podrían identificar las clasificaciones según los rangos de edad de los clientes y el
número de reclamaciones anteriores. A partir de esas reglas, podría observar que los
clientes que no tienen ninguna reclamación o tienen sólo 1 y son clientes mayores de
50 son más propensos a abandonar.
La regla de decisión corresponde a una rama en un árbol de decisiones.

29
La aplicación de la regla de decisión de la primera manera consiste en rechazar la
Hipótesis Nula si la probabilidad de observar el estadístico de contraste es igual o
menor a la probabilidad criterio (habitualmente 0.05 o 0.01).

¿Para que se utiliza una prueba de chi cuadrado?


La prueba chi-cuadrado se utiliza para una aproximación a la distribución y así
evaluar la probabilidad de una discrepancia igual o mayor que la que exista entre los
datos y las frecuencias esperadas según la hipótesis nula.

Prueba de bondad de ajuste


La prueba de bondad de ajuste Chi-cuadrado se utiliza para comparar una muestra
recogida aleatoriamente que contiene una única variable categórica con una población
mayor.
Esta prueba se utiliza con mayor frecuencia para comparar una muestra aleatoria con
la población de la que se ha recogido potencialmente.

Prueba de independencia
La prueba de independencia de Chi-Cuadrado busca una asociación entre dos
variables categóricas dentro de la misma población.
A diferencia de la prueba de bondad de ajuste, la prueba de independencia no
compara una única variable observada con una población teórica, sino dos variables
dentro de un conjunto de muestras entre sí.

Prueba de homogeneidad
La prueba de homogeneidad de Chi-Cuadrado se organiza y ejecuta exactamente
igual que la prueba de independencia.
La principal diferencia que hay que recordar entre ambas es que la prueba de
independencia busca una asociación entre dos variables categóricas dentro de la
misma población, mientras que la prueba de homogeneidad determina si la

30
distribución de una variable es la misma en cada una de varias poblaciones
(asignando así la propia población como segunda variable categórica).

Tabla de contingencia
Una tabla de contingencia es una herramienta utilizada en la rama de la estadística,
la cual consiste en crear al menos dos filas y dos columnas para representar datos
categóricos en términos de conteos de frecuencia.
La tabla de contingencia es una de las herramientas analíticas más útiles y un pilar de
la industria de la investigación de mercados.
Ejemplo:

DISTRIBUCIÓN T-STUDENT
Es una distribución de probabilidad que surge del problema de estimar la media de
una población normalmente distribuida cuando el tamaño de la muestra es pequeño.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya
que también la podemos utilizar con muestras aleatorias de tamaño grande.
En el pasado, cuando el tamaño de la muestra era grande, esto no suponía un
problema para los estadísticos. Utilizaron la desviación típica de la muestra s como
una estimación de σ y procedieron como antes para calcular un intervalo de confianza
con resultados suficientemente cercanos. Sin embargo, los estadísticos se encontraron

31
con problemas cuando el tamaño de la muestra era pequeño. El pequeño tamaño de la
muestra provocó imprecisiones en el intervalo de confianza.

William S. Goset (1876-1937), se encontró con este problema. Sus experimentos


con lúpulo y cebada produjeron muy pocas muestras. La simple sustitución de σ por s
no produjo resultados precisos cuando intentó calcular un intervalo de confianza. Se
dio cuenta de que no podía utilizar una distribución normal para el cálculo; descubrió
que la distribución real depende del tamaño de la muestra. Este problema lo llevó a
“descubrir” lo que se llama la distribución t de Student.

Formula:

Ejercicios:
-Se aplica una prueba de autoestima a 25 personas quienes obtienen una calificación
promedio de 62.1 con una desviación estándar de 5.83. Se sabe que el valor correcto
de la prueba debe ser mayor a 60. ¿Existe suficiente evidencia para comprobar que no
hay problemas de autoestima en el grupo seleccionado?

Paso 1. Hipótesis alternativa: la que se va a comprobar. El grupo no tiene problemas


de autoestima. Valor de prueba para determinar autoestima mayor a 60. Hipótesis
nula, lo contrario a la hipótesis alternativa.

H1 > 60;
H0 =< 60.
Paso 2. Determinar el nivel de significancia alfa: alfa = 0.05.
Paso 3. Resultados de la evidencia muestral: X = 62.1; s = 5.83

32
Paso 4. Aplicar la distribución de probabilidad calculando T:

El resultado de la ecuación es 1.8. Dado que 1.8 es mayor que 1.7109 cae en la
región de H1 y se acepta la hipótesis alternativa. Si buscamos el valor de 1.8 bajo la
curva normal encontraremos que es de 0.0359 el cual es menor que 0.05. La
conclusión es que no hay problemas de autoestima en el grupo estudiado. Esto con el
diseño de la investigación presentado.

CONCLUSIÓN
La estadista podemos concluir que forma parte indispensable en amplios campos
de desarrollo como sociedad, en aplicaciones empresariales, sociales y en estudios de
mercadeo por dar algunos ejemplos, teniendo así un avance significativo, en pro de
encontrar la eficiencia y mayor exactitud en la metodología aplicada. Dichos métodos
los cuales fueron fuente de estudios en este trabajo, nos dejan evidencia del progreso
constante y marcado por encontrar la mayor exactitud en nuestros procesos
metodológicos.

33
REFERENCIAS
Muestreo (2020) [página web en línea] disponible en: https://economipedia.com/
definiciones/muestreo.html

Parra, V. (2018). Tipos de muestreo en estadística. [página web disponible]


disponible en: https://www.gestiopolis.com/tipos-de-muestreo-estadistica/

Estimadores (2013). Portal estadístico aplicada. [página web disponible] disponible


en: https://www.estadistica.net/Algoritmos2/estimadores.html

34
Coll, M. (2017). Parámetro estadístico. [página web disponible] disponible en:
https://economipedia.com/definiciones/parametro-estadistico.html

Estadística descriptiva en Edu. Flori, E. (2011). [página web disponible] disponible


en: https://sites.google.com/site/estadisticadescriptivaenedu/home/estimacion-por-
intervalos-1/propiedades-de-estimadores.

Emma, N. (2021). Ejercicios de estimación de parámetros. [página web disponible]


disponible en: https://es.scribd.com/document/514436164/Ejercicios-Estimacion-de-
Parametros#

Jesús, V.; Paola, N. & Sarah, R. Hipótesis. (2010). [página web disponible]
disponible en: https://danielvalencia21cr.wixsite.com/estadistica/blank-9

Cruz, R. (2004). Pruebas de Hipótesis para una muestra. [página web disponible]
disponible en: https://www.monografias.com/trabajos30/prueba-de-hipotesis/prueba-
de-hipotesis

Prueba de hipótesis para la varianza. (2019). [página web disponible] disponible


en: https://prezi.com/-jjhw8st_vj1/prueba-de-hipotesis-para-la-varianza/

Aplicación de la estadística. (2012). [página web disponible] disponible en:


https://estadisticaeninvestigacion.wordpress.com/distribucion-t-de-student/

35
36

También podría gustarte