Está en la página 1de 31

UNIVERSIDAD DE CARTAGENA

CREAD MAGANGUE

PROGRAMA DE ADMINTRACIÓN PÚBLICA

V SEMESTRE

ESTADISTICA INFERENCIAL

TUTOR:

GERMAN VIVANCO CASTRO

PRESENTADO POR:

KEISY ACUÑA SAMPAYO

ARGEMIRO BONILLA ZAMBRANO

YESMÍN ORDOSGOITIA PEREZ

PEDRO RODRIGUREZ SALAS

ANGIE VILLEGAS VANEGAS

MAGANGUE—BOLIVAR

2020
Tabla de contenido
1 INTRODUCCIÓN................................................................................................................3

2 OBJETIVOS.........................................................................................................................5

2.1 OBJETIVO GENERAL................................................................................................5

2.2 OBJETIVOS ESPECIFICOS........................................................................................5

3 PLANTEAMIENTO DEL PROBLEMA.............................................................................6

4 MARCO CONCEPTUAL....................................................................................................7

4.1 ESTADISTIA INFERENCIAL, REGRECIÓN LINEAL Y CORRELACIÓN...........7

4.2 VARIABLES ALEATORIAS:...................................................................................11

4.3 DISTRIBUCIÓN DE PROBABILIDAD....................................................................11

4.4 METODOLOGIA PARA LA PRUEBA DE HIPOTESIS.........................................12

4.5 HIPOTESOS NULA Y HIPOTESIS ALTERNATIVA.............................................13

4.6 ERROR TIPO I Y TIPO II..........................................................................................13

4.7 PRUEBAS PARA POBLACIONES...........................................................................13

4.8 DETERMINACON DEL TAMAÑO DE LA MUESTRA.........................................14

4.9 PRUEBA DE FISHER PARA VARIANZA DE LAS IGUALDADES.....................14

4.10 PRUEBA DE BONDAD DE AJUSTES.................................................................15

4.11 DISEÑO DE MUESTREO......................................................................................15

4.12 DISTRIBUCIONES DE MUESTREO....................................................................15

4.13 DISEÑO DE MUESTREO......................................................................................16


4.14 DISTRIBUCIONES DE MUESTREO....................................................................16

4.15 ESTIMACIÓN PUNTUAL.....................................................................................17

4.16 ESTIMACIÓN DE INTERVALO..........................................................................17

4.17 INTERVALOS DE CONFIANZA PARA MEDIAS..............................................18

4.18 INTERVALOS DE CONFIANZA PARA PROPORCIONES...............................18

4.19 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE

PROPORCIONES.....................................................................................................................18

4.20 DISEÑO FACTORIAL...........................................................................................19

4.21 CLASIFICACION DE LOS NIVELES DE DISEÑO FACTORIA.......................19

4.22 MUESTRA..............................................................................................................20

4.23 POBLACIÓN..........................................................................................................20

4.24 HIPOTESIS.............................................................................................................20

4.25 SUMATORIA..........................................................................................................22

5 METODOLOGIA...............................................................................................................25

6 PRESENTACIÓN DE RESULTADOS.............................................................................26

7 CONCLUSIONES..............................................................................................................27
1 INTRODUCCIÓN.

La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos

de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar

condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en

forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo

que permite llevar a cabo el proceso relacionado con la investigación científica. Es transversal a

una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias

de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o

instituciones gubernamentales. La estadística inferencial: se dedica a la generación de los

modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la

aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias

acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a

preguntas sí o no prueba de hipótesis, estimaciones de unas características numéricas

estimación, pronósticos de futuras observaciones, descripciones de asociación correlación o

modelamiento de relaciones entre variables análisis de regresión.

Otras técnicas de modelamiento incluyen a nova, series de tiempo y minería de datos.

La Estadística Inferencial puede dar respuesta a muchas de las necesidades que la sociedad

actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de

experimentos, con el objetivo de representar la realidad y conocerla. Permite la recolección de

datos importantes para el estudio de situaciones que se presentan a diario y permite dar

respuesta a los problemas de una forma útil y significativa. La Estadística Inferencial se centra
en tomar una pequeña muestra representativa de la población y a partir de ésta, infiere que el

resto de la población tiene el mismo comportamiento.

El hecho es que la ciencia se basa en todo aquello que se pueda constatar empíricamente, es

medible, cuantificable y se puede hacer acopio de la información para armar cuadros

estadísticos... una vez con la información acumulada resultado de diversos experimentos

verificables, se puede inferir a partir de la información estadística. En las ciencias sociales ocurre

algo semejante en tanto es con los datos que dan las encuestas que se puede armar o articular la

información estadística e inferir resultados a partir de una muestra que deberá ser

estadísticamente representativa para que resulte una verdadera inferencia. Son muchos los

fenómenos o sucesos que no tienen respuesta, es por esto que se debe realizar estudios

pertinentes que aclaren la situación que se desea analizar. Dicho estudio se logra por medio de la

experimentación constante, que muestra cada uno de los resultados que se van obteniendo con

ayuda de la estadística. Esta puede dar respuesta a muchas de las necesidades que la sociedad

actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de

experimentos, con el objetivo de representar la realidad y conocerla.


2 OBJETIVOS.

2.1 OBJETIVO GENERAL.

Hallar mediante una encuesta realizada a 100 hogares de Magangué- Bolívar la media y

desviación estándar, para así formular una hipótesis nula y alternativa comprobando una de ellas

mediante los conceptos de inferencia estadista para llegar a una conclusión.

2.2 OBJETIVOS ESPECIFICOS.

Aplicar los conocimientos adquiridos en el curso de estadística inferencial.

Hallar los interrogantes expuestos.

Formular hipótesis.

Concluir el tema mediante la solución de los ejercicios.


3 PLANTEAMIENTO DEL PROBLEMA.

Para la realización del trabajo se debe Investigar sobre los gastos promedios mensuales de 100

hogares de Magangué. A través de una encuesta recoger la información. Este número de

personas seria la población objeto de estudio. A estos datos se le debe determinar la media y la

desviación estándar, de la población objeto de estudio, escoger una muestra de 30. Con base en

lo anterior establecer una hipótesis nula y su respectiva hipótesis alternativa. Aplicar los

conceptos de inferencia estadística para comprobar dicha hipótesis. Explicar las conclusiones e

indique las recomendaciones que haría.

El trabajo se realiza con los siguientes datos, que representan los ingresos mensuales de los

100 hogares.

780000, 660000, 690000, 940000, 770000, 630000, 660000, 750000, 680000, 760000,

900000, 780000, 710000, 1010000, 780000, 430000, 590000, 670000, 610000, 710000,

960000, 750000, 640000, 760000, 720000, 770000, 740000, 650000, 820000, 860000,

660000, 860000, 960000, 890000, 810000, 710000, 850000, 990000, 590000, 920000,

680000, 720000, 770000, 600000, 870000, 840000, 750000, 770000, 510000, 450000,

850000, 670000, 870000, 800000, 840000, 930000, 690000, 760000, 890000, 750000,

830000, 680000, 720000, 670000, 920000, 890000, 820000, 960000, 770000, 1020000,

740000, 910000, 760000, 830000, 660000, 680000, 610000, 730000, 72000, 760000,

730000, 770000, 790000, 94000, 630000, 590000, 620000, 710000, 810000, 650000,

730000, 630000, 630000, 890000, 820000, 640000, 850000, 920000, 640000, 730000.
4 MARCO CONCEPTUAL.

4.1 ESTADISTIA INFERENCIAL, REGRECIÓN LINEAL Y CORRELACIÓN

Los métodos estadísticos y las técnicas de muestreo son fundamentales en el desarrollo de un

proceso de investigación en ciencias exactas, sociales o de la comunicación. Por medio de ellos

se recolectan, organizan, analizan y presentan datos para la formulación de conclusiones y la

consecuente toma de decisiones. En general, en un estudio de carácter social se desea investigar

las características que posee una población. Si es posible estudiar a todos sus miembros, se dice

que se realiza un censo; sin embargo, las más de las veces no se dispone de recursos personal,

tiempo y dinero para llevar a cabo un estudio tan amplio.

La parte de la estadística que analiza y describe a una muestra se conoce como estadística

descriptiva, mientras que a la parte de la estadística que se ocupa de generalizar al total de la

población las características obtenidas al analizar una muestra se le llama estadística inferencial.

El muestreo es, precisamente, uno de los principales aspectos a considerar en el estudio de las

pruebas de hipótesis.

Estadística Inferencial es una de las ramas de la estadística que se encarga de hacer

deducciones, es decir, que a través de métodos y procedimientos, determina propiedades,

conclusiones y tendencias de una población a partir de una muestra, es decir, se encarga de

interpretar, hacer proyecciones y comparaciones. De tal forma que crea un buen argumento para

hacer creíble la afirmación. De este modo la estadística inferencial emplea usualmente

mecanismos que le permiten llevar a cabo dichas deducciones, tales como pruebas de estimación

puntual o de intervalos de confianza, pruebas de hipótesis, pruebas paramétricas (como de

media, de diferencia de medias, proporciones, etc.) y no paramétricas.


También le son útiles los análisis de correlación y de regresión, las series cronológicas, el

análisis de varianza, entre otros .En lo que respecta en la introducción a la inferencia

estadística, se puede decir que el objetivo de la estadística que es inferir o estimar características

de una población que no es completamente observable y por ello el análisis de una parte de ella

la cual se llama muestra. Ahora bien, para considerar válidas en la población las conclusiones

obtenidas en la muestra, ésta ha de representar bien a la población. Por lo tanto, la selección de la

muestra es de suma importancia, y para ello hay diversos métodos (métodos de muestreo). La

Inferencia Estadística se puede clasificar en inferencia paramétrica e inferencia no paramétrica.

La inferencia paramétrica tiene lugar cuando se conoce la distribución de la variable de estudio

en la población, y el interés recae sobre los parámetros desconocidos de la misma. La inferencia

no paramétrica tiene lugar si no se conoce la distribución y sólo se suponen propiedades

generales de la misma.

La Teoría de la Decisión Estadística, es como esa herramienta básica para la toma de

decisiones, basadas en evidencias científicas. La manera de hacerlo es plantear las hipótesis

posibles y luego efectuarle una prueba o test estadístico, se conoce también como la docimasia

estadística. Cuando una conclusión se valida con un test estadístico de nombre tipo cuantitativo.

En caso contrario la decisión adoptada es de tipo cualitativo, o sea una decisión tomada de en

forma subjetiva, el método consiste en definir una probabilidad de aceptación del orden del 95%

de una hipótesis de trabajo planteada.

La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales

para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación

de los resultados obtenidos.


La importancia de la Teoría de la Probabilidad en el ámbito de la estadística se deriva del

hecho de constituir ésta uno de los pilares teóricos fundamentales sobre los que se asienta el

desarrollo y aplicación de la Estadística Inferencial. Así, mientras que si de una o más variables

conocemos sus características (tendencia central, dispersión, asociación) en la población, la

Teoría de la Probabilidad nos permite establecer predicciones de las características que esas

variables adoptarán en una muestra de sujetos extraída al azar de esa población, la estadística

inferencial -basándose en el conocimiento desarrollado por la Teoría de la Probabilidad en ese

camino de la población a la muestra- ha establecido las bases para trazar el camino opuesto, esto

es, inferir a partir de los datos de una muestra en una o más variables, cómo serán las

características (tendencia central, dispersión, asociación) de esas variables en la población a la

que esta muestra representa.

Cabe resaltar que la recolección de datos se refiere al uso de una gran diversidad de técnicas y

herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de

información, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observación, el

diagrama de flujo y el diccionario de datos. Retomando en lo que respecta a la Estadística

paramétrica, de esta se entiende que comprende los procedimientos estadísticos y de decisión

que están basados en distribuciones conocidas.

Estas son determinadas usando un número finito de parámetros. Esto es, por ejemplo, si

conocemos que la altura de las personas sigue una distribución normal, pero desconocemos cuál

es la media y la desviación de dicha normal. La media y la desviación típica de la distribución

normal son los dos parámetros que queremos estimar. Cuando desconocemos totalmente qué

distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico,
que nos ayude a conocer primero la distribución. La estadística paramétrica clásica plantea tres

tipos de problemas:

Estimación puntual en la que pretendemos dar un valor al parámetro a estimar, Estimación

por intervalos (buscamos un intervalo de confianza). Por otra parte para entender la Regresión

Lineal Simple, se hace necesario tener en cuenta que es un análisis de regresión, puesto que este

es el que genera una ecuación para describir la relación estadística entre uno o más predictores y

la variable de respuesta y para predecir nuevas observaciones. La regresión lineal generalmente

utiliza el método de estimación de mínimos cuadrados ordinarios, del cual se obtiene la ecuación

al minimizar la suma de los residuos al cuadrado.

Ahora bien la Regresión Lineal simple, examina la relación lineal entre dos variables

continuas: una respuesta (Y) y un predictor (X). Cuando las dos variables están relacionadas, es

posible predecir un valor de respuesta a partir de un valor predictor con una exactitud mayor que

la asociada únicamente a las probabilidades. La regresión proporciona la línea que "mejor" se

ajusta a los datos. Esta línea se puede utilizar después para:

Examinar cómo cambia la variable de respuesta a medida que cambia la variable predictor. Y

Predecir el valor de una variable de respuesta (Y) para cualquier variable predictor (X).En cuanto

a la Estimación y predicción por intervalo en regresión lineal simple, En estadística, la

probabilidad que asociamos con una estimación de intervalo se conoce como el nivel de

confianza. Esta probabilidad nos indica que tanta confianza tenemos en que la estimación del

intervalo incluya al parámetro de la población. Una probabilidad más alta significa más

confianza. El intervalo de confianza es el alcance de la estimación que estamos haciendo pero a

menudo hacemos el intervalo de confianza en términos de errores estándar.


Cabe señalar que La Regresión Lineal Múltiple examina las relaciones lineales entre una

respuesta continua y dos o más predictores. Si el número de predictores es grande, antes de

ajustar un modelo de regresión con todos los predictores, se deberían utilizar las técnicas de

selección de modelo paso a paso o de los mejores subconjuntos para excluir los predictores que

no estén asociados con las respuestas. En efecto, los Intervalos de confianza y predicción en

regresión múltiple, razonando como en el modelo de regresión lineal simple, se deben distinguir

dos problemas diferentes: Estimar la media de la distribución condicionada de Y/ = t. Esto es, se

quiere estimar el parámetro, es decir, predecir el valor de la variable respuesta en un individuo

del que se conoce que = h. Esto es, se quiere predecir un valor de la variable condicionada

Y/ = h.

4.2 VARIABLES ALEATORIAS:

Frente al concepto de variable estadística, el concepto de variable aleatoria supone contar con

información de la probabilidad asociada a cada una de las modalidades de la variable, lo cual

implica contar con datos para la población pues, en otro caso, lo que tendríamos serían

frecuencias relativas, esto es, estimaciones de las probabilidades, no las probabilidades en sí.

4.3 DISTRIBUCIÓN DE PROBABILIDAD

De una variable no suele ser conocida dado que, normalmente, no es factible contar con los

datos de todas las entidades de la población de interés para una determinada variable- Una

aproximación a la misma consiste en estimar las probabilidades correspondientes a partir de los

datos recogidos para una muestra de esa población y la aplicación de la aproximación frecuencia

lista al cálculo de probabilidades presentada antes. Otra vía de aproximación a la distribución de

probabilidad de una variable supone asumir, atendiendo a razones sustantivas o a la experiencia

práctica acumulada, que dicha variable se distribuye de acuerdo a algún modelo teórico de
características conocidas, tal como algunos de los que se presentarán en la siguiente sección.

Cuando se obtiene un índice cualquiera -por ejemplo, la media- a partir de la distribución de

probabilidad de una variable, al valor resultante se le denomina parámetro (mientras que si fuera

a partir de una distribución de frecuencias, sería un estadístico).

4.4 METODOLOGIA PARA LA PRUEBA DE HIPOTESIS

Las pruebas de hipótesis se realizan en todas las situaciones en las cuales se puede contractar

la teoría en comparación con la conservación, ejemplo: en candidato a la presidencia puede

afirmar que la mayoría de las personas que votan están de su lado, se somete a esta hipótesis a

una verificación estadística comparándola con los datos muéstrales observados, es decir que para

probar una hipótesis tomar una decisión al realizar una comparación entre la muestra observada

con respecto a la teoría. Para llevar a cabo una prueba de hipótesis es necesario tomar en cuenta

los siguientes elementos.

• Hipótesis nula Ho. Es aquella que plantea lo contrario de lo que se quiere probar

• Hipótesis alternativa Ha. Es aquella que plantea lo que se quiere probar

• Estadístico de prueba. Es una función de las mediciones, es decir es el valor calculado

mediante valores muéstrales es decir, es el valor calculado mediante valores muéstrales, este

valor sirve para tomar en una decisión estadística, dicha decisión consiste en optar si se rechaza o

no la hipótesis nula

• Nivel de significación. Se define como la probabilidad de rechazar de manera errónea la

hipótesis nula.5.

• Valor p o p-valué. Es el nivel de significación alcanzado de una prueba. Esta cantidad

representa.
4.5 HIPOTESOS NULA Y HIPOTESIS ALTERNATIVA

La hipótesis nula consiste es una afirmación acerca de la población de origen de la muestra,

usualmente es más simple que su antagonista, se designa a la hipótesis nula con el símbolo H0.

La hipótesis alternativa es igualmente una afirmación acerca de la población de origen

muchas veces, aunque no siempre, consiste simplemente en negar la afirmación de H0 la

hipótesis alternativa se designa con el símbolo H1.

4.6 ERROR TIPO I Y TIPO II

El error tipo I y error tipo II son tipos de errores que podemos cometer cuando en una

investigación estamos ante la formulación de hipótesis estadísticas como la hipótesis nula o H0 y

la hipótesis alternativa o H1. Es decir, cuando estamos realizando pruebas de hipótesis. Pero para

entender estos conceptos, primero debemos contextualizar su uso en la estimación por intervalos.

Como hemos visto, la estimación por intervalos se basa en una región crítica a partir del

parámetro de la hipótesis nula (H0) que planteamos, así como en el intervalo de confianza a

partir del estimador de la muestra.

4.7 PRUEBAS PARA POBLACIONES

Estas pruebas son adecuadas cuando los datos que se están utilizando constan de cuentas o

frecuencias, el objetivo de estas pruebas es evaluar las afirmaciones con respecto a una

proporción o porcentaje de población, estas pruebas se basan en la premisa de una proporción

muestra es decir x ocurrencias en n observaciones, o x/n será igual a la proporción verdadera de

la población si se toman imágenes o tolerancias para la variabilidad muestra.

Las pruebas salen enfocarse en la diferencia entre un numero esperado de ocurrencias

suponiendo que una afirmación verdadera y el numero observado realmente.


4.8 DETERMINACON DEL TAMAÑO DE LA MUESTRA

La determinación del tamaño muestra en una investigación es de vital importancia, tanto para

caracterizar la distribución de la variable, como para fijar el grado de precisión del estudio. El

propósito de este artículo es ofrecer ayuda en el cálculo del tamaño muestra cuando se efectúa un

estudio de carácter cuantitativo (limitado al uso de un muestreo aleatorio simple, unietápico y

fijo), en el cual se utilizan métodos estadísticos inferenciales como medios para el análisis, como

ser la estimación estadística, las pruebas de hipótesis y el análisis de experimentos, que requieren

de información precisa sobre las variables consideradas, y que es obtenida a partir de la muestra

representativa de la respectiva población.

4.9 PRUEBA DE FISHER PARA VARIANZA DE LAS IGUALDADES

A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos

valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo la estimación

intermediaste entre la estimación interna. Esta razón F fue creada por Ronald Fisher (1890-

1962), matemático británico, cuyas teorías estadísticas hicieron mucho más precisos los

experimentos científicos. Sus proyectos estadísticos, primero utilizados en biología, rápidamente

cobraron importancia y fueron aplicados a la experimentación agrícola, médica e industrial.

Fisher también contribuyó a clarificar las funciones que desempeñan la mutación y la selección

natural en la genética, particularmente en la población humana.

El valor estadístico de prueba resultante se debe comparar con un valor tabular de F, que

indicará el valor máximo del valor estadístico de prueba que ocurría si H0 fuera verdadera, a un

nivel de significación seleccionado. Antes de proceder a efectuar este cálculo, se debe considerar

las características de la distribución F.


4.10 PRUEBA DE BONDAD DE AJUSTES

Es un modelo estadístico describe lo bien que se ajusta un conjunto de observaciones, Las

medidas de bondad en general resumen la discrepancia entre los valores observados y los valores

esperados en el modelo de estudio.

4.11 DISEÑO DE MUESTREO

Es un procedimiento para conocer algunas características de la población con base en una

muestra extraída de ellos, el objetivo de un diseño es proporcionar indicaciones para la

selección de una muestra que sea representativa de la población

4.12 DISTRIBUCIONES DE MUESTREO.

Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una

población, su estudio permite calcular la posibilidad de que tiene, dada una sola muestra, de

hacerse al parámetro de la población mediante la distribución muestra se puede estimar el error

para un tamaño de muestra dado.

La distribución es considerara como una variable aleatoria, cuando se deriva de una muestra

aleatoria de tamaño se puede considerar como la distribución de la estadística para todas las

muestras posibles de la misma población de un dado tamaño, la distribución muestra depende de

la distribución subyacente de la población, la estadística que se considera el procedimiento de

muestreo empleado y el tamaño de muestra utilizado.


4.13 DISEÑO DE MUESTREO

Es un procedimiento para conocer algunas características de la población con base en una

muestra extraída de ellos, el objetivo de un diseño es proporcionar indicaciones para la selección

de una muestra que sea representativa de la población. El muestreo cuenta con ventajas las

cuales son:

Costo reducido

Mayor rapidez

Mayor posibilidad

El muestreo puede ser preciso que el censo, esto es debido a que cuando el volumen de

trabajo es reducido se puede emplear personal capacitado al cual se le puede someter a

entrenamiento intensivo.

Cuando la medición del elemento trae consigo la destrucción o deterioro del mismo

Cuando la población sea infinita o tan grande que le quede al investigador físicamente

imposible estudiar toda la población.

4.14 DISTRIBUCIONES DE MUESTREO.

Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una

población, su estudio permite calcular la posibilidad de que tiene, dada una sola muestra, de

hacerse al parámetro de la población mediante la distribución muestra se puede estimar el error

para un tamaño de muestra dado.

La distribución es considerara como una variable aleatoria, cuando se deriva de una muestra

aleatoria de tamaño se puede considerar como la distribución de la estadística para todas las

muestras posibles de la misma población de un dado tamaño, la distribución muestra depende de


la distribución subyacente de la población, la estadística que se considera el procedimiento de

muestreo empleado y el tamaño de muestra utilizado.

4.15 ESTIMACIÓN PUNTUAL.

Una estimación puntual de un parámetro poblacional es cuando se utiliza un único valor para

estimar ese parámetro, es decir, se usa un punto en concreto de la muestra para estimar el valor

deseado, cuando estimamos un parámetro de forma puntual podemos saber con certeza, cuál es

ese valor.

Ejemplo: imaginemos una población de 30 personas de las que seleccionamos una muestra de

20 para las que conocemos sus edades. Estimar de forma puntual la media de edad, sería tan

sencillo como sumar esos 20 datos y dividirlos entre el total de la muestra estadística.

4.16 ESTIMACIÓN DE INTERVALO.

Consiste el establecer el intervalo de valores donde es más probable se encuentre el perímetro,

la intención del intervalo se basa en las siguientes consideraciones.

Si conocemos la distribución muestra del estimador podemos obtener las

probabilidades de ocurrencia de los estadísticos muéstrales.

Si conociéramos el valor del parámetro poblacional, podríamos establecer la

probabilidad de que el estimador se halla dentro de los intervalos de la distribución

muestra.

El problema es que el parámetro poblacional es desconocido, y por ello es intervalo se

establece alrededor del estimador.


4.17 INTERVALOS DE CONFIANZA PARA MEDIAS.

se le llama intervalo de confianza a un par de números entre los cuales se estima que estará

cierto valor desconocido con un determinado nivel de confianza formalmente, estos números

determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido

es un parámetro poblacional , el nivel de confianza representa el porcentaje de intervalos que

tomados de 100 muestras independientes distintas contienen en realidad el valor desconocido, en

estas circunstancias α es el llamado error aleatorio nivel de significación, esto es el número de

intervalos sobre 100 que no contiene el valor.

4.18 INTERVALOS DE CONFIANZA PARA PROPORCIONES.

Es un rango de valores, derivados de los estadísticos de la muestra, que posiblemente incluya

el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria. Es poco

probable que dos muestras de una población es particular produzcan intervalos de confianza

idénticos, sin embargo su usted repitiera muchas veces su muestra, un determinado porcentaje de

los intervalos de confianza resultantes incluirá el parámetro de población desconocido.

4.19 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE PROPORCIONES.

El intervalo puede utilizarse de manera alternativa al contraste de hipótesis para decir si hay

igualdad de los grupos. Se decidirá por la igualdad de los grupos si el valor 0 queda en cualquier

posición en el intervalo, aunque se haga el contraste de proporciones, en primer lugar es

aconsejable obtener el intervalo de confianza de la diferencia de medias, si este resultado

significativo, pues que ayudara a interpretar si existe significación aplicada además de la

estadística.
4.20 DISEÑO FACTORIAL.

Un diseño factorial es utilizado generalmente por los científicos que desean comprender el

efecto de dos o más variables independientes respecto de una única variable dependiente,

estadísticamente es más fácil de manipular, sin embargo, en muchos casos dos factores pueden

ser interdependientes y es poco viable o erróneo tratar de analizar de manera tradicional.

Los investigadores sociales suelen utilizar diseño factoriales para evaluar los efectos de los

métodos de enseñanza, teniendo en cuenta la influencia de los factores socio económicos y la

experiencia, es común que en la ciencia agrarias se utilicen diseños factoriales por la necesidad

de las pruebas de campo para probar el efecto de las variables en los cultivos, en esos estudios a

gran escala, es difícil poco práctico aislar y probar cada variable individualmente.

4.21 CLASIFICACION DE LOS NIVELES DE DISEÑO FACTORIA

Existen don niveles de diseño factorial las cuales son:

Diseño factorial completo de 2 niveles que solo contienen factores de 2 niveles

Diseño factorial completo generalmente que contienen factores con más de dos niveles

El diseño factorial de dos niveles cada factor experimental tiene solo dos niveles las corridas

experimentales incluyen todas las combinaciones de estos niveles factoriales, aunque los diseños

factoriales de 2 niveles no pueden explorar completamente una amplia región del espacio de los

factores.

El diseño factorial completo se ordena con base en los signos asignados a los generadores de

diseño ejemplo: consideremos un diseño de 6 factores y 8 corridas, los generadores de diseño

son D=AB, E=AC, F=BC esto es un 1/8 de un diseño completo.


INTERACCION DE FACTORES

Aunque en el concepto de interacción entre factores en el análisis de varianza tiene un

significado teórico equivoco en la investigación empírica se produce frecuentemente errores de

interpretación que, en muchos casos, conduce a conclusiones incorrectas.

Cuando el efecto de un factor depende del nivel del otro, se puede utilizar una gráfica de

interacción para visualizar las posibles interacciones, las líneas paralelas en una gráfica indican

que no hay interacción, mientras mayor sea la diferencia en la pendiente entre las líneas, mayor

será el grado de interacción sin embargo la gráfica de interacción no avisa si la interacción es

estadísticamente significativa.

4.22 MUESTRA

Es un subconjunto de casos o individuos de una población. En diversas aplicaciones interesa

que una muestra sea, representativa y para ello debe escogerse una técnica de muestra adecuada,

que produzca una muestra aleatoria adecuada. La selección de la muestra Condición para que a

partir de la información contenida en una muestra se puedan describir las propiedades de la

población.

4.23 POBLACIÓN

En estadística, es el conjunto de individuos, objetos o fenómenos de los cuales se desea

estudiar una o varias características.

4.24 HIPOTESIS

Es una afirmación sobre un parámetro de la población y se representa con H₀. La hipótesis

nula es la afirmación de que dos parámetros o fenómenos no tienen relación entre sí.

Se puede describir formalmente los pasos a seguir:


1. Formular la hipótesis y su alternativa. Normalmente la hipótesis de trabajo (por ejemplo,

tal tratamiento es mejor que el control o tal procedimiento tiene menos morbilidad) es

contrastada con una hipótesis estadística que supone que no existe tal efecto o tal diferencia. La

razón para hacer esto es que se puede calcular de antemano la distribución de probabilidades

asociadas con tal situación. Esta hipótesis se conoce con el nombre de hipótesis nula que se

abrevia como H0 (Nullus: Nula, falto de valor y fuerza para obligar o tener efecto). La expresión

matemática es H0: 1= 2. La hipótesis alternativa es que el efecto sí existe, que es distinto de

cero, y que en algunos casos se puede especificar el signo de esa diferencia. Normalmente

corresponde a la hipótesis de trabajo, se abrevia como H1 y tiene tres alternativas: µ 1≠ µ 2, µ 1<

µ 2 o bien µ 1> µ 2.

2. Elegir la prueba estadística apropiada de acuerdo al diseño experimental, el tipo de datos

y el número de grupos que se comparan. La cifra que resulta de usar la prueba (aplicar la o las

fórmulas) en los datos recolectados se conoce como el estadístico del test en cuestión: z;

estadístico t o de Student, la r de Pearson, F del análisis de varianza, 2. La distribución del

estadístico puede ser calculada de antemano cuando la H0 es verdadera y por lo tanto conocer los

valores que delimitarán distintas porciones del área bajo la curva de esa distribución; éstas se

conocen como distribuciones de muestreo. Vale la pena decir aquí, y lo reiteraremos luego, que

las pruebas de hipótesis en ningún caso prueban la veracidad de la hipótesis alternativa de

trabajo, limitándose a decir que no hay suficiente evidencia para rechazar la hipótesis nula

basándose en un nivel preestablecido de probabilidades.


3. Elegir el nivel de significación α de la prueba, el límite para rechazar H0. En general, se

acepta α = 0,01 ó 0,05, cifras que implican un 1%, o un 5% respectivamente, de posibilidades de

equivocarse cuando se rechaza H0, de decir que hay una diferencia cuando en realidad no la hay.

Este es el llamado error tipo I.

4. Calcular el valor de P. Esta es la probabilidad de obtener los resultados observados u

otros más extremos si la H0 es verdadera, cifra que es determinada por el área de la distribución

que queda más allá del valor calculado.

5. Si p es menor que α, rechazar H0 y aceptar la alternativa; en caso contrario, se acepta la

hipótesis nula. El conjunto de valores que resultarían en el rechazo de H0 – calculados

conociendo la prueba usada, α y el número de observaciones – se conoce con el nombre de

región crítica (Figura 1). Este punto puede re frasearse así: se rechaza la H0 si el estadístico cae

en la región crítica. En los apéndices de los textos de estadística aparecen tablas con la

distribución de estos estadísticos, dando el valor de p y donde el tamaño de la muestra se

considera en los grados de libertad.

4.25 SUMATORIA

Se denota con el símbolo usándose para indicar una suma de términos.

Las distribuciones de frecuencias: son tablas en que se dispone las modalidades de la variable

por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc.

La finalidad de las agrupación en frecuencias facilitar la obtención de la información que

contienen los datos.


Muestreo probabilístico: Consiste en elegir una muestra de una población al azar. Podemos

distinguir varios tipos de muestreo:

Muestreo aleatorio simple: Para obtener una muestra, se numeran los elementos de la

población y se seleccionan al azar la n elementos que contiene la muestra.

Estimación de parámetros: Es el procedimiento utilizado para conocer las características de

un parámetro poblacional, a partir del conocimiento de la muestra.

Intervalo de confianza: Se llama así a un intervalo en el que sabemos que está un parámetro,

con un nivel de confianza específico.

Nivel de confianza: Probabilidad de que el parámetro a estimar se encuentre en el intervalo

de confianza. El nivel de confianza (p) se designa mediante 1 − α.

Estimación de la media de una población: El intervalo de confianza, para la media de una

población, con un nivel de confianza de 1 – α. siendo x la media de una muestra de tamaño n y σ

la desviación típica de la población.

Hipótesis estadísticas: Un test estadístico es un procedimiento para, a partir de una muestra

aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis

previamente emitida sobre el valor de un parámetro desconocido de una población.

La hipótesis emitida se designa por H0 y se llama hipótesis nula.

La hipótesis contraria se designa por H1 y se llama hipótesis alternativa.

Enunciar la hipótesis nula H0 y la alternativa H1.

Bilateral H0=k H1 ≠ k

Unilateral H0≥ k H1 < k

H0 ≤k H1> k
Contraste bilateral.

Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis

alternativa, por tanto, es del tipo H1: μ≠ k (o bien H1: p≠ k)

El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la

media. La región de aceptación en este caso no es más que el correspondiente intervalo de

probabilidad para x o p', es decir:

Contraste unilateral

Caso 1

La hipótesis nula es del tipo H0: μ ≥ k (o bien H0: p ≥ k).

La hipótesis alternativa, por tanto, es del tipo H1: μ < k (o bien H1: p < k).

El nivel de significación α se concentra en una parte o cola. La región de aceptación en este

caso será:

La hipótesis nula es del tipo H0: μ ≤ k (o bien H0: p ≤ k). La hipótesis alternativa, por tanto,

es del tipo H1: μ > k (o bien H1: p > k).

El nivel de significación α se concentra en la otra parte o cola. La región de aceptación en

este caso será:


5 METODOLOGIA.

Para resolver el problema expuesto es necesario conocer los gastos promedios de 100 hogares

de Magangué bolívar. Ya sabiendo cuales son estos, debemos hallar cada uno de los

interrogantes mediante investigaciones, análisis, soluciones y conclusiones. En la actualidad,

existe mucho interés en solucionar problemas públicos desde las instituciones mediante la

estadística inferencial. Uno de los problemas es el de CONOCER bien los problemas mediante

estudios confiables. De los Interrogantes surgen probables hipótesis para precisar mejor cómo

solucionar los problemas sociales como el que se plantea. La mejor información ayudará, sin

duda, a los tomadores de decisión, con esto se evita formular hipótesis falsas y conocer la

realidad aunque sea mediante una muestra.

Por tal razón pretendemos hallar y concluir el problema para desenvolvernos en nuestra área

laboral, siendo administradores públicos, responsables, capaces e inteligentes para administrar de

manera correcta los recursos pertenecientes a la sociedad.

Es importante trabajar en equipo para realizar un mejor trabajo y adquirir conocimientos

necesarios en el futuro. La estadística inferencia al igual que las demás nos brinda esa

posibilidad de poder aproximarnos a lo que puede ser y haber, de igual modo consideramos que

es un recurso y medio por el cual como profesionales nos sirve no sólo para diagnosticar y poder

tomar una decisión frente a las posibles variables que se presentan, sino también de forma

personal y demás.
6 PRESENTACIÓN DE RESULTADOS

LI -LS F FA Fr Fra X F.X ( X − X́ )2 F (X− X́ )2


43 - 51 3 3 0.03 0.03 47 141 842.1604 2,526.4812
51 – 59 3 6 0.06 0.09 55 165 441.8404 2,651.0424
59 – 67 20 26 0.26 0.35 63 1260 169.5204 3,390.408
67 – 75 24 50 0.50 0.85 71 1704 25.2004 604.8096
75 - 83 23 73 0.73 1.58 79 1871 8.8804 204.2492
83 - 91 15 88 0.88 2.46 87 1305 120.5604 1,808.406
91 - 99 10 98 0.98 3.44 95 950 360.2404 3.602.404
99 - 107 2 100 1 4.44 103 206 727.9204 1,455.8408
Total 100 7602 23,525.1744

R
1. R K= regla de sturges. A=
K
59
2. K intervalos k = 1 + 3.322 log(n) A=
8
3. A k= 7.644 A= 8

R=X mayor –X menor k=8

R=102 – 43

R= 59
X́ =
∑ F∗X = 7602 =76.02
n 100

x́=76.02 Según el problema serauna media de 760200 De ingreso mensual.

Determinamos la desviación estándar.


2

s=
√ ∑ F ( x− X́ ) = √23,525.1744 = √237.628=15.41
n−1 99

S = 15.41
7 CONCLUSIONES

También podría gustarte