Trabajo Final de Estadistica

UNIVERSIDAD DE CARTAGENA
CREAD MAGANGUE
PROGRAMA DE ADMINTRACIÓN PÚBLICA
V SEMESTRE
ESTADISTICA INFERENCIAL
TUTOR:
GERMAN VIVANCO CASTRO
PRESENTADO POR:
KEISY ACUÑA SAMPAYO
ARGEMIRO BONILLA ZAMBRANO
YESMÍN ORDOSGOITIA PEREZ
PEDRO RODRIGUREZ SALAS
ANGIE VILLEGAS VANEGAS
MAGANGUE—BOLIVAR
2020
Tabla de contenido
1 INTRODUCCIÓN................................................................................................................3
2 OBJETIVOS.........................................................................................................................5
2.1 OBJETIVO GENERAL................................................................................................5
2.2 OBJETIVOS ESPECIFICOS........................................................................................5
3 PLANTEAMIENTO DEL PROBLEMA.............................................................................6
4 MARCO CONCEPTUAL....................................................................................................7
4.1 ESTADISTIA INFERENCIAL, REGRECIÓN LINEAL Y CORRELACIÓN...........7
4.2 VARIABLES ALEATORIAS:...................................................................................11
4.3 DISTRIBUCIÓN DE PROBABILIDAD....................................................................11
4.4 METODOLOGIA PARA LA PRUEBA DE HIPOTESIS.........................................12
4.5 HIPOTESOS NULA Y HIPOTESIS ALTERNATIVA.............................................13
4.6 ERROR TIPO I Y TIPO II..........................................................................................13
4.7 PRUEBAS PARA POBLACIONES...........................................................................13
4.8 DETERMINACON DEL TAMAÑO DE LA MUESTRA.........................................14
4.9 PRUEBA DE FISHER PARA VARIANZA DE LAS IGUALDADES.....................14
4.10 PRUEBA DE BONDAD DE AJUSTES.................................................................15
4.11 DISEÑO DE MUESTREO......................................................................................15
4.12 DISTRIBUCIONES DE MUESTREO....................................................................15
4.13 DISEÑO DE MUESTREO......................................................................................16

4.14 DISTRIBUCIONES DE MUESTREO....................................................................16
4.15 ESTIMACIÓN PUNTUAL.....................................................................................17
4.16 ESTIMACIÓN DE INTERVALO..........................................................................17
4.17 INTERVALOS DE CONFIANZA PARA MEDIAS..............................................18
4.18 INTERVALOS DE CONFIANZA PARA PROPORCIONES...............................18
4.19 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE
PROPORCIONES.....................................................................................................................18
4.20 DISEÑO FACTORIAL...........................................................................................19
4.21 CLASIFICACION DE LOS NIVELES DE DISEÑO FACTORIA.......................19
4.22 MUESTRA..............................................................................................................20
4.23 POBLACIÓN..........................................................................................................20
4.24 HIPOTESIS.............................................................................................................20
4.25 SUMATORIA..........................................................................................................22
5 METODOLOGIA...............................................................................................................25
6 PRESENTACIÓN DE RESULTADOS.............................................................................26
7 CONCLUSIONES..............................................................................................................27
1 INTRODUCCIÓN.
La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos
de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar
condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en
forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo
que permite llevar a cabo el proceso relacionado con la investigación científica. Es transversal a
una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias
de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o
instituciones gubernamentales. La estadística inferencial: se dedica a la generación de los
modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la
aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias
acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas sí o no prueba de hipótesis, estimaciones de unas características numéricas
estimación, pronósticos de futuras observaciones, descripciones de asociación correlación o
modelamiento de relaciones entre variables análisis de regresión.
Otras técnicas de modelamiento incluyen a nova, series de tiempo y minería de datos.
La Estadística Inferencial puede dar respuesta a muchas de las necesidades que la sociedad
actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de
experimentos, con el objetivo de representar la realidad y conocerla. Permite la recolección de
datos importantes para el estudio de situaciones que se presentan a diario y permite dar
respuesta a los problemas de una forma útil y significativa. La Estadística Inferencial se centra
en tomar una pequeña muestra representativa de la población y a partir de ésta, infiere que el
resto de la población tiene el mismo comportamiento.
El hecho es que la ciencia se basa en todo aquello que se pueda constatar empíricamente, es
medible, cuantificable y se puede hacer acopio de la información para armar cuadros
estadísticos... una vez con la información acumulada resultado de diversos experimentos
verificables, se puede inferir a partir de la información estadística. En las ciencias sociales ocurre
algo semejante en tanto es con los datos que dan las encuestas que se puede armar o articular la
información estadística e inferir resultados a partir de una muestra que deberá ser
estadísticamente representativa para que resulte una verdadera inferencia. Son muchos los
fenómenos o sucesos que no tienen respuesta, es por esto que se debe realizar estudios
pertinentes que aclaren la situación que se desea analizar. Dicho estudio se logra por medio de la
experimentación constante, que muestra cada uno de los resultados que se van obteniendo con
ayuda de la estadística. Esta puede dar respuesta a muchas de las necesidades que la sociedad
actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de
experimentos, con el objetivo de representar la realidad y conocerla.

2 OBJETIVOS.
2.1 OBJETIVO GENERAL.
Hallar mediante una encuesta realizada a 100 hogares de Magangué- Bolívar la media y
desviación estándar, para así formular una hipótesis nula y alternativa comprobando una de ellas
mediante los conceptos de inferencia estadista para llegar a una conclusión.
2.2 OBJETIVOS ESPECIFICOS.
Aplicar los conocimientos adquiridos en el curso de estadística inferencial.
Hallar los interrogantes expuestos.
Formular hipótesis.
Concluir el tema mediante la solución de los ejercicios.

3 PLANTEAMIENTO DEL PROBLEMA.
Para la realización del trabajo se debe Investigar sobre los gastos promedios mensuales de 100
hogares de Magangué. A través de una encuesta recoger la información. Este número de
personas seria la población objeto de estudio. A estos datos se le debe determinar la media y la
desviación estándar, de la población objeto de estudio, escoger una muestra de 30. Con base en
lo anterior establecer una hipótesis nula y su respectiva hipótesis alternativa. Aplicar los
conceptos de inferencia estadística para comprobar dicha hipótesis. Explicar las conclusiones e
indique las recomendaciones que haría.
El trabajo se realiza con los siguientes datos, que representan los ingresos mensuales de los
100 hogares.
780000, 660000, 690000, 940000, 770000, 630000, 660000, 750000, 680000, 760000,
900000, 780000, 710000, 1010000, 780000, 430000, 590000, 670000, 610000, 710000,
960000, 750000, 640000, 760000, 720000, 770000, 740000, 650000, 820000, 860000,
660000, 860000, 960000, 890000, 810000, 710000, 850000, 990000, 590000, 920000,
680000, 720000, 770000, 600000, 870000, 840000, 750000, 770000, 510000, 450000,
850000, 670000, 870000, 800000, 840000, 930000, 690000, 760000, 890000, 750000,
830000, 680000, 720000, 670000, 920000, 890000, 820000, 960000, 770000, 1020000,
740000, 910000, 760000, 830000, 660000, 680000, 610000, 730000, 72000, 760000,
730000, 770000, 790000, 94000, 630000, 590000, 620000, 710000, 810000, 650000,
730000, 630000, 630000, 890000, 820000, 640000, 850000, 920000, 640000, 730000.
4 MARCO CONCEPTUAL.
4.1 ESTADISTIA INFERENCIAL, REGRECIÓN LINEAL Y CORRELACIÓN
Los métodos estadísticos y las técnicas de muestreo son fundamentales en el desarrollo de un
proceso de investigación en ciencias exactas, sociales o de la comunicación. Por medio de ellos
se recolectan, organizan, analizan y presentan datos para la formulación de conclusiones y la
consecuente toma de decisiones. En general, en un estudio de carácter social se desea investigar
las características que posee una población. Si es posible estudiar a todos sus miembros, se dice
que se realiza un censo; sin embargo, las más de las veces no se dispone de recursos personal,
tiempo y dinero para llevar a cabo un estudio tan amplio.
La parte de la estadística que analiza y describe a una muestra se conoce como estadística
descriptiva, mientras que a la parte de la estadística que se ocupa de generalizar al total de la
población las características obtenidas al analizar una muestra se le llama estadística inferencial.
El muestreo es, precisamente, uno de los principales aspectos a considerar en el estudio de las
pruebas de hipótesis.
Estadística Inferencial es una de las ramas de la estadística que se encarga de hacer
deducciones, es decir, que a través de métodos y procedimientos, determina propiedades,
conclusiones y tendencias de una población a partir de una muestra, es decir, se encarga de
interpretar, hacer proyecciones y comparaciones. De tal forma que crea un buen argumento para
hacer creíble la afirmación. De este modo la estadística inferencial emplea usualmente
mecanismos que le permiten llevar a cabo dichas deducciones, tales como pruebas de estimación
puntual o de intervalos de confianza, pruebas de hipótesis, pruebas paramétricas (como de
media, de diferencia de medias, proporciones, etc.) y no paramétricas.

También le son útiles los análisis de correlación y de regresión, las series cronológicas, el
análisis de varianza, entre otros .En lo que respecta en la introducción a la inferencia
estadística, se puede decir que el objetivo de la estadística que es inferir o estimar características
de una población que no es completamente observable y por ello el análisis de una parte de ella
la cual se llama muestra. Ahora bien, para considerar válidas en la población las conclusiones
obtenidas en la muestra, ésta ha de representar bien a la población. Por lo tanto, la selección de la
muestra es de suma importancia, y para ello hay diversos métodos (métodos de muestreo). La
Inferencia Estadística se puede clasificar en inferencia paramétrica e inferencia no paramétrica.
La inferencia paramétrica tiene lugar cuando se conoce la distribución de la variable de estudio
en la población, y el interés recae sobre los parámetros desconocidos de la misma. La inferencia
no paramétrica tiene lugar si no se conoce la distribución y sólo se suponen propiedades
generales de la misma.
La Teoría de la Decisión Estadística, es como esa herramienta básica para la toma de
decisiones, basadas en evidencias científicas. La manera de hacerlo es plantear las hipótesis
posibles y luego efectuarle una prueba o test estadístico, se conoce también como la docimasia
estadística. Cuando una conclusión se valida con un test estadístico de nombre tipo cuantitativo.
En caso contrario la decisión adoptada es de tipo cualitativo, o sea una decisión tomada de en
forma subjetiva, el método consiste en definir una probabilidad de aceptación del orden del 95%
de una hipótesis de trabajo planteada.
La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales
para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación
de los resultados obtenidos.

La importancia de la Teoría de la Probabilidad en el ámbito de la estadística se deriva del
hecho de constituir ésta uno de los pilares teóricos fundamentales sobre los que se asienta el
desarrollo y aplicación de la Estadística Inferencial. Así, mientras que si de una o más variables
conocemos sus características (tendencia central, dispersión, asociación) en la población, la
Teoría de la Probabilidad nos permite establecer predicciones de las características que esas
variables adoptarán en una muestra de sujetos extraída al azar de esa población, la estadística
inferencial -basándose en el conocimiento desarrollado por la Teoría de la Probabilidad en ese
camino de la población a la muestra- ha establecido las bases para trazar el camino opuesto, esto
es, inferir a partir de los datos de una muestra en una o más variables, cómo serán las
características (tendencia central, dispersión, asociación) de esas variables en la población a la
que esta muestra representa.
Cabe resaltar que la recolección de datos se refiere al uso de una gran diversidad de técnicas y
herramientas que pueden ser utilizadas por el analista para desarrollar los sistemas de
información, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observación, el
diagrama de flujo y el diccionario de datos. Retomando en lo que respecta a la Estadística
paramétrica, de esta se entiende que comprende los procedimientos estadísticos y de decisión
que están basados en distribuciones conocidas.
Estas son determinadas usando un número finito de parámetros. Esto es, por ejemplo, si
conocemos que la altura de las personas sigue una distribución normal, pero desconocemos cuál
es la media y la desviación de dicha normal. La media y la desviación típica de la distribución
normal son los dos parámetros que queremos estimar. Cuando desconocemos totalmente qué
distribución siguen nuestros datos entonces deberemos aplicar primero un test no paramétrico,
que nos ayude a conocer primero la distribución. La estadística paramétrica clásica plantea tres
tipos de problemas:
Estimación puntual en la que pretendemos dar un valor al parámetro a estimar, Estimación
por intervalos (buscamos un intervalo de confianza). Por otra parte para entender la Regresión
Lineal Simple, se hace necesario tener en cuenta que es un análisis de regresión, puesto que este
es el que genera una ecuación para describir la relación estadística entre uno o más predictores y
la variable de respuesta y para predecir nuevas observaciones. La regresión lineal generalmente
utiliza el método de estimación de mínimos cuadrados ordinarios, del cual se obtiene la ecuación
al minimizar la suma de los residuos al cuadrado.
Ahora bien la Regresión Lineal simple, examina la relación lineal entre dos variables
continuas: una respuesta (Y) y un predictor (X). Cuando las dos variables están relacionadas, es
posible predecir un valor de respuesta a partir de un valor predictor con una exactitud mayor que
la asociada únicamente a las probabilidades. La regresión proporciona la línea que "mejor" se
ajusta a los datos. Esta línea se puede utilizar después para:
Examinar cómo cambia la variable de respuesta a medida que cambia la variable predictor. Y
Predecir el valor de una variable de respuesta (Y) para cualquier variable predictor (X).En cuanto
a la Estimación y predicción por intervalo en regresión lineal simple, En estadística, la
probabilidad que asociamos con una estimación de intervalo se conoce como el nivel de
confianza. Esta probabilidad nos indica que tanta confianza tenemos en que la estimación del
intervalo incluya al parámetro de la población. Una probabilidad más alta significa más
confianza. El intervalo de confianza es el alcance de la estimación que estamos haciendo pero a
menudo hacemos el intervalo de confianza en términos de errores estándar.

Cabe señalar que La Regresión Lineal Múltiple examina las relaciones lineales entre una
respuesta continua y dos o más predictores. Si el número de predictores es grande, antes de
ajustar un modelo de regresión con todos los predictores, se deberían utilizar las técnicas de
selección de modelo paso a paso o de los mejores subconjuntos para excluir los predictores que
no estén asociados con las respuestas. En efecto, los Intervalos de confianza y predicción en
regresión múltiple, razonando como en el modelo de regresión lineal simple, se deben distinguir
dos problemas diferentes: Estimar la media de la distribución condicionada de Y/ = t. Esto es, se
quiere estimar el parámetro, es decir, predecir el valor de la variable respuesta en un individuo
del que se conoce que = h. Esto es, se quiere predecir un valor de la variable condicionada
Y/ = h.
4.2 VARIABLES ALEATORIAS:
Frente al concepto de variable estadística, el concepto de variable aleatoria supone contar con
información de la probabilidad asociada a cada una de las modalidades de la variable, lo cual
implica contar con datos para la población pues, en otro caso, lo que tendríamos serían
frecuencias relativas, esto es, estimaciones de las probabilidades, no las probabilidades en sí.
4.3 DISTRIBUCIÓN DE PROBABILIDAD
De una variable no suele ser conocida dado que, normalmente, no es factible contar con los
datos de todas las entidades de la población de interés para una determinada variable- Una
aproximación a la misma consiste en estimar las probabilidades correspondientes a partir de los
datos recogidos para una muestra de esa población y la aplicación de la aproximación frecuencia
lista al cálculo de probabilidades presentada antes. Otra vía de aproximación a la distribución de
probabilidad de una variable supone asumir, atendiendo a razones sustantivas o a la experiencia
práctica acumulada, que dicha variable se distribuye de acuerdo a algún modelo teórico de
características conocidas, tal como algunos de los que se presentarán en la siguiente sección.
Cuando se obtiene un índice cualquiera -por ejemplo, la media- a partir de la distribución de
probabilidad de una variable, al valor resultante se le denomina parámetro (mientras que si fuera
a partir de una distribución de frecuencias, sería un estadístico).
4.4 METODOLOGIA PARA LA PRUEBA DE HIPOTESIS
Las pruebas de hipótesis se realizan en todas las situaciones en las cuales se puede contractar
la teoría en comparación con la conservación, ejemplo: en candidato a la presidencia puede
afirmar que la mayoría de las personas que votan están de su lado, se somete a esta hipótesis a
una verificación estadística comparándola con los datos muéstrales observados, es decir que para
probar una hipótesis tomar una decisión al realizar una comparación entre la muestra observada
con respecto a la teoría. Para llevar a cabo una prueba de hipótesis es necesario tomar en cuenta
los siguientes elementos.
• Hipótesis nula Ho. Es aquella que plantea lo contrario de lo que se quiere probar
• Hipótesis alternativa Ha. Es aquella que plantea lo que se quiere probar
• Estadístico de prueba. Es una función de las mediciones, es decir es el valor calculado
mediante valores muéstrales es decir, es el valor calculado mediante valores muéstrales, este
valor sirve para tomar en una decisión estadística, dicha decisión consiste en optar si se rechaza o
no la hipótesis nula
• Nivel de significación. Se define como la probabilidad de rechazar de manera errónea la
hipótesis nula.5.
• Valor p o p-valué. Es el nivel de significación alcanzado de una prueba. Esta cantidad
representa.
4.5 HIPOTESOS NULA Y HIPOTESIS ALTERNATIVA
La hipótesis nula consiste es una afirmación acerca de la población de origen de la muestra,
usualmente es más simple que su antagonista, se designa a la hipótesis nula con el símbolo H0.
La hipótesis alternativa es igualmente una afirmación acerca de la población de origen
muchas veces, aunque no siempre, consiste simplemente en negar la afirmación de H0 la
hipótesis alternativa se designa con el símbolo H1.
4.6 ERROR TIPO I Y TIPO II
El error tipo I y error tipo II son tipos de errores que podemos cometer cuando en una
investigación estamos ante la formulación de hipótesis estadísticas como la hipótesis nula o H0 y
la hipótesis alternativa o H1. Es decir, cuando estamos realizando pruebas de hipótesis. Pero para
entender estos conceptos, primero debemos contextualizar su uso en la estimación por intervalos.
Como hemos visto, la estimación por intervalos se basa en una región crítica a partir del
parámetro de la hipótesis nula (H0) que planteamos, así como en el intervalo de confianza a
partir del estimador de la muestra.
4.7 PRUEBAS PARA POBLACIONES
Estas pruebas son adecuadas cuando los datos que se están utilizando constan de cuentas o
frecuencias, el objetivo de estas pruebas es evaluar las afirmaciones con respecto a una
proporción o porcentaje de población, estas pruebas se basan en la premisa de una proporción
muestra es decir x ocurrencias en n observaciones, o x/n será igual a la proporción verdadera de
la población si se toman imágenes o tolerancias para la variabilidad muestra.
Las pruebas salen enfocarse en la diferencia entre un numero esperado de ocurrencias
suponiendo que una afirmación verdadera y el numero observado realmente.

4.8 DETERMINACON DEL TAMAÑO DE LA MUESTRA
La determinación del tamaño muestra en una investigación es de vital importancia, tanto para
caracterizar la distribución de la variable, como para fijar el grado de precisión del estudio. El
propósito de este artículo es ofrecer ayuda en el cálculo del tamaño muestra cuando se efectúa un
estudio de carácter cuantitativo (limitado al uso de un muestreo aleatorio simple, unietápico y
fijo), en el cual se utilizan métodos estadísticos inferenciales como medios para el análisis, como
ser la estimación estadística, las pruebas de hipótesis y el análisis de experimentos, que requieren
de información precisa sobre las variables consideradas, y que es obtenida a partir de la muestra
representativa de la respectiva población.
4.9 PRUEBA DE FISHER PARA VARIANZA DE LAS IGUALDADES
A diferencia de otras pruebas de medias que se basan en la diferencia existente entre dos
valores, el análisis de varianza emplea la razón de las estimaciones, dividiendo la estimación
intermediaste entre la estimación interna. Esta razón F fue creada por Ronald Fisher (1890-
1962), matemático británico, cuyas teorías estadísticas hicieron mucho más precisos los
experimentos científicos. Sus proyectos estadísticos, primero utilizados en biología, rápidamente
cobraron importancia y fueron aplicados a la experimentación agrícola, médica e industrial.
Fisher también contribuyó a clarificar las funciones que desempeñan la mutación y la selección
natural en la genética, particularmente en la población humana.
El valor estadístico de prueba resultante se debe comparar con un valor tabular de F, que
indicará el valor máximo del valor estadístico de prueba que ocurría si H0 fuera verdadera, a un
nivel de significación seleccionado. Antes de proceder a efectuar este cálculo, se debe considerar
las características de la distribución F.

4.10 PRUEBA DE BONDAD DE AJUSTES
Es un modelo estadístico describe lo bien que se ajusta un conjunto de observaciones, Las
medidas de bondad en general resumen la discrepancia entre los valores observados y los valores
esperados en el modelo de estudio.
4.11 DISEÑO DE MUESTREO
Es un procedimiento para conocer algunas características de la población con base en una
muestra extraída de ellos, el objetivo de un diseño es proporcionar indicaciones para la
selección de una muestra que sea representativa de la población
4.12 DISTRIBUCIONES DE MUESTREO.
Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una
población, su estudio permite calcular la posibilidad de que tiene, dada una sola muestra, de
hacerse al parámetro de la población mediante la distribución muestra se puede estimar el error
para un tamaño de muestra dado.
La distribución es considerara como una variable aleatoria, cuando se deriva de una muestra
aleatoria de tamaño se puede considerar como la distribución de la estadística para todas las
muestras posibles de la misma población de un dado tamaño, la distribución muestra depende de
la distribución subyacente de la población, la estadística que se considera el procedimiento de
muestreo empleado y el tamaño de muestra utilizado.

4.13 DISEÑO DE MUESTREO
Es un procedimiento para conocer algunas características de la población con base en una
muestra extraída de ellos, el objetivo de un diseño es proporcionar indicaciones para la selección
de una muestra que sea representativa de la población. El muestreo cuenta con ventajas las
cuales son:
Costo reducido
Mayor rapidez
Mayor posibilidad
El muestreo puede ser preciso que el censo, esto es debido a que cuando el volumen de
trabajo es reducido se puede emplear personal capacitado al cual se le puede someter a
entrenamiento intensivo.
Cuando la medición del elemento trae consigo la destrucción o deterioro del mismo
Cuando la población sea infinita o tan grande que le quede al investigador físicamente
imposible estudiar toda la población.
4.14 DISTRIBUCIONES DE MUESTREO.
Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una
población, su estudio permite calcular la posibilidad de que tiene, dada una sola muestra, de
hacerse al parámetro de la población mediante la distribución muestra se puede estimar el error
para un tamaño de muestra dado.
La distribución es considerara como una variable aleatoria, cuando se deriva de una muestra
aleatoria de tamaño se puede considerar como la distribución de la estadística para todas las
muestras posibles de la misma población de un dado tamaño, la distribución muestra depende de

la distribución subyacente de la población, la estadística que se considera el procedimiento de
muestreo empleado y el tamaño de muestra utilizado.
4.15 ESTIMACIÓN PUNTUAL.
Una estimación puntual de un parámetro poblacional es cuando se utiliza un único valor para
estimar ese parámetro, es decir, se usa un punto en concreto de la muestra para estimar el valor
deseado, cuando estimamos un parámetro de forma puntual podemos saber con certeza, cuál es
ese valor.
Ejemplo: imaginemos una población de 30 personas de las que seleccionamos una muestra de
20 para las que conocemos sus edades. Estimar de forma puntual la media de edad, sería tan
sencillo como sumar esos 20 datos y dividirlos entre el total de la muestra estadística.
4.16 ESTIMACIÓN DE INTERVALO.
Consiste el establecer el intervalo de valores donde es más probable se encuentre el perímetro,
la intención del intervalo se basa en las siguientes consideraciones.
Si conocemos la distribución muestra del estimador podemos obtener las
probabilidades de ocurrencia de los estadísticos muéstrales.
Si conociéramos el valor del parámetro poblacional, podríamos establecer la
probabilidad de que el estimador se halla dentro de los intervalos de la distribución
muestra.
El problema es que el parámetro poblacional es desconocido, y por ello es intervalo se
establece alrededor del estimador.

4.17 INTERVALOS DE CONFIANZA PARA MEDIAS.
se le llama intervalo de confianza a un par de números entre los cuales se estima que estará
cierto valor desconocido con un determinado nivel de confianza formalmente, estos números
determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido
es un parámetro poblacional , el nivel de confianza representa el porcentaje de intervalos que
tomados de 100 muestras independientes distintas contienen en realidad el valor desconocido, en
estas circunstancias α es el llamado error aleatorio nivel de significación, esto es el número de
intervalos sobre 100 que no contiene el valor.
4.18 INTERVALOS DE CONFIANZA PARA PROPORCIONES.
Es un rango de valores, derivados de los estadísticos de la muestra, que posiblemente incluya
el valor de un parámetro de población desconocido. Debido a su naturaleza aleatoria. Es poco
probable que dos muestras de una población es particular produzcan intervalos de confianza
idénticos, sin embargo su usted repitiera muchas veces su muestra, un determinado porcentaje de
los intervalos de confianza resultantes incluirá el parámetro de población desconocido.
4.19 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE PROPORCIONES.
El intervalo puede utilizarse de manera alternativa al contraste de hipótesis para decir si hay
igualdad de los grupos. Se decidirá por la igualdad de los grupos si el valor 0 queda en cualquier
posición en el intervalo, aunque se haga el contraste de proporciones, en primer lugar es
aconsejable obtener el intervalo de confianza de la diferencia de medias, si este resultado
significativo, pues que ayudara a interpretar si existe significación aplicada además de la
estadística.
4.20 DISEÑO FACTORIAL.
Un diseño factorial es utilizado generalmente por los científicos que desean comprender el
efecto de dos o más variables independientes respecto de una única variable dependiente,
estadísticamente es más fácil de manipular, sin embargo, en muchos casos dos factores pueden
ser interdependientes y es poco viable o erróneo tratar de analizar de manera tradicional.
Los investigadores sociales suelen utilizar diseño factoriales para evaluar los efectos de los
métodos de enseñanza, teniendo en cuenta la influencia de los factores socio económicos y la
experiencia, es común que en la ciencia agrarias se utilicen diseños factoriales por la necesidad
de las pruebas de campo para probar el efecto de las variables en los cultivos, en esos estudios a
gran escala, es difícil poco práctico aislar y probar cada variable individualmente.
4.21 CLASIFICACION DE LOS NIVELES DE DISEÑO FACTORIA
Existen don niveles de diseño factorial las cuales son:
Diseño factorial completo de 2 niveles que solo contienen factores de 2 niveles
Diseño factorial completo generalmente que contienen factores con más de dos niveles
El diseño factorial de dos niveles cada factor experimental tiene solo dos niveles las corridas
experimentales incluyen todas las combinaciones de estos niveles factoriales, aunque los diseños
factoriales de 2 niveles no pueden explorar completamente una amplia región del espacio de los
factores.
El diseño factorial completo se ordena con base en los signos asignados a los generadores de
diseño ejemplo: consideremos un diseño de 6 factores y 8 corridas, los generadores de diseño
son D=AB, E=AC, F=BC esto es un 1/8 de un diseño completo.

INTERACCION DE FACTORES
Aunque en el concepto de interacción entre factores en el análisis de varianza tiene un
significado teórico equivoco en la investigación empírica se produce frecuentemente errores de
interpretación que, en muchos casos, conduce a conclusiones incorrectas.
Cuando el efecto de un factor depende del nivel del otro, se puede utilizar una gráfica de
interacción para visualizar las posibles interacciones, las líneas paralelas en una gráfica indican
que no hay interacción, mientras mayor sea la diferencia en la pendiente entre las líneas, mayor
será el grado de interacción sin embargo la gráfica de interacción no avisa si la interacción es
estadísticamente significativa.
4.22 MUESTRA
Es un subconjunto de casos o individuos de una población. En diversas aplicaciones interesa
que una muestra sea, representativa y para ello debe escogerse una técnica de muestra adecuada,
que produzca una muestra aleatoria adecuada. La selección de la muestra Condición para que a
partir de la información contenida en una muestra se puedan describir las propiedades de la
población.
4.23 POBLACIÓN
En estadística, es el conjunto de individuos, objetos o fenómenos de los cuales se desea
estudiar una o varias características.
4.24 HIPOTESIS
Es una afirmación sobre un parámetro de la población y se representa con H₀. La hipótesis
nula es la afirmación de que dos parámetros o fenómenos no tienen relación entre sí.
Se puede describir formalmente los pasos a seguir:

1. Formular la hipótesis y su alternativa. Normalmente la hipótesis de trabajo (por ejemplo,
tal tratamiento es mejor que el control o tal procedimiento tiene menos morbilidad) es
contrastada con una hipótesis estadística que supone que no existe tal efecto o tal diferencia. La
razón para hacer esto es que se puede calcular de antemano la distribución de probabilidades
asociadas con tal situación. Esta hipótesis se conoce con el nombre de hipótesis nula que se
abrevia como H0 (Nullus: Nula, falto de valor y fuerza para obligar o tener efecto). La expresión
matemática es H0: 1= 2. La hipótesis alternativa es que el efecto sí existe, que es distinto de
cero, y que en algunos casos se puede especificar el signo de esa diferencia. Normalmente
corresponde a la hipótesis de trabajo, se abrevia como H1 y tiene tres alternativas: µ 1≠ µ 2, µ 1<
µ 2 o bien µ 1> µ 2.
2. Elegir la prueba estadística apropiada de acuerdo al diseño experimental, el tipo de datos
y el número de grupos que se comparan. La cifra que resulta de usar la prueba (aplicar la o las
fórmulas) en los datos recolectados se conoce como el estadístico del test en cuestión: z;
estadístico t o de Student, la r de Pearson, F del análisis de varianza, 2. La distribución del
estadístico puede ser calculada de antemano cuando la H0 es verdadera y por lo tanto conocer los
valores que delimitarán distintas porciones del área bajo la curva de esa distribución; éstas se
conocen como distribuciones de muestreo. Vale la pena decir aquí, y lo reiteraremos luego, que
las pruebas de hipótesis en ningún caso prueban la veracidad de la hipótesis alternativa de
trabajo, limitándose a decir que no hay suficiente evidencia para rechazar la hipótesis nula
basándose en un nivel preestablecido de probabilidades.

3. Elegir el nivel de significación α de la prueba, el límite para rechazar H0. En general, se
acepta α = 0,01 ó 0,05, cifras que implican un 1%, o un 5% respectivamente, de posibilidades de
equivocarse cuando se rechaza H0, de decir que hay una diferencia cuando en realidad no la hay.
Este es el llamado error tipo I.
4. Calcular el valor de P. Esta es la probabilidad de obtener los resultados observados u
otros más extremos si la H0 es verdadera, cifra que es determinada por el área de la distribución
que queda más allá del valor calculado.
5. Si p es menor que α, rechazar H0 y aceptar la alternativa; en caso contrario, se acepta la
hipótesis nula. El conjunto de valores que resultarían en el rechazo de H0 – calculados
conociendo la prueba usada, α y el número de observaciones – se conoce con el nombre de
región crítica (Figura 1). Este punto puede re frasearse así: se rechaza la H0 si el estadístico cae
en la región crítica. En los apéndices de los textos de estadística aparecen tablas con la
distribución de estos estadísticos, dando el valor de p y donde el tamaño de la muestra se
considera en los grados de libertad.
4.25 SUMATORIA
Se denota con el símbolo usándose para indicar una suma de términos.
Las distribuciones de frecuencias: son tablas en que se dispone las modalidades de la variable
por filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc.
La finalidad de las agrupación en frecuencias facilitar la obtención de la información que
contienen los datos.

Muestreo probabilístico: Consiste en elegir una muestra de una población al azar. Podemos
distinguir varios tipos de muestreo:
Muestreo aleatorio simple: Para obtener una muestra, se numeran los elementos de la
población y se seleccionan al azar la n elementos que contiene la muestra.
Estimación de parámetros: Es el procedimiento utilizado para conocer las características de
un parámetro poblacional, a partir del conocimiento de la muestra.
Intervalo de confianza: Se llama así a un intervalo en el que sabemos que está un parámetro,
con un nivel de confianza específico.
Nivel de confianza: Probabilidad de que el parámetro a estimar se encuentre en el intervalo
de confianza. El nivel de confianza (p) se designa mediante 1 − α.
Estimación de la media de una población: El intervalo de confianza, para la media de una
población, con un nivel de confianza de 1 – α. siendo x la media de una muestra de tamaño n y σ
la desviación típica de la población.
Hipótesis estadísticas: Un test estadístico es un procedimiento para, a partir de una muestra
aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis
previamente emitida sobre el valor de un parámetro desconocido de una población.
La hipótesis emitida se designa por H0 y se llama hipótesis nula.
La hipótesis contraria se designa por H1 y se llama hipótesis alternativa.
Enunciar la hipótesis nula H0 y la alternativa H1.
Bilateral H0=k H1 ≠ k
Unilateral H0≥ k H1 < k
H0 ≤k H1> k
Contraste bilateral.
Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis
alternativa, por tanto, es del tipo H1: μ≠ k (o bien H1: p≠ k)
El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la
media. La región de aceptación en este caso no es más que el correspondiente intervalo de
probabilidad para x o p', es decir:
Contraste unilateral
Caso 1
La hipótesis nula es del tipo H0: μ ≥ k (o bien H0: p ≥ k).
La hipótesis alternativa, por tanto, es del tipo H1: μ < k (o bien H1: p < k).
El nivel de significación α se concentra en una parte o cola. La región de aceptación en este
caso será:
La hipótesis nula es del tipo H0: μ ≤ k (o bien H0: p ≤ k). La hipótesis alternativa, por tanto,
es del tipo H1: μ > k (o bien H1: p > k).
El nivel de significación α se concentra en la otra parte o cola. La región de aceptación en
este caso será:

5 METODOLOGIA.
Para resolver el problema expuesto es necesario conocer los gastos promedios de 100 hogares
de Magangué bolívar. Ya sabiendo cuales son estos, debemos hallar cada uno de los
interrogantes mediante investigaciones, análisis, soluciones y conclusiones. En la actualidad,
existe mucho interés en solucionar problemas públicos desde las instituciones mediante la
estadística inferencial. Uno de los problemas es el de CONOCER bien los problemas mediante
estudios confiables. De los Interrogantes surgen probables hipótesis para precisar mejor cómo
solucionar los problemas sociales como el que se plantea. La mejor información ayudará, sin
duda, a los tomadores de decisión, con esto se evita formular hipótesis falsas y conocer la
realidad aunque sea mediante una muestra.
Por tal razón pretendemos hallar y concluir el problema para desenvolvernos en nuestra área
laboral, siendo administradores públicos, responsables, capaces e inteligentes para administrar de
manera correcta los recursos pertenecientes a la sociedad.
Es importante trabajar en equipo para realizar un mejor trabajo y adquirir conocimientos
necesarios en el futuro. La estadística inferencia al igual que las demás nos brinda esa
posibilidad de poder aproximarnos a lo que puede ser y haber, de igual modo consideramos que
es un recurso y medio por el cual como profesionales nos sirve no sólo para diagnosticar y poder
tomar una decisión frente a las posibles variables que se presentan, sino también de forma
personal y demás.
6 PRESENTACIÓN DE RESULTADOS
LI -LS F FA Fr Fra X F.X ( X − X́ )2 F (X− X́ )2

43 - 51 3 3 0.03 0.03 47 141 842.1604 2,526.4812
51 – 59 3 6 0.06 0.09 55 165 441.8404 2,651.0424
59 – 67 20 26 0.26 0.35 63 1260 169.5204 3,390.408
67 – 75 24 50 0.50 0.85 71 1704 25.2004 604.8096
75 - 83 23 73 0.73 1.58 79 1871 8.8804 204.2492
83 - 91 15 88 0.88 2.46 87 1305 120.5604 1,808.406
91 - 99 10 98 0.98 3.44 95 950 360.2404 3.602.404
99 - 107 2 100 1 4.44 103 206 727.9204 1,455.8408
Total 100 7602 23,525.1744
R
1. R K= regla de sturges. A=
K
59
2. K intervalos k = 1 + 3.322 log(n) A=
8
3. A k= 7.644 A= 8
R=X mayor –X menor k=8
R=102 – 43
R= 59
X́ =
∑ F∗X = 7602 =76.02
n 100
x́=76.02 Según el problema serauna media de 760200 De ingreso mensual.
Determinamos la desviación estándar.

2
s=
√ ∑ F ( x− X́ ) = √23,525.1744 = √237.628=15.41
n−1 99
S = 15.41
7 CONCLUSIONES

Trabajo Final de Estadistica

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Trabajo Final de Estadistica

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE CARTAGENA

PROGRAMA DE ADMINTRACIÓN PÚBLICA

GERMAN VIVANCO CASTRO

KEISY ACUÑA SAMPAYO

ARGEMIRO BONILLA ZAMBRANO

YESMÍN ORDOSGOITIA PEREZ

PEDRO RODRIGUREZ SALAS

ANGIE VILLEGAS VANEGAS

2.1 OBJETIVO GENERAL................................................................................................5

2.2 OBJETIVOS ESPECIFICOS........................................................................................5

3 PLANTEAMIENTO DEL PROBLEMA.............................................................................6

4.1 ESTADISTIA INFERENCIAL, REGRECIÓN LINEAL Y CORRELACIÓN...........7

4.2 VARIABLES ALEATORIAS:...................................................................................11

4.3 DISTRIBUCIÓN DE PROBABILIDAD....................................................................11

4.4 METODOLOGIA PARA LA PRUEBA DE HIPOTESIS.........................................12

4.5 HIPOTESOS NULA Y HIPOTESIS ALTERNATIVA.............................................13

4.6 ERROR TIPO I Y TIPO II..........................................................................................13

4.7 PRUEBAS PARA POBLACIONES...........................................................................13

4.8 DETERMINACON DEL TAMAÑO DE LA MUESTRA.........................................14

4.9 PRUEBA DE FISHER PARA VARIANZA DE LAS IGUALDADES.....................14

4.10 PRUEBA DE BONDAD DE AJUSTES.................................................................15

4.11 DISEÑO DE MUESTREO......................................................................................15

4.12 DISTRIBUCIONES DE MUESTREO....................................................................15

4.13 DISEÑO DE MUESTREO......................................................................................16

4.15 ESTIMACIÓN PUNTUAL.....................................................................................17

4.16 ESTIMACIÓN DE INTERVALO..........................................................................17

4.17 INTERVALOS DE CONFIANZA PARA MEDIAS..............................................18

4.18 INTERVALOS DE CONFIANZA PARA PROPORCIONES...............................18

4.19 INTERVALOS DE CONFIANZA PARA DIFERENCIAS ENTRE

4.20 DISEÑO FACTORIAL...........................................................................................19

4.21 CLASIFICACION DE LOS NIVELES DE DISEÑO FACTORIA.......................19

condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en

instituciones gubernamentales. La estadística inferencial: se dedica a la generación de los

modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la

preguntas sí o no prueba de hipótesis, estimaciones de unas características numéricas

estimación, pronósticos de futuras observaciones, descripciones de asociación correlación o

modelamiento de relaciones entre variables análisis de regresión.

Otras técnicas de modelamiento incluyen a nova, series de tiempo y minería de datos.

experimentos, con el objetivo de representar la realidad y conocerla. Permite la recolección de

resto de la población tiene el mismo comportamiento.

medible, cuantificable y se puede hacer acopio de la información para armar cuadros

estadísticos... una vez con la información acumulada resultado de diversos experimentos

experimentos, con el objetivo de representar la realidad y conocerla.

2.1 OBJETIVO GENERAL.

mediante los conceptos de inferencia estadista para llegar a una conclusión.

2.2 OBJETIVOS ESPECIFICOS.

Aplicar los conocimientos adquiridos en el curso de estadística inferencial.

Hallar los interrogantes expuestos.

Concluir el tema mediante la solución de los ejercicios.

hogares de Magangué. A través de una encuesta recoger la información. Este número de

indique las recomendaciones que haría.

4.1 ESTADISTIA INFERENCIAL, REGRECIÓN LINEAL Y CORRELACIÓN

Los métodos estadísticos y las técnicas de muestreo son fundamentales en el desarrollo de un

proceso de investigación en ciencias exactas, sociales o de la comunicación. Por medio de ellos

se recolectan, organizan, analizan y presentan datos para la formulación de conclusiones y la

consecuente toma de decisiones. En general, en un estudio de carácter social se desea investigar

tiempo y dinero para llevar a cabo un estudio tan amplio.

descriptiva, mientras que a la parte de la estadística que se ocupa de generalizar al total de la

Estadística Inferencial es una de las ramas de la estadística que se encarga de hacer

deducciones, es decir, que a través de métodos y procedimientos, determina propiedades,

conclusiones y tendencias de una población a partir de una muestra, es decir, se encarga de

hacer creíble la afirmación. De este modo la estadística inferencial emplea usualmente

puntual o de intervalos de confianza, pruebas de hipótesis, pruebas paramétricas (como de