Está en la página 1de 17

ESTADISTICA APLICADA Y

PRONOSTICO.

Campus Coacalco.

PROF: Enoc Azkenazi Florentino


Lopez.

“PROYECTO.”

ALUMNO: Tellez Perez Neri Ariel.


Ing. Industrial y Sistemas
10095212

000045334@alumnos.icel.edu.mx
En la actualidad la Estadística se ha constituido en una herramienta importante en
los procesos de investigación, puesto que permite planear la investigación,
recolectar, organizar, representar, interpretar y analizar la información referente a
individuos u observaciones de un fenómeno al cual se le estudian ..

La estadística resulta fundamental para conocer el comportamiento de ciertos


eventos, por lo que ha adquirido un papel clave en la investigación. Se usa como
un valioso auxiliar y en los diferentes campos del conocimiento y en las variadas
ciencias. Es un lenguaje que permite comunicar información basada en datos
cuantitativos.

Es tan importante que casi no existe actividad humana en que no esté involucrada
la Estadística. Las decisiones más importantes de nuestra vida se toman con base
en la aplicación de la Estadística. Pongamos algunos ejemplos.

La estadística es de gran importancia en la investigación científica debido a que:

 Permite una descripción más exacta.


 Nos obliga a ser claros y exactos en nuestros procedimientos y en nuestro
pensar.
   Permite resumir los resultados de manera significativa y cómoda.
  Nos permite deducir conclusiones generales.

La evolución de la estadística ha llegado al punto en que su proyección se percibe


en casi todas las áreas de trabajo. También abarca la recolección, presentación y
caracterización de información para ayudar tanto en el análisis e interpretación de
datos como en el proceso de la toma de decisiones. La estadística es parte
esencial de la forma profesional, es hasta cierto punto una parte necesaria para
toda profesión.  
Las medidas de tendencia central, son herramientas utilizadas para 
medir estadísticas cuyo objetivo es resumir en un solo valor a un conjunto de
valores, y de esta manera representar un centro en al cual se deben encontrar
ubicados en conjunto los datos. Existe varias medidas de tendencia central, sin
embargo, las más utilizadas son: media, mediana y moda, otras como las
medidas de dispersión, por ejemplo. Que se encargan de medir el grado de
dispersión que se produce entre los valores de una variable. Por lo tanto, cuando
nos preguntamos ¿Para qué sirven las medidas de tendencia central? ya podemos
tener una pequeña idea.

Fundamentalmente podemos encontrar cuatro tipos, los cuales describen de


manera puntual y cuantitativa la posición que dan los valores de las variables a
través o a lo largo del recorrido, y así demuestran el para qué sirven las medidas
de tendencia central, a continuación, te mencionamos las medidas más usadas.
 Media
 Media aritmética.
 Mediana.
 Moda.

En las curvas de frecuencias unimodales que son ligeramente sesgadas


(asimétricas), se tiene la relación empírica siguiente:
𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑜𝑑𝑎 = 3 𝑚𝑒𝑑𝑖𝑎 − 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
En una distribución simétrica el valor de la media aritmética, la mediana y la moda
coinciden. (Murray R. & J. Stephens, 2009)
Relación Empírica entre Media, Mediana y Moda.

Relación Empírica entre Media, Mediana y Moda.


En una distribución simétrica el valor de la media aritmética, la mediana y la moda
coinciden. (Murray R. & J. Stephens, 2009)

Conclusiones La media, mediana y moda son medidas de tendencia central, las


cuales reciben el nombre de valor promedio. Por lo tanto, estas mediciones son
conocidas comúnmente como promedios, y cada uno presenta un perspectiva
diferente sobre los valores que representan. Pero cada promedio es considerado
válido, correcto e informativo.

Varianza.
La varianza y la desviación estándar son medidas de dispersión o variabilidad, es
decir, indican la dispersión o separación de un conjunto de datos. Hay que tener
en cuenta que las fórmulas de la varianza y la desviación estándar son diferentes
para una muestra que para una población.

A continuación, presentamos el resumen de fórmulas

Varianza de la población (σ2)

La varianza se define como la media aritmética de los cuadrados de las


diferencias de los datos con su media aritmética. 

Desviación estándar de la población (σ)

La desviación estándar es la raíz cuadrada positiva de la varianza.


Te recomendamos calcular primero la varianza de la población y luego sacar su
raíz cuadrada para obtener la desviación estándar.

Ten en cuenta que, si tienes una serie de valores de una población y necesitas
calcular su varianza y su desviación estándar, deberás calcular primero la media
poblacional µ con la siguiente fórmula:

Varianza de la muestra (s2)

La fórmula de la varianza de la muestra es diferente a la de varianza de la


población.

Desviación estándar de la muestra (s)

Recuerda que la desviación estándar es la raíz cuadrada positiva de la varianza.

Te recomendamos calcular primero la varianza de la muestra y luego sacar su raíz


cuadrada para obtener la desviación estándar.
Ten en cuenta que, si tienes una serie de valores de una muestra y necesitas
calcular su varianza y su desviación estándar, deberás calcular primero la media
poblacional x̄ con la siguiente fórmula:

En los ejercicios, se siguen los siguientes pasos:

1. Se calcula la media.

2. Se calcula la varianza.

3. Se calcula la desviación estándar, que es la raíz cuadrada positiva de la


varianza.

Calcular la varianza y la desviación estándar de los siguientes datos: 2, 4, 6 y 8


sabiendo que corresponden a una población.

Solución:
Nos indican que estos datos forman una población, por lo tanto, usaremos las
fórmulas de varianza y desviación estándar para la población, teniendo en cuenta
que tenemos 4 datos, es decir, N = 4.
Empezamos calculando la media poblacional:

Ahora calculamos la varianza poblacional:


El valor de la varianza poblacional, es de 5.

Ahora calculamos la desviación estándar, teniendo en cuenta que es la raíz


cuadrada de la varianza.
Tabla Gauss.

La distribución normal es la más famosa de todas. La importancia de esta


distribución radica en que permite modelar numerosos fenómenos naturales,
sociales y psicológicos. Además, es la base del análisis estadístico, ya que en ella
se sustenta casi toda la inferencia estadística. 

Esta distribución también se conoce como distribución de Gauss o distribución


gaussiana. La gráfica de la distribución normal tiene la forma de una campana, por
este motivo la gráfica también es conocida como la campana de Gauss.

La distribución normal con media   y desviación estándar  , a veces denotada


como  , tiene las siguientes propiedades:

1 Es una distribución simétrica respecto a la media  .

2La media y la mediana son iguales a la media  .

3 En el intervalo   se encuentran el   de los datos.

4En el intervalo   se encuentran el   de los datos.

5En el intervalo   se encuentran el   de los datos.

Cuando   y  ,  , la distribución se conoce


como distribución normal estándar. En este caso, las propiedades son:
 

1 Es una distribución simétrica respecto al origen  .

2La media y la mediana son iguales a cero.

3En el intervalo   se encuentran el   de los datos.

4En el intervalo   se encuentran el   de los datos.

5En el intervalo   se encuentran el   de los datos.

Dada una variable aleatoria normal  , siempre podemos estandarizar


(crear una variable aleatoria con distribución normal estándar) con el cambio de
variable dado por

entonces se cumple que  .

 
Tabla de probabilidad de la distribución normal estándar

La siguiente tabla nos da las probabilidades de  .

Estas probabilidades nos dan la función de distribución  .

Búsqueda en la tabla de valor de k

Unidades y décimas en la columna de la izquierda.

Céntesimas en la fila de arriba.

 
Ejemplo:

Ejemplo:

 
Naturaleza de la t-Student

La t de Student, inicialmente se diseñó para examinar las diferencias entre dos


muestras independientes y pequeñas que tengan distribución normal y
homogeneidad en sus varianzas (en el artículo original, el autor no define qué es
una muestra grande y/o pequeña). Gosset hace hincapié en la normalidad de las
dos muestras como crucial en el desarrollo de la prueba.

Metodología de la t-Student

1. Probar que cada una de las muestras tiene una distribución normal; ‡ 2. Obtener
para cada una de las muestras: a) el tamaño de las muestras (n 1 y n2), b) sus
respectivas medias (m1 y m2), c) sus varianzas (v1 y v2); 3. Probar que las
varianzas sean homogéneas;

‡‡
4. En caso de homogeneidad en esas varianzas: a) establecer la diferencia entre
las medias: m1-m2, b) calcular la varianza común de las dos muestras.

vc = ((n1-1)v1 + (n2-1)v2)/(n1 + n2 - 2)

Es decir, la varianza común (vc) es igual a un promedio pesado de las varianzas


de las dos muestras en donde los pesos para ese promedio son iguales al tamaño,
menos uno (n-1) para cada una de las muestras, c) con esa varianza común, se
calcula el error estándar de la diferencia de las medias ESM= √ ((vc) (n 1 +
n2)/(n1n2)); 5. Finalmente, la t-Student es igual al cociente de la diferencia de
medias entre el ESM anterior; 6. De acuerdo con nuestra hipótesis nula y alterna
se debe demostrar que existe diferencia entre las medias de las muestras, se
consulta una tabla de t-Student con grado de libertad igual a n1 + n2-2 y se calcula
el valor de P.5

Ejemplo
De un universo de 44,000 niños, a los que se les registró el peso, talla e índice de
masa corporal, se tomó una muestra de 56 adolescentes (21 niñas y 35 niños), del
subgrupo de niñas y niños de 14 años de edad, para comparar las medias
tomando exclusivamente el índice de masa corporal (IMC).

IMC en niñas y niños de 14 años de edad

Paso 1: prueba de normalidad de cada una de las muestras.

Paso 2: en este caso se hace la prueba t-test aun sabiendo que una de las
muestras (los niños) no tiene normalidad.

Paso 3: prueba para la homogeneidad de varianzas; se pueden considerar que


son homogéneas debido a que la p = 0.570.

Paso 4: (i) diferencia de medias = 0.025, (ii) vc a las muestras.

 
 

(iii) Error estándar de las diferencias de las medias

Paso 5: el valor de la t-test será:

 
 

Paso 6: hipótesis:

Ho: el IMC es igual en niños y niñas.

H1: El IMC es diferente entre los niños y las niñas.

Los grados de libertad, para consultar la tabla de t-Student son 21 + 35-2 = 54,
consultando el valor de p es 0.401.

Por lo tanto, no existe diferencia entre el IMC entre los niños y niñas de 14 años.
La estadística consiste en métodos, procedimientos y fórmulas que permiten
recolectar información para luego analizarla y extraer de ella conclusiones
relevantes. Se puede decir que es la Ciencia de los Datos y que su principal objetivo
es mejorar la comprensión de los hechos a partir de la información disponible.

También podría gustarte