Está en la página 1de 7

Estadística Descriptiva e

Inferencial
Conferencia 6
El primer paso en cualquier investigación estadística consiste en
“explorar” o “describir” los datos recolectados. Este proceso puede ser
útil incluso para depurar errores. Además se pretende dar una visión
general de la inferencia estadística, más concretamente, de la teoría de
estimación de parámetros.

Msc. P.Aux. Carlos Alberto Villanueva Ramos


11/10/2015
Prof. MSc. Carlos A. Villanueva Ramos
Departamento de Matemática, UCLV
carlosv@uclv.edu.cu
villanueva@nauta.cu

ESTADÍSTICA
Ingeniería Civil

Conferencia 6: Estadística Descriptiva e Inferencial.


Sumario
 Introducción a la Estadística Descriptiva.
 Distribución de frecuencias para VA discretas.
 Distribución de frecuencias para VA continuas.
 Medidas de posición y dispersión.
 El concepto de muestra.
 Estimación puntual.
 Estimación por intervalos de confianza.

Bibliografía
1. Miller I. R. y otros (2000) “Probabilidad y Estadística para Ingenieros”, Editorial Félix Varela, pp. 8 –
32.
2. Guerra C. W. y otros. (1987). “Estadística”, Editorial Pueblo y Educación, pp. 33 – 52.

Introducción
El primer paso en cualquier investigación estadística consiste en “explorar” o “describir” los datos
recolectados. Este proceso puede ser útil incluso para depurar errores.
La estadística está catalogada por varios autores como un instrumento imprescindible para la toma de
decisiones en escenarios de incertidumbre. Ella se divide en dos grandes grupos: estadística descriptiva y
estadística inferencial.
Además esta conferencia se pretende dar una visión general de la inferencia estadística, más concretamente,
de la teoría de estimación de parámetros.

Desarrollo
Estadística Descriptiva y distribución de frecuencias

Estadística Descriptiva: rama de la estadística que se ocupa de describir y caracterizar un grupo de datos sin
sacar conclusiones o inferencias sobre un grupo de datos mayor.

Datos primarios: datos que no han pasado por ningún tipo de procesamiento.

Ejemplos:
1. Conjunto de estaturas de 100 estudiantes de Ingeniería Mecánica.
2. Diagnóstico de un conjunto de pacientes que asisten a la consulta X de cierto hospital psiquiátrico, (1.-
retardo mental, 2.-mentalmente enfermo, 3.- físicamente enfermo).
3. Cantidad de barcos que llegan diariamente al puerto de La Habana.

Distribución de frecuencias: procedimiento mediante el cual se ordenan los datos primarios.

Distribución de frecuencias para variables aleatorias discretas


Prof. MSc. Carlos A. Villanueva Ramos
Departamento de Matemática, UCLV
carlosv@uclv.edu.cu
villanueva@nauta.cu
Suponga que se observan por 20 días la cantidad de barcos que llegan a un puerto.

Los datos pueden ordenarse, en forma de tabla, de la siguiente manera:

Valores Frecuencias Frecuencias absolutas Frecuencias Frecuencias relativas


xi ni acumuladas relativas acumuladas
Ni fi Fi
0 2 2 0.10 0.10
1 2 4 0.10 0.20
2 4 8 0.20 0.40
3 5 13 0.25 0.65
4 5 18 0.25 0.90
5 2 20 0.10 1.00
Total 20 1.00

Esta tabla se conoce como Tabla de frecuencias o Distribución de frecuencias, en este caso para datos
primarios de una variable aleatoria discreta.
Las frecuencias relativas constituyen una medida empírica de las probabilidades asociadas a cada valor de xi,
éstas también pueden ser representadas en por cientos.

Pueden construirse gráficos asociados a las tablas de distribución de frecuencias, como pudiera ser el
histograma de frecuencias absolutas.

6
5 5
5
4
4
3
2 2 2
2
1
0
1 2 3 4 5 6

Distribución de frecuencias para variables aleatorias continuas

Supongamos ahora que tenemos las notas (0 - 100) de 50 estudiantes de la enseñanza media.
Los datos pueden ordenarse de la siguiente manera:

Clases Marca de Frecuencias Frecuencias Frecuencias Frecuencias


clases ni acumuladas relativas relativas
di Ni fi acumuladas
Fi
[50,60] 55 5 5 0.10 0.10
(60,70] 65 10 15 0.20 0.30
(70,80] 75 25 40 0.50 0.80
(80,90] 85 8 48 0.16 0.96
(90,100] 95 2 50 0.04 1.00
Total 50 1.00

Criterios para seleccionar las clases

En ocasiones el investigador tiene conocimientos a priori sobre la cantidad de clases que deben crearse, en
estos casos no hay problemas con la selección de las clases. Cuando no se tiene una idea concebida acerca
del número de intervalos en los que se va a dividir la muestra se recomienda utilizar la fórmula:
Prof. MSc. Carlos A. Villanueva Ramos
Departamento de Matemática, UCLV
carlosv@uclv.edu.cu
villanueva@nauta.cu

k  1 3.322 log n donde n es el tamaño de la muestra


10
Esta fórmula para la cantidad k de clases la propuso el estadístico H. A. Sturges, en 1926.
Al igual que con las variables aleatorias discretas pueden hacerse gráficos como los anteriores para el caso
continuo.

La Media Aritmética

Definición:
La media aritmética (promedio aritmético) de un conjunto x1, x2,…, xn de n valores de una variable X se define
como:

( ) ∑

La media aritmética es un punto de equilibrio del conjunto de valores. Muy a menudo se denota por ̅ .

Cuando los datos están agrupados en tablas de frecuencias y son discretos organizados en m clases, la
expresión de cálculo de la media se transforma en:

( ) ∑

Si los datos son de tipo continuo la expresión es la misma con la sustitución de xi por las marcas de clases di.

La Varianza

Definición:
La varianza de un conjunto x1, x2,…, xn de valores de una variable X se define como:

( ) ∑( ̅)

Si los datos vienen expresados en forma agrupada y son discretos, la varianza se calcula de la siguiente
forma:

[ ] ∑ ( [ ])

Para datos agrupados continuos, la varianza viene expresada:

[ ] ∑ ( ̅) ̅ ∑

ESTADÍSTICA INFERENCIAL

El concepto de muestra

Supóngase que se quiere estudiar un conjunto de objetos homogéneos respecto a cierto índice cualitativo o
cuantitativo que los caracteriza. Por ejemplo, si se tiene un grupo de estudiantes, el índice cualitativo puede
ser el sexo y el índice cuantitativo puede ser el índice académico.

A veces se realiza una investigación total, es decir, se examina cada uno de los objetos del conjunto respecto
al índice que interesa. En otros casos esto no es posible, por ejemplo, porque el conjunto es muy grande o
infinito o por ejemplo, porque el estudio lleva implícito un conjunto considerable de gastos materiales o la
destrucción del objeto de estudio. En estos casos se escogen fortuitamente del total un número limitado de
objetos y se someten éstos al estudio. A este subconjunto se le llama conjunto muestral o simplemente
muestra y se asocia con el conjunto general o población de la cual se extrae.
Prof. MSc. Carlos A. Villanueva Ramos
Departamento de Matemática, UCLV
carlosv@uclv.edu.cu
villanueva@nauta.cu

Los conceptos de muestra y población son relativos. Por ejemplo, si se decide trabajar con todos los
estudiantes de un grupo, puede considerarse todavía que esto es una muestra de un conjunto más general,
digamos, los resultados posibles de un grupo abstracto de estudiantes con condiciones similares.

Si se está estudiando una variable aleatoria X, una muestra de volumen n consiste simplemente de cualquier
subconjunto de n valores: x1, x2, x3,..., xn de X.

Existen distintos métodos de selección de una muestra. A la selección de muestras se dedica de hecho, toda
una rama de la estadística denominada Teoría de Muestreo o Muestreo Estadístico.

Para procesos tecnológicos es muy común la determinación de muestras aleatorias simples a partir de los
elementos que conforman una población.

Estimación estadística de los parámetros de una distribución a partir de los datos de una muestra

Sea X una variable aleatoria con cierta distribución F(x) dependiendo de ciertos parámetros (los parámetros
pueden ser la esperanza matemática, la dispersión, u otros)

Una de las técnicas de Estadísticas de aplicación más frecuente tiene como objetivo determinar los
parámetros de la distribución a partir del análisis de muestras. Esta rama de la Estadística se conoce como
Teoría de la Estimación.

La estimación puede hacerse de dos tipos:


1. estimación puntual
2. estimación por intervalos

Estimación por Intervalos de Confianza

El objetivo de la estimación puntual es seleccionar un valor individual como una estimación “buena” de un
parámetro poblacional desconocido  .Por muchas propiedades deseables que cumpla el estimador, es muy
poco probable que su valor coincida exactamente con el verdadero valor del parámetro  .

Además no es posible establecer ningún juicio acerca de la probabilidad del error a la precisión de la
estimación realizada. Esta idea constituye el objetivo fundamental de una estimación por intervalos.

Intervalo de confianza para la media poblacional con varianza poblacional conocida de una población
con distribución normal

Sea X una variable aleatoria con distribución normal ( ) y sea además una muestra aleatoria simple

El intervalo de confianza para cuando se conoce el valor de es:

( ̅ ̅ )
√ √

Donde:

̅: estimador puntual de
: desviación típica poblacional conocida.
: tamaño de la muestra.
: percentil correspondiente a la distribución normal estandarizada.
: nivel crítico, de forma tal que
Prof. MSc. Carlos A. Villanueva Ramos
Departamento de Matemática, UCLV
carlosv@uclv.edu.cu
villanueva@nauta.cu
Intervalo de confianza para la media poblacional con varianza poblacional desconocida de una
población con distribución normal

Sea X una variable aleatoria con distribución normal ( ) y sea además una muestra aleatoria simple

El intervalo de confianza para cuando se desconoce el valor de es:

( ̅ ( ) ̅ ( ) )
√ √

Donde:

̅: estimador puntual de
S: desviación típica muestral.
: tamaño de la muestra.
( - ): percentil correspondiente a la distribución T – Student con n grados de libertad.
: nivel crítico, de forma tal que

Intervalo de confianza para la varianza poblacional de una población con distribución normal

Sea X una variable aleatoria con distribución normal ( ) y sea además una muestra aleatoria simple

El intervalo de confianza para es:

( ) ( )
( )
( ) ( )

Donde:

: estimador puntual de .
: tamaño de la muestra.
( ), ( ) percentiles correspondientes a la distribución Chi – Cuadrado.

Ejemplo:
Se desea determinar un intervalo de confianza del 95% para la estatura promedio de los estudiantes de la carrera
Ingeniería Civil. Para ello se determina una muestra aleatoria simple de 20 estudiantes y se determinó una
estatura promedio de 1.69 m con una varianza de 0.44.

En este ejemplo se desea construir un intervalo de confianza para la media poblacional con varianza
poblacional desconocida.

Para ello:

( ) ( )

Luego, en virtud de la expresión que determina el intervalo de confianza solicitado, se tiene:


Prof. MSc. Carlos A. Villanueva Ramos
Departamento de Matemática, UCLV
carlosv@uclv.edu.cu
villanueva@nauta.cu

( ̅ ( ) ̅ ( ) )
√ √

( ( ) ( ) )
√ √
( )

Claramente, el intervalo para la estatura promedio debe ser:

( )

También podría gustarte