Está en la página 1de 23

UTN-Ingeniera Electrnica IEL-813. Probabilidad y Estadstica Prof. Ing.

Larissa Barrantes Parra

Fundamentos de la Estadstica

La estadstica recoge, ordena y analiza datos para estudiar las caractersticas o el comportamiento de un colectivo.
Es el conjunto de mtodos cientficos ligados a la toma,

organizacin, recopilacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones como para tomar decisiones razonables de acuerdo con tales anlisis.

Ejemplos de estudios estadsticos:


Opinin de los costarricenses sobre el TLC. El color favorito de los alumnos de una clase. Nmero de goles marcados por los equipos de ftbol de Primera

Divisin. Estatura de los alumnos de la clase de BD de la ECCI.

Fundamentos de la estadstica
Terminologa

estadstica:

Poblacin: Conjunto de todos los elementos que

cumplen una determinada caracterstica. Conjunto de todos los valores de una variable aleatoria. Los elementos de la poblacin se llaman individuos o unidades estadsticas. Muestra: Cualquier subconjunto de la poblacin. Carcter estadstico: Es una propiedad que permite clasificar a los individuos de una poblacin. Se distinguen dos tipos:
Cuantitativos: Son aquellos que se pueden medir. Cualitativos: Son aquellos que no se pueden medir.

Variable estadstica: Es el aspecto que se va a

estudiar. Si se puede medir se llama variable cuantitativa si no se pueden medir se llama variable cualitativa.

Fundamentos de la Estadstica

La variable estadstica es una propiedad caracterstica de la poblacin que estamos interesados en estudiar.
Tipos de variables estadsticas:
Cualitativa: No se expresa mediante un nmero. Por

ejemplo, la opinin de los costarricenses sobre el TLC. Cuantitativa: Se expresa mediante un nmero, hay dos tipos:
Cuantitativa Discreta: Slo admite valores aislados, toma un nmero

determinado de valores. Por ejemplo, el nmero de goles marcados por los equipos de ftbol de Primera Divisin. Cuantitativa Continua: Puede admitir cualquier valor dentro de un intervalo, puede tomar cualquier valor entre los valores dados. Por ejemplo, la estatura de los alumnos de la clase de Proba de la IE.

Fundamentos de la Estadstica

Una variable resultado de produce el caracterizada condicin.

no aleatoria (asociada al una experiencia que s mismo resultado) est por un valor para cada

Una variable aleatoria est caracterizada por la llamada funcin densidad de probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles valores para cada condicin.

Fundamentos de la Estadstica

Los objetivos se pueden entender en trminos de encontrar y describir las variables de inters y las relaciones entre ellas, para el problema en estudio. La estadstica es la ciencia que estudia los mtodos que permiten realizar este proceso para variables aleatorias, y se divide en dos reas:
Estadstica descriptiva: Trata de describir las variables

aleatorias en las muestras. Estadstica inductiva o inferencial: Trata de la generalizacin hacia las poblaciones de los resultados obtenidos en las muestras y de las condiciones bajo las cuales estas conclusiones son vlidas.

Fundamentos de Estadstica
Notemos entonces que para analizar una poblacin utilizamos la estadstica descriptiva y para analizar una muestra se utiliza la estadstica inferencial.

Ejemplo:
Poblacin (Estadstica descriptiva) Todos los estudiantes de un colegio Todos los profesores de Costa Rica Los huevos producidos en una granja Todos los libros de la biblioteca Los estudiantes que viajan en bus Muestra (Estadstica inferencial) Estudiantes de octavo ao de ese colegio Los profesores de este colegio Los huevos producidos hoy en esa granja Los libros de matemtica de esa biblioteca Los estudiantes con beca de transporte

Papel de la Probabilidad

La probabilidad permite cuantificar la fuerza o confianza en las conclusiones.


Las conclusiones se pueden resumir en una declaracin de

probabilidad o valor P.

El puente entre los datos y la conclusin est basado en los fundamentos de la inferencia estadstica, la teora de la distribucin y las distribuciones de muestreos. Es importante prestar atencin a las medidas de posicin y variabilidad de la muestra.
Tanto el anlisis exploratorio o intuitivo de datos como la

inferencia estadstica formal dependen de estas medidas.

Medidas de Posicin

Las medidas de posicin en un conjunto de datos estn diseadas para proporcionar al analista alguna medida cuantitativa de dnde el centro de los datos en una muestra. Una medida usada es la moda de la muestra; esta medida se asocia al valor ms comn, ms tpico o que ocurre ms frecuentemente; se puede definir formalmente como el valor al cual corresponde la mayor frecuencia.
La principal limitacin est en el hecho de que requiere un

nmero suficiente de observaciones para que se manifieste o se defina ms claramente. En algunos casos puede no existir, no estar definida; e incluso si existe puede no ser nica. Esta medida se aplica a variables cualitativas y cuantitativas.

Medidas de Posicin

Una medida obvia y muy til es la media de la muestra (media aritmtica). La media es simplemente un promedio numrico. Suponga que las observaciones en una muestra son x1, x2, , xn. Entonces, la media simple de la muestra es

Medidas de Posicin

Suponga que las observaciones en una muestra se agrupan en x1, x2, , xky c/u tiene una frecuencia f1, f2, , fk. Entonces, la media ponderada de la muestra es

Medidas de Posicin

Otra medida importante es la mediana de la muestra, el propsito de esta medida es reflejar la tendencia central de la muestra de manera que no est influida por los valores extremos.
Se puede definir como el valor central de una serie de

variables estadsticas ordenadas.

Dado que las observaciones de una muestra son x1, x2, , xn, acomodados en orden creciente de magnitud, la mediana de la muestra es

Medidas de Posicin

Ejemplo: Supongamos que el conjunto de datos es 1.7, 2.2, 3.9, 3.11 y 14.7.
La moda, la media y la mediana de la

muestra son:

Medidas de Posicin

La media est influida de manera considerable por la presencia de la observacin extrema, mientras que la mediana hace nfasis en el verdadero centro del conjunto de datos. Las propiedades de la media son:
Si se multiplica la media por el nmero de observaciones

se obtiene la suma de las observaciones. Si a cada una de las observaciones se le resta la media, y luego se suman sus desviaciones (o diferencias) la suma resulta igual a 0. Si se suma (o se resta) una constante b a cada una de las observaciones, el promedio queda aumentado (o disminuido) en esa constante b. Si se multiplica (o se divide) cada una de las observaciones por una constante b, el promedio queda multiplicado (o dividido) por esa constante b.

Medidas de Variabilidad

La variabilidad de una muestra juega un papel muy importante en el anlisis de datos.


La variabilidad de un proceso y de un producto es un

hecho real en los sistemas cientficos y de ingeniera. La variabilidad en valores de poblacin y datos de una muestra es un hecho real.

Una variabilidad grande entre las observaciones de una muestra a menudo puede limpiar cualquier efecto que el ingeniero puede tratar de detectar. Las medidas de posicin en una muestra no proporcionan un resumen apropiado de la naturaleza de un conjunto de datos.

Medidas de Variabilidad

Al igual que hay muchas medidas de tendencia central o de posicin, hay muchas medidas de dispersin o variabilidad. Una de las ms simples es el rango de la muestra (recorrido o amplitud), el cual puede ser muy til sobre control estadstico de calidad. max min
Valores mnimo y mximo de una variable estadstica. Aprecia la variabilidad al considerar los valores extremos de

la muestra. Otra forma de dar el rango de la muestra es decir: recorrido xmin a xmax.

Medidas de Variabilidad

La ms utilizada es la desviacin estndar de la muestra. Supongamos que lo valores de una muestra son x1, x2, , xn, la desviacin estndar es:

Medida estadstica que muestra que tan dispersos estn

los valores en una coleccin de datos. Trmino estadstico que mide la desviacin de los datos de una muestra o de una poblacin respecto a su valor medio. Indica cunto se alejan, en promedio, las observaciones de la media del conjunto.

Medidas de Variabilidad

La varianza de la muestra se calcula como:

Medida estadstica que muestra la variabilidad de un

valor; a mayor varianza, mayores variaciones con respecto al promedio y en consecuencia, mayor volatilidad. Es la media de las diferencias al cuadrado de n puntuaciones respecto a su media aritmtica.

Una variabilidad grande en un conjunto de datos produce valores relativamente grandes de y por ello una varianza de la muestra grande.

Medidas de Variabilidad

La cantidad n1 a menudo se denomina grados de libertad asociados con la varianza estimada. Los grados de libertad representan el nmero de piezas de informacin independientes disponibles para calcular la variabilidad.

Medidas de Variabilidad

Suponga que las observaciones en una muestra se agrupan en x1, x2, , xny c/u tiene una frecuencia f1, f2, , fn. Entonces, la desviacin estndar y la varianza de la muestra son:

Medidas de Variabilidad

Ejemplo: Supongamos que se tiene el conjunto de datos es 5, 17, 6 y 4.


El promedio de la muestra es:
La varianza de la muestra y la desviacin estndar de la muestra

son:

Medidas de Variabilidad

En el ejemplo anterior, las cantidades dentro de los parntesis suman cero:

Entonces, el clculo de una varianza de la muestra no implica n desviaciones cuadradas independientes de la media . De hecho, como el valor de est determinado por los primeros n1 valores, se dice que estas son n1 piezas de informacin que producen s. Por ello hay n1 grados de libertad en lugar de n grados de libertad para calcular la varianza de la muestra.

Referencia Bibliogrfica

Walpole, R.E.; Myers, R.H.; Myers, S.L. & Ye,K. Probabilidad y estadstica para ingeniera y ciencias. Octava Edicin. Pearson Prentice-Hall. Mxico, 2007. Gmez B., M. (1998). Elementos de Estadstica Descriptiva. (3ra Edicin). San Jos, Costa Rica, UNED: Editorial Universidad Estatal a Distancia.