Está en la página 1de 32

Estadstica I

Unidad 1. Estadstica descriptiva

Universidad Abierta y a Distancia de Mxico

Licenciatura en Matemticas

Estadstica I

3er semestre

Unidad 1. Estadstica descriptiva

Clave:
05142318/06142318

Universidad Abierta y a Distancia de Mxico

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


1
Estadstica I
Unidad 1. Estadstica descriptiva

ndice
Unidad 1. Estadstica Descriptiva ................................................................................... 3
Presentacin de la unidad............................................................................................... 3
Propsitos de la unidad .................................................................................................. 3
Competencia especfica .................................................................................................. 3
Introduccin al estudio de la estadstica ....................................................................... 3
Estadstica.................................................................................................................................... 6
Estadstica descriptiva ............................................................................................................. 6
Inferencia estadstica ................................................................................................................ 7
Medidas de Tendencia Central ....................................................................................... 8
Escalas y tipos de variables .................................................................................................... 8
Media, moda, mediana media recortada. ........................................................................... 10
Medidas de dispersin .................................................................................................. 17
Varianza, desviacin estndar, rango intercuartlico. .................................................... 17
Diagramas de caja .................................................................................................................... 19
Medidas de Asociacin ................................................................................................. 28
Coeficiente correlacin de Pearson y Spearman ............................................................ 28
Cierre de la unidad......................................................................................................... 32
Para saber ms .............................................................................................................. 32
Fuentes de consulta ...................................................................................................... 32

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


2
Estadstica I
Unidad 1. Estadstica descriptiva

Unidad 1. Estadstica Descriptiva

Presentacin de la unidad

Esta primera unidad est dedicada a la Estadstica descriptiva. Uno de los principales
objetivos es la recoleccin de datos a travs de muestras. Estas enormes cantidades de
datos se han resumir en unos parmetros o medidas que le proporcionen al investigador,
se trata de, la descripcin lo ms cercana posible al comportamiento real de la poblacin
que es objeto de estudio. Para este fin se cuenta con las medidas de tendencia central,
dispersin y asociacin, que sern vistas en esta unidad.

Propsitos de la unidad

Utilizar las medidas de tendencia central, as como las de dispersin y de


asociacin con la finalidad de describir e interpretar la informacin obtenida.

Competencia especfica

Analizar un conjunto de datos agrupados y no agrupados que permiten resolver


problemas de tipo estadstico utilizando las medidas de tendencia central,
dispersin y asociacin

Introduccin al estudio de la estadstica

A lo largo de la historia de las matemticas se han desarrollado reas de conocimiento


especfico, como el caso de la Estadstica, cuyo uso data de las primeras civilizaciones.
En textos antiguos se aprecia cmo algunos emperadores o reyes decidieron realizar
censos de poblaciones conquistadas. La estadstica se convirti en una herramienta muy
til para el conocimiento y manejo de las nuevas conquistas.

Identificar la situacin de una poblacin es muy importante a la hora de tomar decisiones.


Al analizar actividades muy antiguas como los
Juegos de azar, como lanzar un par de dados a qu numero apostar? lo dejaban a la
suerte?Todos los nmeros tienen la misma probabilidad de salir? Para contestar estas
preguntas se desarroll la Estadstica.
A continuacin se revisarn los principales conceptos de esta rama de las Matemticas:

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


3
Estadstica I
Unidad 1. Estadstica descriptiva
Poblacin:

Todo estudio estadstico investiga una poblacin para lo cual el investigador el cientfico o
la empresa que paga el estudio define los lmites de la poblacin, la frontera. Por ejemplo:
si se investiga el crecimiento demogrfico en el Distrito Federal se analiza slo este
fenmeno en el territorio de esta ciudad. . . A otro investigador puede interesarle slo la
variacin demogrfica en la delegacin Miguel Hidalgo, por tanto su poblacin est
acotada a la demarcacin de esta delegacin.

En trminos generales una poblacin es un conjunto de cosas, objetos, individuos, que


tienen caractersticas en comn. La poblacin es el objeto de estudio.

Ejemplo1.
Si se desea estudiar la edad promedio de los habitantes de la ciudad de Mxico es
importante limitar la investigacin slo en las 16 delegaciones que integran al Distrito
Federal.

En este ejemplo la Ciudad de Mxico es la poblacin objeto de estudio. En otro ejemplo


la misma localidad puede ser slo parte de la poblacin objeto de estudio. A su vez
puede darse el caso de que nicamente se interese conocer el dato de una delegacin.

Ejemplo 2.

El delegado (a) en turno de la delegacin Azcapotzalco desea saber el nivel de estudios


de su poblacin adulta. El estudio queda suscrito a esta localidad. .

En este ejemplo la delegacin Azcapotzalco es la poblacin objeto de estudio.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


4
Estadstica I
Unidad 1. Estadstica descriptiva
Muestra:

Una muestra es cualquier subconjunto de la poblacin, es decir, cualquier pequeo grupo


seleccionado de la totalidad de elementos.

Ejemplo 3.

Si se desea estudiar la edad promedio de los habitantes de la Ciudad de Mxico,


Nuestra poblacin queda limitada al Distrito Federal. Otro ejemplo de muestra es si se
toman los datos nicamente de la delegacin Azcapotzalco (o Milpa Alta, o cualquier
otra).

En este ejemplo la Ciudad de Mxico es la poblacin objeto de estudio. La delegacin


Azcapotzalco puede ser una muestra de esa poblacin, aunque probablemente poco
representativa para todo el Distrito Federal.

Muestra aleatoria:

La muestra aleatoria es un subconjunto representativo de la poblacin elegida. Significa


que cada elemento de la poblacin debe de tener la misma oportunidad de ser
seleccionado. De este modo los resultados que se obtengan pueden ser generalizados al
resto de la poblacin.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


5
Estadstica I
Unidad 1. Estadstica descriptiva
Nota: Se pueden tener varias muestras aleatorias de una poblacin. Y a pesar de ser
aleatorias y representativas, estas van a arrojar valores diferentes, por lo tanto es
necesario tener claro de que slo nos dan idea de los valores, pero no la informacin real
de la poblacin.

Estadstica

La Estadstica es la rama de las Matemtica que se encarga del estudio de los mtodos,
recoleccin de informacin e interpretacin de sta en forma adecuada. Tambin se
encarga del anlisis de la informacin y la toma de decisiones con base en los resultados
de este anlisis.

Actualmente la Estadstica es la herramienta primordial de la investigacin cientfica tanto


para las Ciencias sociales como para las Ciencias exactas. Cabe sealar la importancia
que la Estadstica ha representado para los gobiernos y sus instituciones, pues se ha
convertido en una herramienta imprescindible para conocer la magnitud de los
nacimientos, muertes, nivel de estudios, nivel de ingresos, entre otros cosas, que
constituyen datos poblaciones importantes para todo gobierno.

La Estadstica se divide en dos grandes campos de estudio:

Estadstica
descriptiva
reas de la
Estadstica
Estadstica
inferencial

A lo largo de este curso se estudiarn los principales temas de ambas reas. En la unidad
uno se revisar la Estadstica descriptiva; en tanto, las unidades restantes estarn
dedicadas a la Estadstica Inferencial.

Estadstica descriptiva

La Estadstica descriptiva es aquella rama o rea de estudio de la Estadstica que se

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


6
Estadstica I
Unidad 1. Estadstica descriptiva
encarga del conocimiento de los mtodos adecuados para la recoleccin de datos, de la
organizacin, presentacin y descripcin de toda la informacin numrica y describir las
caractersticas principales de una poblacin que es objeto de estudio.

La Estadstica descriptica emplea mtodos que le permiten resumir los principales


aspectos de los valores de la muestra de la poblacin elegida. Asimismo, se basa en
clculos numricos y grficos para sus fines. Las graficas de barras, el grfico circular, los
pictogramas, los histogramas, los diagramas de rbol, entre otros son valiosas
herramientas para presentar los resultados obtenidos.

En este curso, se estudiarn las Medidas de Tendencia Central, las Medidas de


Dispersin y las Medidas de Asociacin.

Medidas de tendencia central.- son quiz las ms conocidas, consideradas como


los pilares sobre los cuales se edifica el resto de la estadstica. Estas medidas
permiten la descripcin (Estadstica descriptiva) de los datos, ya que con los
valores obtenidos se pueden realizar aseveraciones cuantitativas que indiquen las
caractersticas de la poblacin.

Medidas de dispersin.- tambin se conocen como medidas de variabilidad y se


utilizan para establecer la variacin de los datos respecto al valor central. Para
fines de este curso se ver la varianza, desviacin estndar, rango
intercuartlico y diagramas de caja.

Medidas de asociacin.- calculan la asociacin entre varas variables


estadsticas, en este curso se abordar nicamente el coeficiente de correlacin.

Inferencia estadstica

La Estadstica inferencial se encarga del estudio de los mtodos con los cules se
pueden hacer generalizaciones. Saca conclusiones basadas en la probabilidad de una
poblacin determinada lo que permite la toma de decisiones para este conjunto de
habitantes.

Es la ms usada en los trabajos de investigacin.

La Estadstica inferencial permite deducir, a partir de los valores que arrojen las muestras
extradas de una poblacin resultados o conclusiones acerca de la poblacin investigada.

Estimar es hacer una buena aproximacin de los valores de las caractersticas principales
de la poblacin de inters.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


7
Estadstica I
Unidad 1. Estadstica descriptiva
Para fines de este curso se estudiarn las estimaciones, y las pruebas de hiptesis.

Medidas de Tendencia Central

Dentro de la rama de la Estadstica descriptiva el tema ms conocido es el de Medidas


de tendencia central. Quin no ha escuchado de la moda o ha calculado un promedio?
En este curso las Medidas de tendencia central que se vern son:

Medidas de tendencia central


la Media

La media recortada

La moda

la mediana

Antes de entrar al estudio de Medidas de tendencia central, se revisar un tema previo


importante.

Escalas y tipos de variables

Escalas de medidas.-
Se puede decir que existen 4 tipos de escalas desde el punto de vista estadstico:

1. Nominal
2. Ordinal
3. Escala por intervalos
4. Escala de razn o proporcin

Tipos de variables.

Las variables en la Estadstica se organizan en dos grandes grupos:

1. Las variables cuantitativas o numricas. Estn asociadas a un proceso


cuantificable o medible.se refieren a datos numricos. Por ejemplo el peso de una
persona.

2. Las variables cualitativas o categricas.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


8
Estadstica I
Unidad 1. Estadstica descriptiva

stas se refieren a cualidades, caractersticas, o atributos no numerables. Los datos


recolectados en estas variables son expresados en palabras. Por ejemplo el sexo de una
persona no es un dato numrico. Generalmente se recurre a la asociacin de un nmero
a una determinada cualidad para poder trabajar la variable.

A su vez cada una presenta una subdivisin. Se pueden resumir en el siguiente


esquema:

Nominal
Cualitativa
Ordinal
Tipos de
variables
Discreta
Cuantitativa
Continua

Existen otros tipos de variables:

Nominal.- Cuando no se puede establecer una relacin entre los datos, en cuanto a
cual es mejor o peor. Por ejemplo el sexo. No se puede establecer que masculino sea
peor que femenino o viceversa.

Ordinal.- Se establece una relacin de importancia entre los datos, o bien un orden
jerrquico. Por ejemplo se gan medalla de oro, plata o bronce.

Discreta.- Se trata de una variable cuyos datos son nmeros enteros. Por ejemplo el
nmero de hermanos. pueden ser 1,2, 3,, pero no se puede tener 1.23 hermanos.

Continua.- Si puede asumir cualquier valor numrico,. generalmente se expresa en


nmeros con decimales. Por ejemplo la estatura de una persona es de 1.8 metros.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


9
Estadstica I
Unidad 1. Estadstica descriptiva

Ejemplo

Se selecciona un grupo de usuarios de transporte colectivo metro. Se reportan las


siguientes variables observables. {Color de ojos, sexo, estatura y peso}.

Registramos las variables y el tipo al que corresponden. El problema radica en clasificar


el tipo de variable.
Solucin:

Variable Tipo de variable


Color de ojos Cualitativa
Sexo Cualitativa
Estatura en metros Cuantitativa
Peso en kilogramos Cuantitativa

La estatura y el peso son variables cuantitativas porque esta medicin arroja un valor
numrico.

El color de ojos y el sexo son variables cualitativas por que no se pueden medir.

Media, moda, mediana media recortada.

Existen mtodos y tcnicas que no permiten trabajar con las variables, pues hacen que
la recoleccin e interpretacin de datos sea ms fcil de manejar, como es el caso de la
media, moda, mediana, media recortada).Una vez que se comprenden los tipos de
variables, es importante saber cmo se han de medir.

Para ello se tienen las diferentes Medidas de tendencia central:

Media

Se trata de una de las medidas estadsticas ms utilizadas por todos Quien no ha


calculado su promedio de calificaciones?

Es importante mencionar que hay varios tipos de Media, por ejemplo, la media
aritmtica (que generalmente se conoce como promedio), la media geomtrica y la
media armnica.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


10
Estadstica I
Unidad 1. Estadstica descriptiva
En este curso se estudiar la media aritmtica, pues es la que se utiliza ms y est
relacionada con los temas que se van a analizar. .

A grosso modo se puede decir que la media es la suma de los valores de un conjunto de
datos recolectados (observaciones, Etc.) dividida entre el tamao de la muestra (total de
datos recolectados). Estadsticamente representa el centro de un conjunto de datos como
se puede apreciar en la siguiente figura:

Para esta media se utiliza la siguiente expresin matemtica:

x1 x2 ....... xn
x
n
Ejemplo

Se tienen los datos sobre la calificacin que obtuvieron estudiantes que cursan la
materia de Probabilidad y son los siguientes: 10, 8, 6, 5, 1, 5, 5, 6,7,6,7,5,6,7,8,7,6,5,8,9.

Se desea calcular su media o promedio.

Solucin:

Son 20 datos, por lo tanto n= 20


Se procede a calcular la media mediante la formula:
x1 x2 ....... xn
x
n
Sustituyendo los valores:

1+5+5+5+5+5+6+6+6+6+6+7+7+7+7+8+8+8+9+10
Media o promedio = 20
= 5.9
El resultado es:
Media =5.9

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


11
Estadstica I
Unidad 1. Estadstica descriptiva

Media recortada (trimmed media 5%)

La media recortada permite eliminar los datos muy extremos, tanto en la zona superior
como en la inferior. Es idntica a la media aritmtica vista anteriormente, slo que para
calcularla primero se reduce el 5% de los valores en el extremo superior y tambin el 5%
del extremo inferior.

Se ordenan los valores en forma ascendente para identificar cules son los que quedan
en los extremos. Esta media permite eliminar la distorsin producida al tener valores en
los extremos muy alejados de la media.

Ejemplo.

Se cuenta con los siguientes datos, producto de una muestra aleatoria sobre la
calificacin que obtuvieron estudiantes que cursan la materia de Probabilidad: 10, 8, 6, 5,
1, 5, 5, 6,7,6,7,5,6,7,8,7,6,5,8,9.

1.- Se ordenan los datos en forma ascendente (o descendente) esto es :


1,5,5,5,5,5,6,6,6,6,6,7,7,7,7,8,8,8,9,10.

2.- Se elimina, el 5% para cada uno de los extremos (superior e inferior)... Si se tuvieran
una muestra de 100 datos el 5% sera de 5 datos.

3.- Una vez que se han eliminado los datos de los extremos superior e inferior (que cada
uno representa el 5% de la muestra), como se presenta abajo:

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


12
Estadstica I
Unidad 1. Estadstica descriptiva

Se procede a calcular la media recortada de igual manera como se hizo para la media
aritmtica.

Mediante la formula:
x1 x2 ....... xn
x
n
Sustituyendo los valores:

5+5+5+5+5+6+6+6+6+6+7+7+7+7+8+8+8+9
Media recortada = 18
= 6.44
El resultado por lo tanto es:
Media recortada=6.44

Mediana.

La mediana es el valor que divide en dos partes iguales una distribucin de frecuencias,
es decir aquel valor que deja igual numero de datos del lado derecho e izquierdo de l.
En otras palabras, se puede definir como el valor que se encuentra justamente en medio
de todos los valores ordenados en forma ascendente (o descendente), Esto se puede
ver en la siguiente ilustracin:

50 % ___!___ 50% .
Mnimo Mediana Mximo

Para localizar la mediana de una serie de datos se pueden presentar dos situaciones:

Primer caso. - que el total de los datos sea impar


Segundo caso.- que el total de los datos sea par.

El procedimiento para localizar la mediana es el siguiente:

Primero se ordenan todos los datos en forma ascendente (o descendente)

Segundo. Si se trata del primer caso, (impar) el dato buscado se localiza exactamente en
medio de la distribucin.

Ejemplo

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


13
Estadstica I
Unidad 1. Estadstica descriptiva
Se va a hacer el clculo basado en los siguientes datos, producto de tomar una muestra
aleatoria sobre la calificacin que obtuvieron estudiantes que cursan la materia de
Probabilidad: 10, 8, 6, 5, 9, 10, 5, 6,7.

Primero se ordenan en forma ascendente (o descendente) esto es :


5,5,6,6,7,8,9,10,10.

Segundo. El total de los datos es impar por lo tanto basta con localizar el dato que divide
en dos partes iguales la distribucin. note el estudiante que una vez ordenados en forma
ascendente los datos, quedan exactamente cuatro valores del lado izquierdo del siete y
cuatro valores a la derecha de l, como se puede apreciar en seguida:

Para este ejemplo la mediana es el 7. se puede representar como:

5,5,6,6 _ __7___ 8,9,10,10 .


mnimo Mediana mximo

Por el contrario, si el total de los datos es par, quedaran dos valores justo en la mitad de
la distribucin. Por lo tanto se proceder a calcular la media aritmtica de estos dos
valores.

Ejemplo

Con los siguientes datos, producto de tomar una muestra aleatoria sobre la calificacin
que obtuvieron estudiantes que cursan la materia de Probabilidad, se buscar la
Mediana:
{10, 8, 6, 5, 9, 10,8, 5, 6,7.}

Primero se ordenan en forma ascendente (o descendente) esto es :


5,5,6,6,7,8,8,9,10,10.

Segundo el l total de los datos es par, hay que localizar los datos que dividen en dos
partes iguales la distribucin.

Tercero Es necesario obtener la media aritmtica de estas cantidades para calcular la


Mediana:
7+8
= 7.5
2

Por lo tanto para este ejemplo la Mediana es el 7.5.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


14
Estadstica I
Unidad 1. Estadstica descriptiva

Moda.-

Se puede definir la moda como el valor de la variable que se presenta con mayor
frecuencia en un conjunto de datos. Ejemplo.

Ejemplo 9.

Se tom una muestra representativa de 20 alumnos de primer semestre que cursan el


bachillerato, a los cuales se les pregunt su edad. Los datos recolectados fueron los
siguientes:

{15,16,15,16,17,17,15,18,19,15,16,17,15,16,15,15,15,16,18,21}
Solucin

Nuestra variable es la edad hay que identificar cual es la edad que se presenta con
mayor frecuencia?
Para contestar a la pregunta hagamos una tabla (distribucin de frecuencias), con los
datos.

Variable (edad) Frecuencia (nmero de alumnos)


15 8
16 5
17 3
18 2
19 1
21 1

Por lo tanto la moda es 15, ya que es el dato que se presenta con ms frecuencia.

La moda tambin se presenta en variables categricas o cualitativas ejemplo:

Ejemplo

Con una muestra representativa de 20 alumnos de primer semestre que cursan el


bachillerato, a los cuales se les pregunto cul es su calzado habitual, se obtuvieron los
siguientes datos: los siguientes:
{tenis, tenis,zapatos,tenis,botas,tenis,sandalias,botas,zapatos,tenis,zapatos,tenis,
zapatos}

{zapatos, tenis, sandalias, zapatos, sandalias, sandalias, zapatos}

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


15
Estadstica I
Unidad 1. Estadstica descriptiva

Nuestra variable es el calzado habitual Cul es el calzado que se presenta con mayor
frecuencia en esta muestra?

Para contestar a la pregunta hagamos una tabla (distribucin de frecuencias) con los
datos.
Variable (calzado) Frecuencia (nmero de alumnos)
Tenis 7
Botas 2
Zapatos 7
Sandalias 4

En este caso se tienen dos datos con mayor frecuencia: tenis y zapatos con 7. Por lo
tanto se tienen dos modas: tenis y zapatos.

Es importante sealar que la moda es el nico valor central con el cual se suele trabajar
con variables cualitativas. Cabe sealar que, si bien la moda est considerada una
Medida de tendencia central, puede estar muy cerca de los extremos de la muestra,
pues indica el valor que se presenta con mayor frecuencia.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


16
Estadstica I
Unidad 1. Estadstica descriptiva

Medidas de dispersin

Tambin se conocen como Medidas de variabilidad y se utilizan para establecer la


variacin de los datos respecto al valor central.

Los conceptos ms relevantes son la varianza y la desviacin tpica o estndar. Estos


sern abordados en el presente apartado pero antes se revisarn los temas de cuartiles y
diagramas de caja, correspondientes a las medidas de posicin.

Varianza, desviacin estndar, rango intercuartlico.

Rango.- el rango se define como la diferencia entre dos valores, el mximo y el mnimo
Su expresin matemtica para calcularlo es:

Rango = Xmax. Xmin

Ejemplo.

En una muestra representativa de 20 alumnos que cursan el primer semestre de


bachillerato, se les pregunto su edad. Los datos recolectados fueron los siguientes:

15,16,15,16,17,17,15,18,19,15,16,17,15,16,15,15,15,16,18,21

Calcule el rango para la muestra recolectada.

Solucin:

De acuerdo a la formula, se busca el dato con el valor mximo y el valor mnimo Por lo
tanto se tiene:
Xmax=21

Xmin= 15

Rango = Xmax. Xmin

Sustituyendo en la frmula:
Rango = 21-15 = 6

Cuartiles

Los cuartiles son una medida de posicin no central integrada por tres valores que

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


17
Estadstica I
Unidad 1. Estadstica descriptiva
divide la totalidad de los datos en cuatro partes iguales. Por lo tanto, cada cuartl
representa el 25% del total, esto se aprecia en el siguiente diagrama:

En esta representacin se observa que el primer cuartil Q1divide a la totalidad de los


datos dejando por debajo el 25%, y al mismo tiempo por encima el 75% de las cifras. . Al
obtener el 50% de la informacin se divide en dos partes de 50% cada una, este valor
corresponde para el segundo cuartil, Q2.

Q1=N(25%)
Q2=N(50%)
Q3=N(75%)

N= nmero total de datos

Rango intercuartlico.

Es muy parecido al concepto de rango visto lneas arriba. Slo que para los cuartiles se
va a emplear la expresin matemtica:

Rango intercuartilico= Q3- Q1

Ejemplo

Con los siguientes datos correspondientes a una muestra aleatoria sobre la calificacin
de estudiantes que cursan la materia de Probabilidad10, 8, 6, 5, 9, 5, 6,7.

obtener el rango intercuartlico

Solucin:

1.- Se ordenan los datos en forma ascendente o descendente:


5,5,6,6,7,8,9,10.
2.- Se obtienen los cuartiles:

3.- Se aplica la frmula para encontrar los cuartiles::

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


18
Estadstica I
Unidad 1. Estadstica descriptiva
Q1=N(25%) = 8 (0.25)= 2 El cuartil Q1 est ubicado en el segundo lugar y
corresponde al nmero 5.
Q3=N(75%) = 8 (0.75) = 6 El tercer cuartil est en el sexto dato y es el nmero, 8.

Nota: en caso de dar un resultado fraccionario o decimal hay que redondear hacia el
nmero superior inmediato.

Otra perspectiva de esta medida es considerar que como son 8 datos, al dividirlos en
cuatro partes queda el 25%, 4 datos el 50%, 6 datos el 75% ya que los 8 datos son el
100%, por lo tanto se puede representar as:

Con esta representacin e pueden apreciar los valores para los cuartiles.

Como se mencion anteriormente, el primer cuartil representa el 25% de los datos, y el


tercer cuartil el 75%.

As se tiene que :

Q3= 8
Q1= 5

Por lo tanto el rango intercuartlico queda:

Rango intercuartilico= Q3 - Q1 = 8-5 = 3

Diagramas de caja

Los Diagramas de caja se utilizan para representar grficamente las cinco Medidas de
dispersin,: los valores extremos, (valor mximo, valor mnimo), la mediana y los
cuartiles Q1, Q3. Lo que nos falta de estos valores es explicar cmo se trazan los
diagramas correspondientes, lo que se har mejor con un ejemplo:

Ejemplo 13.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


19
Estadstica I
Unidad 1. Estadstica descriptiva
Se tienen los datos correspondientes a una muestra aleatoria sobre la calificacin que
obtuvieron estudiantes de la asignatura de Probabilidad: 10, 8, 6, 5, 9, 5, 6,7.

Obtener el diagrama de caja

Solucin:

1.- Se ordenan en forma ascendente o descendente los datos:


5,5,6,6,7,8,9,10.

2.- Se obtienen los cuartiles:

Del ejemplo anterior se obtuvieron los cuartiles:

Q3= 8
Q1= 5

Los valores extremos son claramente:


Xmax= 10
Xmin = 5

La mediana se calcula como una media aritmtica de los dos valores centrales, dado
que el tamao de la muestra es par, as se tiene que:

6+7
Mediana = 2
= 6.5

Ya se tienen los cinco valores necesarios para la construccin del diagrama de caja: Es
conveniente trazar una lnea que sirva de referente que contenga los datos de la
muestra.

Lo primero es trazar los bigotes, esto se logra usando los valores extremos, para este
caso Xmax= 10, Xmin = 5, asi que:

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


20
Estadstica I
Unidad 1. Estadstica descriptiva

La caja se construye con los cuartiles Q1, Q3.

La caja tiene de largo el rango intercuartlico. En este ejemplo coincidi el bigote del
valor mnimo, con el del primer cuartil Q1, de ah que se observe la figura como si le
faltara el bigote de la izquierda.

Por ultimo se traza la mediana que para este ejemplo es de 6.5.

La longitud de los bigotes indica qu tan concentrados estn los valores en el primer

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


21
Estadstica I
Unidad 1. Estadstica descriptiva
25%, y en el ltimo 25% (que va del 75% al 100%). En este ejemplo lo que se nota es
que en el ltimo 25% los datos estn poco concentrados pues su longitud es
considerable, en tanto que para el primer 25% estn muy concentrados y el bigote
carece de longitud.

La varianza

Esta medida de dispersin sirve para calcular el grado de variabilidad de los datos con
respecto a la media se calcula en unidades cuadradas.

Para obtener la varianza se utilizar la siguiente expresin matemtica:

f ( xi x)2
i 1
Vx
n 1

Nota: f= frecuencia absoluta del dato x

Usualmente la varianza se representa con la letra griega 2cuando se trata de una


poblacin, y se divide entre N, que es el total de datos de la poblacin.

f ( xi x)2
i 1
2
N

Por otro lado, la letra s2 se refiere a una muestra (tomada de una poblacin).

f ( xi x)2
i 1
s
2
n 1

Como puede verse en la expresin matemtica, la varianza est definida como la media
aritmtica de los cuadrados de las desviaciones de cada uno de los valores respecto al
promedio.

Ejemplo
En la siguiente distribucin de frecuencias se reportan las edades de nios de una
primaria. La muestra se tom de manera aleatoria. Calcule la varianza de la muestra.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


22
Estadstica I
Unidad 1. Estadstica descriptiva
Variable (x) edad del nio Frecuencia (f)
6 15
7 8
8 16
9 20
10 13
11 24

Solucin:

La frmula para su clculo es:


n

f ( xi x)2
i 1
Vx
n 1

1.- Obtener el promedio o media aritmtica de la muestra.


n

xi
x i 1

N
N= tamao de la muestra= numero de datos= 96

615+78+816+920+1013+1124
x= 96

848
x= 96
Por lo tanto sustituyendo se tiene que el valor de la media o promedio es:

x = 8.833

Para el clculo de la varianza resulta til trabajar en la tabla de distribucin de


frecuencias la cual est formada con las siguientes columnas:

Variable Frecuencia X- x (X- x )2 (X- x )2*f


(x) (f)
6 15 6-8.83=-2.83 (-2.83)2=8.0 120
7 8 7-8.83=-1.83 =3.34 26.72
8 16 8-8.83=-0.83 =0.6889 11
9 20 9-8.83=0.17 =0.0289 0.578
10 13 10-8.83=1.17 =1.36 17.68
11 24 11-8.83= 2.17 =4.7 112.8

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


23
Estadstica I
Unidad 1. Estadstica descriptiva

f ( xi x)2 =288.778
i 1

Se tiene la ecuacin:
n

f ( xi x)2
i 1
Vx
n 1
Se sustituyen datos:

288.778
Vx= 961

Vx=3.04

Desviacin estndar:

La desviacin estndar se obtiene al sacar la raz cuadrada de la varianza.


Esconveniente que las unidades que describen la variabilidad sean idnticas a las
unidades del conjunto original para que pueda ser utilizada la desviacin estndar en
lugar de la varianza cuyas unidades son cuadrticas.

Para calcular la desviacin estndar se utilizar la siguiente expresin matemtica:

f ( xi x)2
i 1
Vx
n 1

Usualmente la desviacin tpica o estndar se representa con la letra griega cuando


se trata de una poblacin

f ( xi x)2
i 1
Vx
N
En el caso de la letra s se usa cuando se refiere a una muestra (tomada de una
poblacin).

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


24
Estadstica I
Unidad 1. Estadstica descriptiva
n

f ( xi x)2
i 1
s Vx
n 1

Como puede verse en la expresin matemtica, la desviacin se define como la raz


cuadrada de la varianza.

Grficamente la desviacin se puede representar de la siguiente manera (se ha tomado


una distribucin de tipo normal):

Ejemplo

En la siguiente distribucin de frecuencias se reportan las edades de nios de una


primaria. La muestra se tom de manera aleatoria.

Variable (x) edad del nio Frecuencia (f)


6 15
7 8
8 16
9 20
10 13
11 24

Calcular la desviacin estndar.

Solucin:

La frmula para el clculo de la desviacin estndar nos indica que hay que obtener la
varianza.

Como se est retomando el problema para ejemplificar la varianza, nos vamos a saltar el

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


25
Estadstica I
Unidad 1. Estadstica descriptiva
clculo de sta, y nicamente tomaremos el valor obtenido

Vx=3.04

As que para calcular la desviacin bastar sustituir en la frmula.

s 3.04
Por lo tanto el valor de la desviacin estndar es

S =1.74

1
Coeficiente de variacin. = .

Este concepto es til pues nos permite hacer una comparacin entre dos variables que
tengan unidad de medida diferente.

La expresin matemtica para su clculo es:

cv = s / x x 100

Como se puede apreciar en la ecuacin, el coeficiente de variacin es el cociente de la


desviacin estndar y el promedio aritmtico.

Si el valor del coeficiente de variacin es menor o igual al 10% se dice que vara poco o
presenta poca variacin. Por el contrario, si es mayor a 50% se tiene una variacin
excesiva. En los rangos intermedios se considera que la variacin es grande pero
aceptable.

Ejemplo

En la siguiente distribucin de frecuencias se reportan las edades de nios de una


primaria. La muestra se tomo de manera aleatoria.

Variable (x) edad del nio Frecuencia (f)


6 15
7 8
8 16
9 20

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


26
Estadstica I
Unidad 1. Estadstica descriptiva
10 13
11 24

Calcular el coeficiente de variacin.

Solucin:

La ecuacin matemtica nos lleva a calcular la desviacin estndar, lo que a su vez nos
remite al clculo previo de la varianza.

Retomando el problema utilizado para ejemplificar la varianza, y la desviacin


estndar, nos vamos a saltar estos clculos, y nicamente tomaremos el valor obtenido
para la desviacin.

As que para calcular la desviacin bastar sustituir en la frmula.

= 1.74

= 8.833


= ( ) 100

1.74
= ( ) 100
8.83
por lo tanto el valor del cv es:
= 19.74 %

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


27
Estadstica I
Unidad 1. Estadstica descriptiva

Medidas de Asociacin

Miden la asociacin entre diversas variables estadsticas. En este curso se abordar el


coeficiente de correlacin, para lo cual se requiere conocimientos previos, como es el
caso de la contrastacin de hiptesis. Sin embargo, se tratar el tema de manera sencilla
para no causar contratiempos en el estudiante.

Coeficiente correlacin de Pearson y Spearman

Hasta el momento se han revisado conceptos y se han realizado clculos que involucran
una sola variable. Qu pasa cuando se tienen dos o ms variables?

Numerosos problemas requieren determinar la relacin que existe entre una o ms


variables involucradas en el mismo problema. . Estas relaciones se convierten en
correlaciones.

Antes de iniciar el tema del coeficiente de correlacin, es necesario revisar los


siguientes conceptos: Correlacin lineal. Donde puede haber dos tipos de correlacin
lineal: Una positiva, cuando se presenta una relacin directamente proporcional entre las
variables, es decir que si aumenta una aumenta la otra, y a la inversa si disminuyen los
valores de una disminuirn los valores de la otra. La otra es una correlacin que se
denomina negativa, que se presenta cuando las variables tienen una relacin
inversamente proporcional, es decir que si los valores de una variable van en aumento,
mientras que los de la otra irn en decremento y a la inversa.

Regresin lineal. Es un modelo que permite describir la variacin conjunta de dos


variables continuas.

Diagrama de dispersin. Muestra la localizacin de puntos, para lo cual se utiliza un


sistema de coordenadas en donde el eje y y el x representan los valores de las
variables que estn correlacionadas.

El diagrama de dispersin representa una idea clara del grado de correlacin entre las
variables. En seguida se muestran los principales grados de relacin entre dos variables
mediante el uso de estos diagramas.

En estas primeras imgenes la correlacin lineal es muy fuerte, slo cambia el sentido de
la pendiente y esto se ver reflejado en el signo del valor del coeficiente.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


28
Estadstica I
Unidad 1. Estadstica descriptiva

Diagrama 1 Diagrama 2

En los siguientes tres diagramas (del 3 al 5), la correlacin es lineal pero no muy fuerte
como en el caso anterior.

Diagrama 3 Diagrama 4

Diagrama 5 Diagrama 6

En el diagrama 6 existe una correlacin que no es de tipo lineal, se trata de una relacin
curva.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


29
Estadstica I
Unidad 1. Estadstica descriptiva

Diagrama 7

Este ltimo diagrama representa el caso donde no se tiene relacin entre las variables,
pues no hay correlacin.

Coeficiente de correlacin lineal. Expresa cuantitativamente qu tan relacionadas


estn las variables o qu tan estrecha es su relacin.

La expresin matemtica para el clculo del coeficiente de correlacin, sobre una


poblacin estadstica es:

Para el caso de una muestra se tiene la expresin matemtica:

Los valores que puede tomar este coeficiente van de -1 a +1. El signo del valor del
coeficiente debe coincidir con la pendiente de la recta de regresin. La magnitud de esta
recta est relacionada ntimamente con el grado de dependencia lineal entre las variables.

La correlacin va a ser ms fuerte o dbil, dependiendo de que el valor del coeficiente de


correlacin est aproximado a uno, cero o menos uno. El valor cero representa la
ausencia de correlacin lineal.

Ejemplo

Una empresa tiene ventas reportadas en los ltimos cinco aos, las cuales aparecen en
la siguiente tabla, donde la utilidad est en millones de pesos:

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


30
Estadstica I
Unidad 1. Estadstica descriptiva

Variable (x) aos Variable (y) ventas en millones de pesos


1 8.3
2 10.2
3 11.1
4 12.5
5 14.6
x= 15 y=56.7

Calcular el coeficiente de correlacin

Solucin:

De acuerdo a la frmula del clculo del coeficiente resultar muy conveniente agregar
varias columnas a la tabla de datos para simplificar los clculos.

x y x*y x2 y2

1 8.3 8.3 1 68.89


2 10.2 20.4 4 104.04
3 11.1 33.3 9 123.21
4 12.5 50.0 16 156.25
5 14.6 73.0 25 213.16
x= 15 y=56.7 y=185 x2= 55 y2= 665.55

Ahora vayamos a la ecuacin.

Sustituyendo los datos:

5(185) 15 (56.7)
=
5(55) (15)(15) 5(665.55) (56.7)(56.7)

(925) (850.5)
=
275 225 (3327.75) (3214.89)

74.5
=
50 112.86

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


31
Estadstica I
Unidad 1. Estadstica descriptiva
74.5
=
50 112.86

74.5
=
75.11

r= 0.9917

El resultado muestra un coeficiente muy cercano a la unidad y esto representa la enorme


correlacin que existe entre las dos variables, es decir las ventas y el tiempo de la
empresa estn muy relacionados.

Cierre de la unidad

Las medidas estadsticas aprendidas en esta unidad son muy importantes y bsicas para
cualquier estudio estadstico. Con el dominio de estos conceptos ser ms fcil abordar la
siguiente unidad, por lo que se recomienda al estudiante, revisar los temas cuantas veces
sea necesario, pues son los pilares para cualquier estudio posterior.

Para saber ms

Para que puedas repasar los conocimientos adquiridos durante la unidad, te recomiendo
que revises esta pgina de internet, que te permitir reforzar la teora y ejemplos sobre la
Estadstica descriptiva.
http://www.aves.edu.co/ovaunicor/recursos/8/Estadistica%20Descriptiva.swf

Tambin te recomiendo esta pgina para que recopiles mas informacin sobre cada uno
de los temas y te auxilien en la solucin de las actividades de la unidad.
http://www.demre.cl/text/doc_tecnicos/p2009/estadistica_descriptiva.pdf

Fuentes de consulta

Kuby, J. (2012). Estadstica elemental. Mxico: Cengage.

Ojer, L. (1990). Estadstica bsica. Madrid: Dossat.

Huntsberger, D. (1983). Elementos de Estadstica inferencial. Espaa: Continental.

Ciencias exactas, ingenieras y tecnologas/Licenciatura en Matemticas


32

También podría gustarte