Está en la página 1de 139

Prof. Eliana Guzmán U.

S
Semestre U‐2014
 

Concepto de Estadística
y Se refiere a un conjunto de métodos para manejar la 

obtención, presentación y análisis de 
observaciones numéricas.
observaciones numéricas

Tema 1.. Introducción

Concepto de Estadística
y Sus fines son describir al conjunto de datos obtenidos y 

tomar decisiones o realizar generalizaciones acerca de 
las características de todas las observaciones bajo 
consideración.
Tema 1.. Introducción

Áreas que conforman a la Estadística y Estadística Descriptiva (Deductiva): es la  E dí i  D i i  (D d i )    l   DESCRIBIR Tema 1.  ..  presentación de los datos en tablas y gráficos y  del cálculo de medidas numéricas que permitan  estudiar los aspectos más importantes de los  datos. condensación. Introducción encargada de la organización.

Introducción INFERIR .. Tema 1.Áreas que conforman a la Estadística y Estadística Inferencial o Inferencia Estadística:  E dí i  I f i l   I f i  E dí i   está definida por un conjunto de técnicas.  mediante las cuales se hacen generalizaciones o  se toman decisiones en base a información  parcial obtenida mediante técnicas descriptivas.

.Áreas de Aplicación de la Estadística y El uso de la Estadística es muy amplio. y Los métodos estadísticos han encontrado aplicación  en: Gobierno Negocios Ci i  S i l Ciencias Sociales Ingeniería Ciencias Física y Naturales Control de Calidad C t l d  C lid d Procesos de Manufactura Muchos otros campos de la actividad intelectual. Tema 1. Resulta difícil  El uso de la Estadística es mu  amplio  Resulta difícil  nombrar un área en la cual no se emplee. Introducción y y y y y y y y .

Áreas de Aplicación de la Estadística y Esto se debe a la creciente facilidad con la cual  E    d b    l   i  f ilid d   l   l  se pueden manejar grandes cantidades de datos  numéricos. Introducción . debido al uso de … numéricos  debido al uso de  Tema 1..

Conceptos de Población y Muestra
y Población: es la colección de todas las posibles 

mediciones u observaciones que pueden hacerse 
de una variable bajo estudio.
de una variable bajo estudio

Tema 1.. Introducción

Conceptos de Población y Muestra

Tema 1.. Introducción

y Se clasifica en dos categorías:
y Finita: es aquella que incluye una cantidad limitada 
contable de observaciones, individuos o medidas. 
t bl  d   b
i
 i di id     did  
Siempre que sea posible alcanzar (contar) el número 
total de todas las posibles mediciones, se considera 
como finita la población.

Conceptos de Población y Muestra
y Infinita: es aquella que incluye un gran conjunto de 

observaciones o mediciones que no pueden alcanzarse 
por conteo  Al menos  hipotéticamente  no existe límite 
por conteo. Al menos, hipotéticamente, no existe límite 
en cuanto al número de observaciones que el 
experimento puede generar.
Tema 1.. Introducción

Conceptos de Población y Muestra yM Muestra:   y es un conjunto de mediciones u observaciones  tomadas a partir de una población. Tema 1. Introducción . tomadas a partir de una población y es un subconjunto de la población..

Introducción . medición o individuo de la  población tenga la misma probabilidad de ser  seleccionado.. Tema 1.Conceptos de Población y Muestra y Muestra aleatoria: se considera aleatoria siempre y  cuando cada observación.

 edad.  color de ojos. ..Definición de variable y datos Tema 1. Ej: sexo. peso. Introducción y Variables:  y son las características o lo que se estudia de cada  individuo de la muestra.. temperatura. estatura. estado civil. cantidad de  nacimientos.. presión. p g y Datos: y son los valores que toma la variable en cada caso. . diámetro. grosor.

 casado. marrón. … . y Hábito de fumar: Fumador/No fumador y Religión: católica.Tipos de datos y Cualitativos: son datos que solo toman valores asociados  a las cualidades o atributos. Introducción y Color de ojos: negro. azul. no son valores numéricos. … y Estado civil: soltero.… Estado civil: soltero  casado  divorciado Tema 1.. clasificándolos en una de  varias categorías  es decir  no son valores numéricos  Ej: varias categorías. Ej: y Sexo: f/m. es decir. evangélica. divorciado.

. Introducción y Estatura .Tipos de datos y Cuantitativos: provienen de variables que pueden  medirse.  Ejemplos: y Peso y Edad y Presión y Humedad y Intensidad de un sismo y Cantidad de hermanos Tema 1. cuantificarse o expresarse numéricamente.

y Continuas: es la variable que puede tomar cualquier  q p q valor en una escala continua. Ejemplo: cantidad  bl  d   l  Ej l   tid d  de hermanos.. .Escalas de medida Tema 1. Ejemplo: cantidad de  líquido contenido en un recipiente. Introducción y Tipos de variables cuantitativas: y Discretas: es aquella que solo puede tomar un número  fi it    i fi it   finito o infinito numerable de valores.

Introducción y Escala Absoluta. Variables Cualitativas y Escala de Intervalos.. y Escala Ordinal. Tema 1.Escalas de medida y Escala Nominal. Variables Cuantitativas . y Escala de Razón o Proporción.

 sexo. ≥) sino solo las  de igualdad o diferencia. ≤. por lo tanto no están definidas  las operaciones lógicas (>. Introducción categorías que no mantienen una relación de  orden entre si  por lo tanto no están definidas  orden entre si..Escalas de medida y Escala nominal: los datos se pueden agrupar en  Tema 1.  y Ejemplos: color de ojos. . <. estado  civil. religión. profesión.

y Ejemplos: grados militares. ≥). .. escalafón de los profesores universitarios. estadiaje de un tumor.Escalas de medida y Escala ordinal: existe un cierto orden o jerarquía entre  Tema 1.  grados de disnea  estadiaje de un tumor grados de disnea. ≤. Introducción las categorías (>. organigrama de una  Ej l   d   ili   i  d     empresa. <.

  Tema 1. ≥).Escalas de medida y Escala de Intervalos: valores numéricos de las  variables y además de las relaciones de orden (>.  Tiene dos propiedades: p p constante para todos los valores que toma la variable. Introducción y Existe una unidad de medida que se mantiene  . ≤.  <.      )    d   bl  di i    d i   tienen sentido las operaciones de suma y resta.. es decir. se pueden establecer distancias. y Existe un valor patrón u origen relativo que no significa  la ausencia de valor en la variable.

 movimientos  sísmicos. Tema 1.. nivel de ruido. Introducción .Escalas de medida y Ejemplo: temperatura.

  ≥) y distancia (+. <. altura.Escalas de medida y Escala de razón o proporción: es la más completa y  E l  d   ó     ió    l   á   l t     Tema 1. Introducción general de todas las escalas. y Ejemplos: peso. volumen… . se pueden establecer  múltiplos y proporciones. Se caracteriza porque  los valores de la variable son números entre los  cuales.‐). ≤.. además de las relaciones de orden (>.

…  . y Ejemplos: número de hermanos.Escalas de medida y Escala Absoluta: se caracteriza porque los valores que  Tema 1.  did   id d d   id      i ió   cantidad de hijos. cantidad de autos  vendidos. cantidad de accidentes en una intersección. Introducción toma la variable son el resultado de contar y por lo  tanto.. está constituida por los enteros positivos y el  cero.

y Bivariantes o bidimensionales: recogen información  sobre dos características de la población. Introducción información sobre una característica (Ej: edad de los  alumnos de una clase).  d  l   l  d     l ) ..Datos Univariantes y Multivariantes y Univariantes o unidimensionales: sólo recogen  Tema 1. (Ej: edad y  estatura de los alumnos de una clase).

. estatura y peso de los alumnos de una clase) Tema 1.Datos Univariantes y Multivariantes y Multivariantes o pluridimensionales: recogen  información sobre tres ó más características.  estatura y peso de los alumnos de una clase). Introducción . (Ej: edad.

Tema 1. y Datos muestrales no representativos: y Ciertas categorías de personas no responden  correctamente. y Respuestas voluntarias (sesgadas). y Representaciones gráficas engañosas (escalas).Abusos que se pueden cometer con la Estadística y Conclusiones erróneas debido a que los datos son  numéricamente insuficientes. Introducción y Muestra que no incluye a elementos de toda la población. ..

 ESTADÍSTICA DESCRIPTIVA .TEMA 2.

 se obtienen  datos en bruto.Organización de los datos y Una vez que se ha  Tema 2. Estadística Descrriptiva realizado la recolección de  los datos. . los cuales  rara vez son significativos  f sin una organización y  tabulación.

. y Poco práctica cuando se tiene una gran cantidad de  datos. consiste en colocar las observaciones en  orden según su magnitud: ascendente o descendente. Estadística Descrriptiva . datos en bruto.Organi ación de los datos Organización de los datos y Formas de organizar los datos: d l d y Un arreglo: es la forma más sencilla de organizar los  Tema 2.

Estadística Descrriptiva de los datos que permite expresar la frecuencia de  ocurrencias de las observaciones en cada una de  las clases  mostrando el patrón de la distribución  las clases.Organi ación de los datos Organización de los datos y Una distribución de frecuencias: es un arreglo  U  di t ib ió  d  f i       l   Clase Pto. . mostrando el patrón de la distribución  de manera más significativa. Medio fi Fi fri FRi Tema 2.

 en primer lugar. Estadística Descrriptiva y La Distribución de Frecuencias: y Se recomienda su uso cuando se tienen grandes  cantidades de datos (n).  se puede usar: . la  selección de los límites de los intervalos de clase. y Para definir la cantidad de intervalos de clase (k). tid d  d  d t  ( ) y Su construcción requiere.Organización de los datos y y La regla de Sturges:  k = 1 + 3.3log(n) k = √n Tema 2.3log(n) La regla de Sturges:  k   1 + 3.

y La amplitud de todas las clases deberá ser la misma. que la  verdadera naturaleza de la distribución sea  imposible de visualizar.  Se recomienda que sea impar y que los puntos  medios tengan la misma cantidad de cifras  significativas que los datos en bruto. . y Los límites de las clases deben tener una cifra  significativa más que los datos en bruto.Organización de los datos y La cantidad de clases no puede ser tan pequeño  Tema 2. Estadística Descrriptiva (menos de 5) o tan grande (más de 20).

y Frecuencia relativa de la clase (fri): . y Frecuencia acumulada de la clase (Fi). Tema 2. Estadística Descrriptiva y Determinar: y Punto medio = (Li+Ls)/2.Organización de los datos y fri = fi/n y Frecuencia relativa acumulada de la clase (Fr ( i)). y Frecuencia absoluta de la clase (fi).

Ejemplo de Distribución de Frecuencias Tema 2. Estadística Descrriptiva A continuación se presentan las  calificaciones de 60 estudiantes  lifi i  d  6   t di t   que presentaron la PINA en el  año 2010: .

Estadística Descrriptiva 23     60     79     32     57     74     52     70     82     36 80     77     81     95     41     65     92     85     55     76 52     10     64     75     78     25     80     98     81     67            6             8           8       8     8      6 41     71     83     54     64     72     88     62     74     43 60     78     89     76     84     48     84     90     15     79 34     67     17     82     69     74     63     80     85     61 . b) ¿Qué puede concluir de estos datos? Tema 2.Ejemplo de Distribución de Frecuencias a) Construya una distribución de frecuencias.

 en este caso.Ejemplo de Distribución de Frecuencias Antes de construir la distribución de frecuencia. se va a  obtener el arreglo de estos datos. ordenados  de menor a mayor: 10 15 17 23 25 32 34 36 41     41 43 48 52 52 54 55 57 60 60    61 62 63 64 64 65 67 67 69 70    71 72 74 74 74 75 76 76 77 78    78 79 79 80 80 80 81 81 82 82    83 84 84 85 85 88 89 90 92 95    98 .

86 ≈ 7 clases.       R=98‐10 = 88 puntos. y k = √n = √60 = 7. A=R/k. aproximar a un valor un poco mayor que el obtenido  para asegurar que las clases van a abarcar al conjunto  completo de los datos.57 ≈ 12. A= 88/7=12.3log(n) = 6.75 ≈ k = √n = √60 = 7 75 ≈ 8 clases. Estadística Descrriptiva 2) Calcular la amplitud (A) de las clases a usar: .6  Tema 2. 7 u 8? y y y Calcular el rango de los datos (R): R=Obsermayor‐Obsermenor. 8 clases ¿Qué cantidad de clase usar.Ejemplo de Distribución de Frecuencias 1) Determinar la cantidad de clases (k) a emplear: La regla de Sturges:  k = 1 + 3.

 Li=9.5 Se tiene la primera clase como 9.6=22. Determinar el resto de las clases.9+12.  D i   l lí i   i  d  l   i   l   suman al Li hallado en el paso anterior la amplitud  de la clases  Ls=9 9+12 6=22 5 de la clases. Ls=9.5 3. Determinar el límite inferior de la primera clase a  Tema 2. al límite superior de la clase  anterior. Determinar el límite superior de la primera clase. usando como límite  inferior de cada una.9 – 22. .9 4.Ejemplo de Distribución de Frecuencias 3. Estadística Descrriptiva usar.

7 .Clase Pto.9-85.5-98.1-47.5-35.1 Tema 2.7 60. Medio fi Fi fri FRi 9.3-72.9-22.3 3 60.5 85 5 98 1 85.1 47 7-60 47.5 22. Estadística Descrriptiva 35.9 72.

Determinar la frecuencia absoluta de la clase (fi).Ejemplo de Distribución de Frecuencias 4. 7. 6. Calcular el punto medio de cada clase: Punto medio =  y f i = f fr  fi/n / 8. ) Tema 2.  )  contando la cantidad de datos que pertenecen a cada  clase. 5. Determinar la frecuencia relativa de la clase (fri): . Determinar la  frecuencia relativa acumulada de la  clase (Fri). Determinar la frecuencia acumulada de la clase (Fi). Estadística Descrriptiva (Li+Ls)/2.

3-72.9 67 12 31 0.05 0.1 1 Tema 2.19 47 7-60 47.9-85.1 29 4 7 0.1-47.a) Pto.2 0.13 0 32 0.5-98.38 0.5 79 23 54 0.07 0. Medio fi Fi fri Fri 9.12 35.3 3 54 8 19 0 13 0.5-35.07 0.7 60.90 85 5 98 1 85.52 72.9-22.5 16 3 3 0.32 60.7 41 4 11 0.05 22.1 92 6 60 01 0. Estadística Descrriptiva Clase .

  p siendo un porcentaje muy bueno. .  Un 38% de los estudiantes obtuvieron entre 72 y 85  puntos.Ejemplo de Distribución de Frecuencias b) En esta PINA lo mas frecuente es que los estudiantes  Tema 2. y  menos frecuentes calificaciones mayores a 85 o  menores a 35 puntos. Estadística Descrriptiva obtengan calificaciones entre 60 y 85 puntos.  Un 81% de los estudiantes aprobaron esta PINA.

Representación gráfica de los datos .

y Ojiva o Polígono de frecuencias acumuladas. g y Polígono de frecuencias. Estadística Descrriptiva el comportamiento de los datos.  P  d t   tit ti   d     l   comúnmente se utilizan tres gráficos: . y Para datos cuantitativos agrupados en clases.Representación gráfica de los datos y Los gráficos permiten visualizar en forma global y rápida  y Histogramas. Tema 2.

 la frecuencia absoluta de  cada clase (fi). y en el eje de las Y. los límites de las  clases. cada clase (fi) Los rectángulos que se obtienen se deben graficar  unidos. Estadística Descrriptiva Se obtiene graficando en el eje de las X. unidos .Histograma Tema 2.

Representación gráfica de los datos Tema 2. Estadística Descrriptiva Histograma .

Estadística Descrriptiva Se obtiene graficando en el eje de las X. líneas rectas . la  frecuencia absoluta de cada clase (fi). frecuencia absoluta de cada clase (fi) Los puntos obtenidos se unen usando segmentos de  líneas rectas. los puntos  medios de las clases (mi).Polígono de frecuencias: Tema 2. y en el eje de las Y.

Representación gráfica de los datos Tema 2. Estadística Descrriptiva Histograma y Polígono de Frecuencias .

 y en el eje de las Y.Ojiva Tema 2. Estadística Descrriptiva Se obtiene graficando en el eje de las X. la frecuencias relativas  acumuladas de cada clase (Fri). el límite superior  de las clases. acumuladas de cada clase (Fri) Los puntos obtenidos se unen usando segmentos de  líneas rectas. . líneas rectas Esta gráfico inicia desde el eje de coordenadas X.

Estadística Descrriptiva Ojiva .Representación gráfica de los datos Tema 2.

absoluta de cada categoría (fi). tanto nominal como ordinal.y j . . d     l  t t   i l    di l Se obtiene graficando en el eje de las X. Estadística Descrriptiva y Para datos cualitativos se usan: y Barras: se usa para variables cualitativas que se miden  usando una escala. las categorías de  la variable en estudio. Las barras se dibujan separadas. la frecuencias  . y en el eje de las Y.Representación gráfica de los datos Tema 2.

Representación gráfica de los datos Barras Barras .

Representación gráfica de los datos y Curvas: se usa para variables cualitativas que se miden  Tema 2. y en el eje de las Y. Se obtienen graficando en el eje de las X  la variable  Se obtienen graficando en el eje de las X. los valores de la variable en  estudio. la variable  tiempo. Estadística Descrriptiva usando una escala ordinal. . Algunos autores denominan a este tipo de gráfico como  series de tiempo o series cronológicas.

Representación gráfica de los datos Tema 2. Estadística Descrriptiva Curvas .

cuyo ta a o es Se obtiene dividiendo a un círculo en sectores. Se emplea la siguiente expresión para calcular el tamaño de cada  sector: Sector=fri 360 . sector: Sector=fri*360° Algunos autores prefieren presentar este gráfico usando  porcentajes: Sector=(fi*100)/n. cuyo tamaño es  proporcional a la frecuencia de cada categoría de la variable. tanto nominal como ordinal. . Estadística Descrriptiva miden usando una escala.Representación gráfica de los datos y Sectores. torta o circular: se usa para variables cualitativas que se  Tema 2.  Se obt e e d d e do a u c cu o e secto es.

Representación gráfica de los datos Tema 2. Estadística Descrriptiva Sector torta o circular Sector. .

Estadística Descrriptiva .Ejemplo de construcción de gráficos Tema 2.

5 98.1 47.Para el ejemplo de las calificaciones de la Para el ejemplo de las calificaciones de la  PINA 2010: Histograma: fi 24 22 18 16 14 12 10 8 6 4 2 9.3 72.7 60.1 Límites de Clase (calificación en puntos) Tema 2.9 85.9 22.5 35. Estadística Descrriptiva 20 .

Para el ejemplo de las calificaciones de la Para el ejemplo de las calificaciones de la  PINA 2010: Polígono de  frecuencias: fi 24 22 18 16 14 12 10 8 6 4 2 16 29 41 54 67 79 92 Punto medio de clase (calificación en puntos) Tema 2. Estadística Descrriptiva 20 .

5 98.lh l d Es común presentar el histograma y polígono de  frecuencias en un mismo gráfico: fi 24 22 18 16 14 12 10 8 6 4 2 9.7 60.1 Límites de Clase (calificación en puntos) Tema 2. Estadística Descrriptiva 20 .3 72.9 85.9 22.1 47.5 35.

Estadística Descrriptiva 0.6 0.1 47.1 22.5 98.5 0.9 85.3 72.1 Límite superior  de clase (calificación en puntos) Tema 2.3 0.9 .7 60.8 0.Para el ejemplo de las calificaciones de la Para el ejemplo de las calificaciones de la  PINA 2010: Ojiva: Fri 1 0.2 0.4 0.7 0.5 35.

Medidas de Tendencia Central .

y Forma como los datos pueden condensarse en un solo  F    l  d   d   d       l   valor central alrededor del cual todos los datos  muestrales se distribuyen. muestrales se distribuyen .Medidas de tendencia central o posición y Corresponden a valores que generalmente se ubican en  Tema 2. Estadística Descrriptiva la parte central de un conjunto de datos.

M di  A i é i    A i é i   d d . Moda Tema 2. Estadística Descrriptiva y Media: Aritmética y Aritmética ponderada. y Moda.Medidas de tendencia central o posición y Las medidas de tendencia central más importantes  son: y Mediana.

de dinero que tienen en sus bolsillos sería el resultado de tomar  todo el dinero de los tres y dividirlo a partes iguales entre cada  uno de ellos. podemos decir que la media  aritmética es la cantidad total de la variable distribuida a partes  iguales entre cada observación. Estadística Descrriptiva total de observaciones. y Expresada de forma más intuitiva.Media Aritmética y Es la suma de todas las observaciones dividida entre el número  Tema 2. Es decir. si en una habitación hay tres personas. (wikipedia) . y p . (wikipedia) y Por ejemplo. la media  j p . la media es una forma de resumir la  i f información de una distribución (dinero en el bolsillo)  ió  d    di t ib ió  (di     l b l ill )  suponiendo que cada observación (persona) tendría la misma  cantidad de la variable.

Cálculo de la media aritmética y Para datos no agrupados: P  d     d n { i =1 i n Para datos agrupados: k X= ∑m f i i i =1 n Donde: mi: punto medio de la clase i fi: frecuencia absoluta de la clase i k: cantidad de clases Tema 2. Estadística Descrriptiva X= ∑x .

Mediana y Es el valor que ocupa la posición central de un  Tema 2. ordenados en forma ascendente o descendente y Divide al conjunto de datos en dos partes iguales. Estadística Descrriptiva conjunto de observaciones. una vez que han sido  ordenados en forma ascendente o descendente. .

g p p . Estadística Descrriptiva y Para datos no agrupados: y Si n es impar: posición donde se ubica la mediana es  i igual a (n+1)/2.Cálculo de la mediana Tema 2. por lo tanto la mediana  será igual al promedio de las dos posiciones centrales. l   ( )/ y Si n es par: (n+1)/2 no es entero.

Estadística Descrriptiva contiene a la observación que ocupa la  p / posición n/2. f(xm): frecuencia absoluta de la clase mediana. ed a a F(xm-1): frecuencia acumulada de la clase anterior a la clase mediana. .Cálc lo de la mediana Cálculo de la mediana y Datos agrupados: clase mediana es la que  D   d   l   di    l     n +1 − F ( xm −1 ) Md = Lm L + 2 C Cm f ( xm ) Donde: o de Lm: límite te inferior e o de la a clase c ase mediana. Cm: amplitud de la clase mediana. mediana Tema 2.

 bimodal o  U   j  d  d   d     i d l  bi d l    multimodal. y Un conjunto de datos puede ser unimodal.Moda y Observación o clase que tiene la mayor frecuencia en  Tema 2. y Es la única medida de tendencia central que se puede  determinar para datos de tipo cualitativo. Estadística Descrriptiva un conjunto de observaciones. .

Cálc lo de la moda Cálculo de la moda y Para datos no agrupados: es simplemente la  P  d     d    i l  l   Δ1 Mo = Lim + Cm Δ1 + Δ 2 Donde: Lim: límite inferior de la clase modal. Estadística Descrriptiva observación que más se repite. Tema 2. y Para datos agrupados: . Δ1: diferencia dif i entre t fi de d lla clase l modal d l y lla anterior. Cm: amplitud de la clase modal (clase de mayor frecuencia). Δ2: diferencia entre fi de la clase modal y la posterior.

Relación entre la media. Estadística Descrriptiva Cuando los datos son sesgados es mejor emplear la Md . la mediana y la moda Tema 2.

XMedia XMediana XModa M d Tema 2. Estadística Descrriptiva Ejemplo de los cálculos de las  medidas de tendencia central: .

Media: datos NO agrupados n i =1 n i 23 + 60 + L + 85 + 61 3929 = = = 65.48 puntos 60 60 Tema 2. Estadística Descrriptiva X= ∑x .

55 puntos 60 Tema 2.Media: datos agrupados k i i i =1 n = 16 × 3 + 29 × 4 + 41× 4 + 54 × 8 + 67 ×12 + 79 × 23 + 92 × 6 60 k X= ∑m f i i i =1 n = 3933 = 65. Estadística Descrriptiva X= ∑m f .

Mediana: datos NO agrupados Para determinar la posición que ocupa la mediana. se  deben ordenar los datos de forma ascendente o  descendente  En este caso los ordenamos de forma  descendente. En este caso los ordenamos de forma  ascendente: 10 15 17 23 25 32 34 36 41     41 43 48 52 52 54 55 57 60 60    61 62 63 64 64 65 67 67 69 70    71 72 74 74 74 75 76 76 77 78    78 79 79 80 80 80 81 81 82 82    833 84 84 85 85 88 89 90 92 95    98 .

5 2 2 Por lo tanto. en este caso n es par.Mediana: datos NO agrupados Se debe determinar si n es par o impar.5 puntos 2 . por lo  tanto al buscar la posición central se tiene: n + 1 60 + 1 = = 30. se debe obtener el promedio de los datos que ocupan  las posiciones centrales 30 y 31: 71 + 72 Md = = 71.

 por lo tanto la clase mediana sería: 6 60.9 6 67 12 31 0.2 0.38 puntos f ( xm ) 12 .3‐72. que corresponde a la clase  que contiene a la observación que ocupa la posición n/2: En nuestro ejemplo la observación que ocupa la posición 30 es 71  puntos.Mediana: datos agrupados Se debe determinar la clase mediana.3 + 2 ×12.6 = 72.52 Al aplicar la fórmula se tiene: n +1 60 + 1 − F ( xm −1 ) − 19 Md = Lm + 2 Cm = 60.

conjunto de datos bimodal Mo1=74 puntos. por esta razón se tiene un  conjunto de datos bimodal. Mo2 80 puntos.Moda: datos NO agrupados La moda corresponde al dato u observación que más  veces se repite. E   En este ejemplo las observaciones: 74 puntos y 80 puntos    j l  l   b i             se repiten 3 veces cada una. Mo2=80 puntos. .

85 puntos Mo t .38 0.6 Δ1 + Δ 2 (23 − 12) + (23 − 6) M = 77. En nuestro ejemplo la clase modal sería: 72.5 79 23 54 0. que corresponde a la que tenga  la mayor frecuencia absoluta (fi).90 Por lo tanto. aplicando la fórmula: Δ1 (23 − 12) Mo = Lim + Cm = 72.9‐85.Moda: datos agrupados Se debe determinar la clase modal.9 + ×12.

55 puntos.¿Qué información se puede obtener de ¿Qué información se puede obtener de  las medidas de tendencia central? y Media: la media aritmética de estas 60 calificaciones. y Mediana: la mediana fue igual a 71. lo que indica que en promedio los  estudiantes obtuvieron buenas calificaciones que les  permitió aprobar la PINA.5 puntos. lo que  i di   indica que la mayoría de los estudiantes obtuvo una   l   í  d  l   di   b     buena calificación.  fue de 65. tiene una  moda de 74 puntos y otra de 80 puntos. y Moda: este conjunto de datos es bimodal.  . pero estos  valores no es que tuvieran una frecuencia mucho  mayor que cualquier otro dato   mayor que cualquier otro dato.

.Deben estudiar por su cuenta. Cualquier duda pueden consultarla. desde la diapositiva 83  D b   di        d d  l  di i i  8   hasta la 93.

Estadística Descrriptiva Propiedades: y La suma de las diferencias entre las media muestral y el  valor de cada observación es cero. y Si todas las observaciones xi se multiplican por una  constante a.Propiedades. . valor de cada observación es cero y La media de una constante es la constante. ventajas y desventajas de la media Tema 2. la X también se debe multiplicar por ese  mismo valor constante.

Propiedades, ventajas y desventajas de la media
y Si se somete a una variable estadística X a un cambio 
Tema 2. Estadística Descrriptiva

de origen y escala, Y = a + bX, la media aritmética de 
dicha variable X varía en la misma proporción  
dicha variable X varía en la misma proporción. 
y La media de la suma de dos variables es igual a la suma 
de sus medias.
de sus medias

Propiedades, ventajas y desventajas de la media

Tema 2. Estadística Descrriptiva

Ventajas:
y Emplea en su cálculo toda la información disponible.
y Se expresa en las mismas unidades que la variable en 
S  
   l   i
  id d  
 l   i bl    
estudio.
y Es el centro de gravedad de toda la distribución, 
s e ce t o de g avedad de toda a d st buc ó ,
representando a todos los valores observados.
y Es un valor único.

Propiedades, ventajas y desventajas de la media
y Se trata de un concepto familiar para la mayoría de las 
Tema 2. Estadística Descrriptiva

personas.
y Es útil para llevar a cabo procedimientos estadísticos 
E  ú il 
 ll
    b  
di i
 
dí i  
como la comparación de medias de varios conjuntos de 
datos.
datos

Propiedades. perdiendo representatividad y Si el conjunto de datos es muy grande puede ser tedioso  su cálculo manual. Estadística Descrriptiva Desventajas: y Se ve adversamente afectada por valores extremos. tanto superior como inferior. y No se puede calcular para datos cualitativos. y No se puede calcular para datos que tengan clases de  extremo abierto  tanto superior como inferior extremo abierto. ventajas y desventajas de la media Tema 2. .  perdiendo representatividad.

Estadística Descrriptiva Ventajas: y Fácil de calcular si el número de observaciones no  es muy grande.   l  i fl  l   l   l y Fácil de entender. y No se ve influenciada por valores extremos.Ventajas y desventajas de la mediana Tema 2. . ya  que solo influyen los valores centrales.

. Estadística Descrriptiva cuantitativos. incluso los datos con clase de extremo  abierto.Ventajas y desventajas de la mediana y Se puede calcular para cualquier tipos de datos  Tema 2. abierto y Es la medida de tendencia central más representativa  en el caso de variables que solo admiten la escala  ordinal.

. ibl y No pondera cada valor por el número de veces que se  ha repetido.Ventajas y desventajas de la mediana Tema 2. ha repetido y Hay que ordenar los datos antes de determinarla. Estadística Descrriptiva Desventajas: y No utiliza en su “cálculo” toda la información  di disponible.

.Ventajas y desventajas de la moda Tema 2. y Puede usarse para datos tanto cuantitativos como  P d      d t  t t   tit ti     cualitativos. y Fácil de interpretar. y No se ve influenciada por valores extremos. ác de te p eta . Estadística Descrriptiva Ventajas: y No requiere cálculos. y Se puede calcular en clases de extremo abierto.

Ventajas y desventajas de la moda Tema 2. y No siempre existe. . si los datos no se repiten. Estadística Descrriptiva Desventajas: y Para conjuntos pequeños de datos su valor no  tiene casi utilidad. si es que de hecho existe. y No utiliza toda la información disponible. Solo  i   i  ilid d   i     d  h h   i  S l   tiene significado en el caso de una gran cantidad  de datos.

Estadística Descrriptiva no representativa se el valor más frecuente del  conjunto de datos. j  d  d y Difícil de interpretar si los datos tiene 3 o más modas.Ventajas y desventajas de la moda y En ocasiones. el azar hace que una sola observación se  Tema 2. .

variación o variabilidad .Medidas de dispersión. variación  Medidas de dispersión.

 con respecto al valor central. y Son valores numéricos que indican o describen la  X Tema 2. variación o variabilidad. Estadística Descrriptiva forma en que las observaciones están dispersas o  di diseminadas. i d       l  l   l .Medidas de dispersión.

Estadística Descrriptiva observaciones con el mismo valor central pueden tener  una variabilidad muy distinta.Medidas de dispersión. variación o variabilidad. y Son importantes debido a que dos muestras de  Tema 2. una variabilidad muy distinta .

Medidas de dispersión. y Rango. Tema 2. y Varianza. Estadística Descrriptiva y Desviación Típica. . y Coeficiente de variación. variación o variabilidad.

 es simplemente la    l    i l  l   diferencia entre la mayor y menor observación.Medidas de dispersión: Rango Tema 2. y Es una medida de dispersión absoluta. . Estadística Descrriptiva Rango (amplitud o recorrido): y Está determinado por los dos valores extremos  d  l  d de los datos muestrales. ya que  depende solamente de los datos y permite  conocer la máxima dispersión.

Estadística Descrriptiva de dos valores. distribución y Notación: R .Medidas de dispersión: Rango y Casi no se emplea debido a que depende únicamente  Tema 2. y No proporciona una medida de variabilidad de las  N   i     did  d   i bilid d d  l   observaciones con respecto al centro de la  distribución.

 σ2.xx2. var(X) . Estadística Descrriptiva relativa porque depende de la posición de los datos  x1. observación con respecto a la media y Notación: s2. con respecto a la media y Es el promedio al cuadrado de las desviaciones de cada  observación con respecto a la media.Medidas de dispersión: Varianza y Es un valor numérico que mide el grado de dispersión  Tema 2.xxn con respecto a la media.….

Estadística Descrriptiva grande se dice que los datos tiene una mayor  variabilidad que un conjunto de datos que tenga  un varianza menor. .Medidas de dispersión: Varianza y Si la varianza de un conjunto de observaciones es  ∑ (x − x ) n Para datos NO agrupados: s2 = 2 i =1 i n n s = 2 2 x ∑ i i =1 n −x 2 Tema 2.

Medidas de dispersión: Varianza Para datos agrupados en una distribución de  frecuencias: k s2 = ∑ (m − x ) i =1 2 i × fi n k s2 = 2 m ∑ i × fi i =1 n − (x ) 2 .

Medidas de dispersión: Desviación Típica y Es la raíz cuadrada de la varianza. σ. Tema 2. Estadística Descrriptiva s= s 2 . E  l   í   d d  d  l   i y Notación: s.

y No tiene dimensiones. Estadística Descrriptiva comparar el nivel de dispersión de dos muestras  de variables estadísticas diferentes. y Notación: CV .Medidas de dispersión: Coeficiente de  Variación y Es una medida de dispersión relativa que permite  s CV = ×100% x Tema 2.

X Desviación Típica. X Coeficiente de Variación. Tema 2. R .Ejemplo de los cálculos de las  j p medidas de dispersión: X Varianza. Estadística Descrriptiva X Rango.

Rango: R Tema 2. Estadística Descrriptiva R= Observaciónmayor – Observaciónmenor R =   98 – 10  R  88 puntos R= 88 puntos .

62 puntos 2 60 60 2 .98 = = = 439.48) 2 + L + (61 − 65.63 = 4727.Varianza (S2): Datos NO agrupados Recuerde que se puede usar cualquiera de estas dos  expresiones: ∑ (x − x ) n s = 2 2 i i =1 n (23 − 65.482 = − 4287.25 − 4287.48) 2 26350.63 = 439.18 puntos 2 60 60 n s = 2 ∑x i =1 n 2 i 232 + 60 2 + L + 612 283635 −x = − 65.48) 2 + (60 − 65.

55) 2 = − 4296.52 ppuntos 2 s = 2 i =1 2 (16 − 65.2 Varianza (S ): Datos agrupados Recuerde que se puede usar cualquiera de estas dos  expresiones: k s = 2 ∑ (m − x ) 2 i i =1 × fi n k ∑m 2 i × fi − (x ) n s 2 = 409.51 puntos 2 60 16 2 ×3 + 29 2 × 4 + L + 92 2 × 6 282379 = − (65.55) 2 × 4 + L + (92 − 65.55) 2 × 6 = = 409.80 puntos 2 60 60 .55) 2 × 3 + (29 − 65.

18 = 20.96 p puntos 2 .Desviación Típica (S): Datos NO agrupados s = s = 439.

Desviación Típica (S): Datos agrupados s = s = 409.24 p puntos 2 .51 = 20.

Coeficiente de Variación (CV): Datos NO Coeficiente de Variación (CV): Datos NO  agrupados CV = s 20.96 ×100% = ×100% = 0.3201*100 = 32.01% 65.48 x .

3087 *100 = 30.55 x .Coeficiente de Variación (CV): Datos Coeficiente de Variación (CV): Datos  agrupados CV = s 20.24 ×100% = ×100% = 0.87% 65.

  en este caso notas de la PINA muy bajas y otras muy  altas. nos indica que  q q este conjunto de datos tiene una dispersión o variación  elevada con respecto al valor central (media). es decir. que es un valor significativamente  grande si se compara con los valores que toma esta  variable. no  están concentradas alrededor del valor central.18 puntos2.  .  aunque sus unidades están al cuadrado. altas y Varianza: la varianza calculada es de 439. Esto indica que hay valores muy distanciados. lo que  significa que estas notas varían mucho.¿Qué información se puede obtener de ¿Qué información se puede obtener de  las medidas de dispersión? y Rango: la dispersión máxima de este conjunto de datos  es 88 puntos.

01%.96 puntos. y que existen estudiantes que obtuvieron  notas muy por debajo y muy por encima de la media. . y Coeficiente de Variación: toma un valor de 32. lo  que indica que la variación de estas notas en la PINA es  elevada.¿Qué información se puede obtener de ¿Qué información se puede obtener de  las medidas de dispersión? y Desviación típica: toma un valor de 20.  i di indicando que existe una variación elevada en estas  d     i     i ió   l d       notas de la PINA.

 desde la diapositiva 116  D b   di        d d  l  di i i   6  hasta la 122. . Cualquier duda pueden consultarla.Deben estudiar por su cuenta.

Estadística Descrriptiva Ventajas: y Útil cuando se quiere conocer la extensión de las  variaciones extremas (valor máximo de la dispersión). . i i    ( l   á i  d  l  di ió ) y Fácil de calcular.Ventajas y Desventajas del Rango Tema 2.

y No se puede calcular en distribuciones de límite de  N     d   l l    di ib i  d  lí i  d   clase abierto.Ventajas y Desventajas del Rango Tema 2. y Solo emplea dos valores en su cálculo. . Estadística Descrriptiva Desventajas: y No es una MD con respecto al centro de la  di ib ió distribución.

 la  varianza de Y será Var(Y) = b i  d  Y  á V (Y)   b2Var(X) V (X) . La varianza de una constante es cero. Siempre es mayor o igual a cero y menor que infinito. Si a una variable X la sometemos a Y=a+bX. 2.d d d l Propiedades. 3. Ventajas y Desventajas de la  Varianza Tema 2. Estadística Descrriptiva Propiedades: 1.

d d d l Propiedades. Desventajas: j y No proporciona ayuda inmediata cuando se estudia la  dispersión de un solo conjunto de datos. Estadística Descrriptiva Ventajas: y Es útil cuando se compara la variabilidad de dos o más  conjuntos de datos. . y Difícil de interpretar por tener sus unidades elevadas al  cuadrado. Ventajas y Desventajas de la  Varianza Tema 2. conjuntos de datos y Utiliza toda la información disponible.

Ventajas y Desventajas de la Desviación Típica

Tema 2. Estadística Descrriptiva

Ventajas:
y Esta expresada en las mismas unidades que la variable 
en estudio.
 
di
y Utiliza todas las observaciones en su cálculo.
y Fácil de interpretar.
Fá il d  i
Desventajas:
y No tiene.
N  ti

d l
f
d
Ventajas y Desventajas del Coeficiente de 
Variación

Tema 2. Estadística Descrriptiva

Ventajas:
y Es la única MD que permite comparar el nivel de 
di
dispersión de dos muestras de variables diferentes.
ió  d  d  
 d   i bl  dif
y Emplea toda la información disponible en su cálculo.
y Fácil de calcular.
Fá il d   l l

d l
f
d
Ventajas y Desventajas del Coeficiente de 
Variación

Tema 2. Estadística Descrriptiva

Desventaja:
y No es una MD con respecto al centro de la distribución 
d  l  d
de los datos.

Medidas de Forma .

 por lo tanto. sirven para corroborar lo que los gráficos muestran .Medidas de Forma y Son medidas numéricas que permiten determinar la  Medidas de forma -Asimetría Coeficiente de Pearson Coeficiente de Fisher -Kurtosis o apuntamiento Tema 2. Estadística Descrriptiva forma que tiene la curva de los datos.  sirven para corroborar lo que los gráficos muestran.

Medidas de Forma: Asimetría y Permiten estudiar la forma de la curva. Estadística Descrriptiva . dependiendo  de cómo se agrupan los datos. Tema 2.

Medidas de Forma: Asimetría ( 3 X − Md ASP = s ) 9 Interpretación: = 0. y Cálculo: Cál l . X>Md Asimétrica Positiva < 0. X=Md Simétrica ASP > 0. 0 X<Md Asimétrica Negativa Tema 2. Estadística Descrriptiva Coeficiente de Asimetría de Pearson: C fi i  d  A i í  d  P y Fácil de calcular e interpretar..

Estadística Descrriptiva ∑(x − X ) n . pero si su interpretación.Medidas de Forma: Asimetría Coeficiente de Asimetría de Fisher: C fi i  d  A i í  d  Fi h y No es de fácil cálculo. ASF = i =1 3 i ns ∑(M − x) × f k ASF = Datos NO agrupados 3 i =1 3 i ns3 i Datos Agrupados Tema 2.

Asimétrica Positiva < 0.Medidas de Forma: Asimetría 9 Interpretación: ASF > 0. Estadística Descrriptiva = 0. Asimétrica Negativa Tema 2. Simétrica .

Medidas de Forma: Kurtosis y Miden si los valores de la distribución están más o  Tema 2. y Se definen tres tipos de distribución según su grado  d  K t i de Kurtosis: . Estadística Descrriptiva menos concentrados alrededor de los valores medios  de la muestra (zona central de la distribución).

.Medidas de Forma: Kurtosis y Mesocúrtica: grado de concentración medio  Tema 2. L ú i   d  d   ió   l d y Platicúrtica: grado de concentración reducido. Estadística Descrriptiva alrededor de los valores centrales de la variable. y Leptocúrtica: grado de concentración elevado.

Estadística Descrriptiva ns −3 4 .Medidas de Forma: Kurtosis ∑ (x − X ) n CK = i =1 4 i ∑ (M k CK = i =1 ) Datos No Agrupados 4 i − X × fi ns 4 −3 Datos Agrupados 9 Interpretación: =0 Mesocúrtica CK >0 Leptocúrtica <0 Platicúrtica Tema 2.

Ejemplo de los cálculos de las  j p medidas de forma: Coeficiente de Pearson. K t i Tema 2. X X Kurtosis. Estadística Descrriptiva X Asimetría: A i tí . X Coeficiente de Fisher.

96 y Datos agrupados: ( ) 3 X − Md 3(65.8616 s 20.48 − 71.38) ASP = = = −1.0124 s 20.24 .Medidas de forma: Coeficiente de Medidas de forma: Coeficiente de  Pearson.5) ASP = = = −0.55 − 72. y Datos NO agrupados: ( ) 3 X − Md 3(65.

963 − 512769.48)3 +L+ (61− 65.Medidas de forma: Coeficiente de Medidas de forma: Coeficiente de  Fisher.84 .9281 552490. y Datos NO agrupados: ∑(x − X ) n ASF = i =1 3 i ns3 (23− 65.191 = = −0.48)3 + (60− 65.48)3 = 60× 20.

55)3 ×3 + (29− 65.243 − 464760.19 .55)3 × 4 +L+ (92− 65.9342 497488.55)3 × 6 = 60× 20. y Datos agrupados: ∑(M − x) × f k ASF = i =1 3 i ns3 i (16− 65.885 = = −0.Medidas de forma: Coeficiente de Medidas de forma: Coeficiente de  Fisher.

48)4 + (60 − 65.48)4 + L + (61− 65.96 36097814.1172 − 3 = 0.97 − 3 = 3.Medidas de forma: Coeficiente de Medidas de forma: Coeficiente de  Kurtosis y Datos NO agrupados: ∑ (x − X ) n CK = = i =1 4 i ns4 (23 − 65.09 .48)4 −3 = −3 4 60 × 20.1172 11580208.

55)4 × 4 + L + (92 − 65.24 30507377.0298 − 3 = 0.55)4 × 6 −3 = −3 4 60 × 20.0298 10069160.36 − 3 = 3.Medidas de forma: Coeficiente de Medidas de forma: Coeficiente de  Kurtosis y Datos agrupados: ∑ (M k CK = = i =1 ) 4 i − X × fi ns4 (16 − 65.95 .55)4 × 3 + (29 − 65.

 la asimetría es negativa. . la  mayoría de los estudiantes sacaron buenas  calificaciones. que tiene  una frecuencia mucha mayor que el resto de posibles  valores. por lo tanto. es decir. indica que estas  y q calificaciones tienen un comportamiento leptocúrtico.¿Qué información se puede obtener de ¿Qué información se puede obtener de  las medidas de forma? y Coeficientes de Asimetría: al ser sus valores menores  que cero.  es decir. y Kurtosis: al ser su valor mayor a cero. indican que para estas calificaciones de la  PINA. existe un intervalo de calificaciones. la  frecuencia de las calificaciones bajas es menor que la  frecuencia de las calificaciones altas.

Referencias: y Wikipedia(http://es. y Triola. Pearson. Probabilidad y Estadística.org/wiki/Wikipedia:Po rtada) y Walpole y Myers.wikipedia. Estadística. Mario F. Triola  Mario F  Estadística  Pearson . Mc Graw‐ W l l    M  P b bilid d   E dí i  M  G Hill.