Está en la página 1de 67

SMC

1

ESTADISTICA DESCRIPTIVA

Prof.: Sergio Moscoso Cerda

  • 1.0 Definiciones Básicas

  • 1.1 Estadística: Es la disciplina que se preocupa de recopilar, organizar y analizar

datos cuantitativos o cualitativos para luego emitir una opinión y posteriormente

tomar una decisión

La estadística se divide en dos partes

Estadística :

Descriptiva o Exploratoria ⎪ ⎨ ⎪

Inferencial

  • 1.2 Estadística Descriptiva

La Estadística Descriptiva es la que trabaja con todos los elementos de una

muestra y los cálculos realizados sólo son validos para dicha muestra.

  • 1.3 Estadística Inferencial

Es la que hace que todas las mediciones

hechas a una muestra sean validas

para la población de la que se sacó la muestra.

  • 1.4 Rol de la Estadística en la investigación Científica

Una

de las características del hombre es que busca constantemente una

explicación racional de los fenómenos que lo rodean.

Es tarea propia de la ciencia el observar adecuadamente los hechos, discernir que elementos son constantes en ellos y determinar las leyes que lo rigen, es decir, sus relaciones constantes y universales.

  • 1.5 El Método Científico

Es el método propio de la ciencia, el que se aplica al ciclo completo de una

investigación, desde el resultados obtenidos.

enunciado del problema hasta la

evaluación de los

En el método científico podríamos distinguir en forma esquemática, y con las limitaciones que esto supone, las siguientes etapas:

SMC

2

Método Científico:

Enunciado del problema ⎪ ⎪

Formulación de la(s) Hipótesis ⎪ ⎨ ⎪

Verificación de la(s) Hipótesis

Interpretación de los resultados

  • - Enunciado y elección del problema La elección de un problema se hace con el fin de averiguar sus causas que

lo producen o de encontrarle soluciones al problema, dependerá de los juicios de valor del investigador y de las condiciones sociales, políticas y económicas en las cuales se desarrolla la ciencia.

El enunciado puede hacerse a través de la descripción de la situación problema o mediante el planteamiento de una pregunta.

  • - Formulación de una Hipótesis La hipótesis es una explicación de la situación problema o una respuesta posible a la pregunta planteada. Se formula en términos afirmativos respecto a relaciones entre variables pertinentes.

- Verificación de la(s) hipótesis

Siendo la hipótesis una explicación o una respuesta general, muchas veces no es posible investigar directamente su veracidad. Se procede en estos casos a deducir en forma lógica consecuencias particulares de la hipótesis

La verificación puede hacerse, sobre todo en las ciencias exactas, mediante demostraciones teóricas basadas en relaciones aceptadas en el estado actual del conocimiento.

En el campo de las ciencias sociales la verificación se hace, a través de la recolección de información o de observación de los fenómenos. Esto implica la aplicación de una serie de procedimientos estadísticos.

  • - Interpretación de los resultados Con los datos obtenidos en la etapa anterior se decide si se ha de rechazar o no la hipótesis en estudio.

SMC

3

La verdad absoluta, seguirá siendo la meta final y desconocida del método científico. Los logros se reducirán a construir un cuerpo de conocimientos con estructura lógica y soportes racionales que resista la verificación empírica.

1.6 El Método Estadístico

Es un conjunto de procedimientos aplicados en secuencia lógica a la obtención y análisis de datos. Es el Método Estadístico el que nos proporciona las técnicas necesarias para recolectar y analizar la información requerida. En el que se

distinguen las siguientes etapas

Etapas del método Estadístico:

Planificación ⎪ ⎨ ⎪

Ejecución

1.6.1 La etapa de Planificación

En esta etapa debemos considerar las siguientes fases

Definición de Objetivos

Definición del Universo

Etapa de Plabificación: Diseño Muestral

Definición de unidades de observación

⎪ ⎩ Plan de tabulación y análisis

  • - Definición de objetivos Corresponde formalmente a la descripción del problema que da origen a la investigación. Se debe señalar detalladamente lo que se pretende investigar, es decir, dar respuestas a:

    • - el qué

    • - cómo

    • - donde

    • - cuando

    • - por qué

SMC

4

  • - Definición del Universo o Población Se debe definir el grupo del cual se extraerá la información y a la cuál se referirán los resultados.

  • - Diseño de la muestra La teoría de Muestreo o de Diseño y Análisis de Experimentos puede garantizarnos que la información que generaremos nos permitirá proyecciones válidas al universo de interés.

  • - Definición de las unidades de observación, escalas de clasificación y unidades de medidas Puede ocurrir que en una misma investigación tenga varios objetivos específicos que requieran estudiar unidades de observación diferentes. Por lo tanto, se debe definir claramente las unidades de observación

  • - Preparación del plan de tabulación y análisis El cuidado en este aspecto nunca podría considerarse excesivo, debería llegarse, tal vez, hasta considerar alternativas de análisis adecuadas para compensar algunas alteraciones accidentales del plan de trabajo.

1.6.2 La etapa de Ejecución

En esta etapa podemos reconocer las siguientes fases:

Recolección de la información

Etapa de Ejecución: Elaboración de la información

Análisis de resultados

  • - Recolección En esta etapa se recoge la información cualitativa o cuantitativa. Dado que los datos recogidos suelen tener diferentes magnitudes (ej. peso y estatura) puede decirse que esta etapa consiste en la medición de las variables. La recolección puede realizarse de diferentes maneras, a veces por simple observación y en otras ocasiones se requieren complejos procedimientos de medición La calidad técnica de esta etapa es fundamental ya que de ella depende que se disponga de datos exactos y confiables en los cuales se fundamentan las conclusiones de toda investigación

SMC

5

  • - Elaboración de los informes En esta etapa se elaboran los cuadros y los gráficos que permiten una inspección precisa y rápida de los datos Presentar la misma información tanto en un cuadro como en su correspondiente gráfico permite obtener un a clara idea de la distribución de las frecuencias de las características estudiadas

  • - Análisis de resultados En esta etapa, mediante formulas estadística apropiadas y el uso de tablas específicamente diseñadas, se efectúan las comparaciones de las estadísticas. El análisis estadístico de los datos consiste en la comparación de estadísticos con el propósito de decidir si existen diferencias significativas. Cada prueba de análisis estadístico debe utilizarse siempre en función del tipo de diseño de investigación que se haya seleccionado para la comprobación de cada consecuencia verificable deducida a partir de la hipótesis general de investigación

1.7 Población: Es obvio que todo estudio ha de estar referido a un conjunto de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos

Población

 

Las

personas

o

cosas

que forman parte de la población se denominan

elementos.

 

En sentido estadístico un elemento puede ser algo con existencia real, como un computador o una casa, o algo más abstracto como un voto o un intervalo de tiempo.

A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Así, por ejemplo si consideramos como elemento a una persona, podríamos distinguir en ella las siguientes

características de interés:

Sexo Edad Nivel educacional Profesión Peso Color de pelo Religión. Etc.

Según su tamaño la población se puede dividir en:

SMC

6

Población :

Población Finita

Población Infinita

Población finita

Cuando el número de elementos que forman la población es contable, por

ejemplo el número de estudiantes por clase

Población infinita

Cuando el número de elementos que forman la población es no contable, por

ejemplo el número de productos que hay en el mercado.

Ahora bien, por lo general en un estudio estadístico no se puede trabajar con todos los elementos de la población por un asunto de costo o de imposibilidad de tener toda la información, sino que se realiza sobre un subconjunto de la población, lo que llamaremos Muestra

1.8 Muestra

Es un subconjunto de la población y se llama muestra o subpoblación, por ejemplo al hacer un estudio sobre los estudiantes de la Universidad se podrá tomar a los estudiantes que cursan tercer año y de este subconjunto sólo a los

estudiantes varones.

Existen dos grandes formas para seleccionar una muestra:

Muestreo :

Aleatorio o Probabilístico

No aleatorio o de Juicio

  • - Muestreo Aleatorio o Probabilístico

En este tipo de muestreo, todos los elementos de la población tienen la misma

chance de figurar en la muestra

  • - Muestreo no Aleatorio o de Juicio

En este tipo de muestreo, se usa el conocimiento y la opinión personal para

identificar los elementos de la población que van a incluirse en la muestra.

En ocasiones, el muestreo no aleatorio sirve de muestra piloto para decidir como seleccionar después una muestra aleatoria.

SMC

7

Como nuestro trabajo lo debemos realiz ar con muestras obtenidas de alguna población, de modo que al realizar un muestreo lo podemos hacer aplicando uno o más de los siguientes métodos de muestreo:

i) Muestreo Aleatorio

Los elementos incluidos en esta muestra han sido seleccionados mediante algún procedimiento de sorteo o azar que signa alguna chance no nu la a cada elemento

de la población, hablamos de Muestreo Aleatorio Simple.

Ejemplo 1:

Un curso tiene 20 alumnos y en el se realiza el siguiente experimento consistente en elegir 4 alumnos cualesquiera del curso, para hacer la selección se listan los alumnos por apellido del 1 al 20, luego se colocan en una bolsa las fichas numeradas y posteriormente se sacan a ciegas una tras otra las cuatro fichas y sin devolverlas a las bolsa (también se puede sacar las cuatro a la vez). El número escogido, corresponde al alumno que lleva ese número en la lista del curso.

¿Cuántas muestras podríamos escoger?

Para dar respuesta Combinación:

a la pregunta anterior es necesario definir el concepto de

Una combinación se define como:

n

⎝ ⎠

=

n !

(

)

!

r!

rnr

;

∀∈

n

, 0

≤ ≤

r

n

Por lo tanto, es posible determinar la cantidad de muestras posibles como:

Donde

20

4

=

20!

4! (20

4)!

= 4845

SMC

8

20!

(tamaño de la población)!

=

4!(20

4)!

(tamaño de la muestra)! (tamaño de la población

⋅−

tamaño de la muestra)!

Algunos tipos de muestreos son:

Muestreo por Estratos

En muchas situaciones, existe un factor que divide naturalmente a la población de

interés en subpoblaciones o Estratos más o menos homogéneos. Este

procedimiento de muestreo puede darnos mayor precisión que el muestreo

aleatorio simple, pero a un costo mayor.

Ejemplo: Hacer un estudio por estratos socioeconómicos

Ejemplo 2:

Si en el ejemplo 1 el curso esta formado por 12 hombres y 8 mujeres. Según esta

división del curso estaría dividida por estratos. El primer estrato compuesto por los

alumnos hombres y el segundo por las alumnas mujeres.

Si se hace un muestreo aleatorio no tendríamos garantía de que la muestra

contenga la misma proporción de hombres y mujeres que hay en la población. Si

se quiere asegurar que los estratos en que se ha dividido la población estén

presentes en la muestra en la misma proporción de la población, entonces, se

debe tomar una muestra aleatoria de cada estrato con tamaño proporcional al que

tiene el estrato poblacional (muestreo aleatorio estratificado). En el ejemplo la

proporción del estrato hombres es 60% y la proporción del estrato mujeres es

40%.

Así, si deseamos escoger 4 alumnos cualquiera del curso, de modo que los

estratos hombres y mujeres queden representados en la misma proporción como

lo están en la población, entonces se debe elegir 2,4 hombres (la aproximación,

siempre, se hace por exceso), es decir, se seleccionan 3 hombres y 2 mujeres.

¿Cuántas muestras del tipo anterior se pueden escoger?

Los Hombres se pueden elegir de

12

3

12!

=

3! (12

3)!

= 220

Las mujeres se pueden elegir de

⎛ ⎞

8

⎝ ⎠

2

=

8!

2! (8

2)!

= 28

SMC

9

Por lo tanto, hay 220 formas diferentes de seleccionar a los hombres y 28 formas

diferentes de seleccionar a las mujeres, entonces el total de muestras posibles es

 

⎛ ⎞⎛ ⎞

12

8

 
 

= 6160

 
 

⎟⎜

⎝ ⎠⎝ ⎠

3

2

Es decir,

tamaño del trimer estrato

tamaño de la muestra en el estrato

⎞⎛

⎟⎜ ⋅

⎠⎝

tamaño del segundo estrato

tamaño de la muestra en el estrato

Muestreo Sistemático

Los elementos se seleccionan de la población con un intervalo uniforme que se

mide en el tiempo, en el orden o en el espacio.

Ejemplo 3:

Se quiere entrevistar a todo décimo estudiante de una escuela.

Deberíamos asignar a cada estudiante un número entre 00 y 99 y luego se

comienza a escoger una muestra; cada décimo número, es decir, 1, 11, 21, y así

sucesivamente. Los estudiantes asignados con los números 2, 3, 4 y 5 no tendrán

oportunidad alguna de ser seleccionado.

Muestreo por Conglomerados

En este caso se divide la población en grupos o conglomerados y luego se

selecciona una muestra aleatoria de ellos. Este muestreo se usa cuando se

advierte considerable variación dentro de cada grupo pero esencialmente

semejantes entre sí.

Ejemplo 4:

Sí un equipo de investigación de mercados esta tratando de determinar por

muestreo el número promedio de TV. por familia en una ciudad, podría utilizar un

mapa de la ciudad para dividir el territorio en manzanas y luego seleccionar cierto

número de manzanas (Conglomerados) para realizar la entrevista.

Como hemos visto, los caracteres o datos de un elemento pueden ser de muy

diversos tipos, por lo que los podemos clasificar en dos tipos de variables:

SMC

10

Variables :

Cuantitativas

Cualitativas

Variables Cuantitativas: son las que se describen por medio de números tales

como el peso, la estatura, número de hermanos, etc., las observaciones de este

tipo se definen, por lo general, sobre un intervalo o sobre una escala de

proporciones.

Las mediciones que se definen en una escala de intervalo se pueden distinguir y

ordenar en forma numérica y sus diferencias son significativas por ejemplo la

medición de la temperatura. Pude escogerse entre registrar la temperatura en

grados Celsius o en grados Fahrenheit. De esta forma el origen de las escalas es

diferente, pero el significado de la diferencia entre 10ºC y 15ºC es el mismo que

tiene la diferencia entre 20ºFy 25ºF.

Si una medición reúne los requisitos de una escala de intervalo y además tiene

punto de origen, entonces la medición se define sobre una escala de

proporciones. Por ejemplo, las estaturas, los pesos y otros se encuentran

definidos sobre una escala de proporciones ya que tienen verdaderos puntos

ceros

Además, este tipo de variables se puede dividir en:

Variables Cuantitativas:

Discretas

Continuas

Variables Discretas: Son aquellas que se describen solo por un número entero,

es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la

unidad, por ejemplo el número de hijos por pareja

Variables Contínuas: Son aquellas que por su naturaleza admiten que entre dos

valores la variable pueda tomar cualquier valor intermedio, por ejemplo el peso, la

estatura, etc.

En muchos casos el tratamiento estadístico hace que la variable discreta se

trabaje como continua y viceversa

SMC

11

Variables Cualitativas o Atributos: son las que indican una cualidad o atributo,

por ejemplo sexo, religión, profesión, etc.

Estas variables se pueden clasificar en:

Variables Cualitativas:

Nominales

Ordinales

Variables Ordinales: Son aquellas que sugieren una ordenación, por ejemplo

nivel de agresividad de un estudiante, satisfacción con un servicio, etc.

Variables Nominales: Es la que emplea un nombre o un número para denominar

una característica de interés, por ejemplo, las personas pueden clasificarse de

acuerdo con su sexo, en este caso pueden emplearse los símbolos “M y H” ó “0

y 1”

El siguiente diagrama se esquematiza los tipos de variables

Tipos de variables:

⎪ ⎪

⎪ ⎩

Cualitativas:

Nominales:No hay ningún orden en las categorias

⎨ ⎩

Ordinales: Hay un orden en las categorias

Cuantitativas:

Discretas: Conteo de casos

⎨ ⎩

Continuas:Mediciones de caracteristic as

2.0 0rdenamiento de la información

En este punto nos vamos a ocupar de Estadística Unidimensionales, es decir,

donde el interés es una característica de cada punto muestral.

El ordenamiento se hace en tablas de frecuencias también llamadas tablas

estadísticas las que podemos clasificar según el número de observaciones y

según el recorrido de la variable.

Tablas tipo I

Cuando el tamaño de la muestra y el recorrido de la variable es pequeño, por

SMC

12

Tablas tipo II

Cuando el recorrido de la variable es pequeño y el tamaño de la muestra es

grande por lo tanto hay valores de la variable que se repiten.

Ejemplo 5:

La siguiente muestra corresponde a la cantidad de personas que trabajan por

familia

 

Cantidad de persona que trabajan por familia

 

2

 
  • 1 2

 
  • 1 2

    • 2 4

   

1

 
  • 1 2

2

  • 3 2

   
  • 1 4

  • 1 3

 

2

  • 2 1

 

2

  • 2 1

   
  • 1 3

    • 1 1

   

2

  • 2 2

 

3

  • 2 3

   
  • 2 1

    • 4 2

   

4

 
  • 1 3

1

  • 3 4

   
  • 2 1

    • 2 2

   

3

  • 3 4

 

Se puede observar que el recorrido de la variable va de 1 a 4, por lo tanto al hacer

un conteo de la variable se tiene la siguiente tabla

Tabla 1

 

Personas que trabajan

 

Nº de

 

familias

 
  • 1 16

   
 
  • 2 20

   
 
  • 3 9

   
 
  • 4 5

   
 

Total

   

50

Tablas tipo III

 

Cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo

tanto será necesario agrupar en intervalos de clases.

 

Ejemplo 6:

 

La siguiente muestra corresponde a los ingresos semanales, en miles de pesos,

de 50 trabajadores de la empresa SAM y Cía. Ltda.

 

93

 
  • 74 77

86

107

 

92

 

77

 
  • 87 77

100

 

80

 
  • 94 66

105

88

 

107

 

95

  • 69 80

 

83

105

 
  • 78 86

98

  • 79 97

   

112

  • 97 79

 

96

103

 
  • 82 87

89

  • 86 93

   

104

  • 77 87

 

114

91

 
  • 87 90

87

  • 92 89

   

86

  • 96 73

 

94

SMC

13

Evidentemente, el recorrido de la variable es grande, por lo tanto necesitamos

tabular con intervalos de clases. Para decidir sobre la cantidad de intervalos se

debe tener en cuenta las siguientes consideraciones:

  • - Al tomar pocos intervalos “aumenta la perdida de información”

  • - Los intervalos pueden ser Cerrados o Semicerrados

  • - Normalmente se suele trabajar con no más 10 o 12 intervalos

  • - Una forma de establecer la cantidad de intervalos de clases necesario esta dado

por:

Cantidad de intervalos de clase = 1+3.3 log n

Donde “n” es el tamaño de la muestra

Ejemplo: tabulemos la muestra anterior en cinco intervalos de clases semi-cerrados,

como tenemos que el recorrido real va de 66 a 114 y al modificar el recorrido de 65 a

115.

Por lo tanto, la amplitud del recorrido modificado es 50 y, como la tabulación es de 5

intervalos luego la amplitud de cada intervalo de clase es de 10, por lo tanto,

tenemos la siguiente tabla

 

Tabla 2

 

Intervalos de

 

Clase

Conteo

Y i-1 - Y i

65

-

75

4

75

-

85

11

85

-

95

20

95

-

105

9

105

-

115

6

Total

50

Ejemplo: tabulemos la muestra anterior según la cantidad de intervalos dados por

Cantidad de intervalos: 1+3,3log 50 = 6.6

Y, aproximando a 7 intervalos se tiene:

SMC

14

Intervalos de clases

Conteo

y

i

1

y

i

  • 66.00 – 72.86

 

2

  • 72.87 – 79.73

 

9

  • 79.74 – 86.60

 

8

  • 86.61 – 93.47

 

14

  • 93.48 – 100.34

9

  • 100.35 – 107.21

6

  • 107.22 – 114.08

2

2.1 Tipos de frecuencias

Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la

tabulación de resultados, es decir, recoger la información de la muestra resumida

en una tabla en la que a cada valor de la variable se le asocian determinados

números que representan el número de veces que ha aparecido. Estos números

se denominan frecuencias. Así se tienen las siguientes frecuencias:

Frecuencias :

Absolutas

Relativas (

()

n

i

h

i

)

Absolutas Acumulada (N )

i

Relativa Acumulada (H )

i

Frecuencia Absoluta

Esta frecuencia la denotaremos n i y la definiremos como el número de veces que

aparece en la muestra un valor de la variable. La suma de todas las frecuencias

absolutas es igual al tamaño de la muestra, es decir

n

i = 1

n = n

i

Esta frecuencia en una medida que está influida por el tamaño de la muestra, al

aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia

absoluta. Esto hace que no sea una medida útil para comparar por esto es

necesario introducir el concepto de frecuencia relativa

SMC

15

Frecuencia relativa

Esta frecuencia la denotaremos h i y la definiremos como el cuociente entre la

frecuencia absoluta y el tamaño de la muestra

h

i

=

n

i

n

;

0 ≤≤ h 1

i

La frecuencia relativa es un tanto por uno, sin embargo se puede escribir en tanto

por ciento. La suma de todas las frecuencias relativas deber igual a uno

n

i = 1

h i
h
i

= 1

Frecuencia Absoluta Acumulada (N i )

Para poder calcular este tipo de frecuencia hay que tener en cuenta que la

variable estadística ha de ser cuantitativa o cualitativa ordenable. La frecuencia

Absoluta Acumulada es el número de observaciones que hay desde el valor menor

de la variable hasta un valor determinado de ella. Esta frecuencia tiene dos

propiedades.

 

a)

La primera frecuencia absoluta acumulada es igual a la primera frecuencia

absoluta: (

N = n

1

1

)

b)

La última frecuencia absoluta acumulada es igual al tamaño de la muestra, es

decir N n = n

 

Frecuencia Relativa Acumulada (H i )

Es el porcentaje de observaciones que hay desde el valor menor de la variable

hasta un valor determinado de ella. Esta frecuencia tiene dos propiedades

a)

La primera frecuencia relativa acumulada es igual a la primera frecuencia

relativa (

H = h

1

1

)

b)

La última frecuencia relativa acumulada es igual a uno (1), H n = 1

SMC

16

Ejemplo 7: Del Ej.5 se tiene se obtiene la tabla 3

Personas

Nº de

 

que

familias

trabajan

X

i

n i

h i

h i %

N i

H i

H i %

1

 
  • 16 16/50

 
  • 32 16/50

16

 

32

2

 
  • 20 20/50

 
  • 40 36/50

36

 

72

3

 
  • 9 9/50

 
  • 18 45/50

45

 

90

4

 
  • 5 5/50

 
  • 10 50/50

50

 

100

Total

50

1.0

100

     

Ejemplo 8: Del Ej.6 se obtiene la tabla 4

 
 

Intervalos de

 
 

n i

h i

N i

H i

Y i

 

clase

           

Y i-1 - Y i

65

-

75

4

4/50

4

4/50

70

75

-

85

 
  • 11 11/50

 
  • 15 15/50

80

85

-

95

 
  • 20 20/50

 
  • 35 35/50

90

95

-

105

 
  • 9 9/50

 
  • 44 44/50

100

105

-

115

 
  • 6 6/50

 
  • 50 110

1

 
 

Total

 

50

1

     

3.0 Gráficos Estadísticos

Un gráfico estadístico es la representación de datos en el plano con el propósito

de obtener una impresión visual del conjunto de datos, que facilite su rápida

comprensión. Todo gráfico debe ser sencillo y auto explicativo.

El tipo de gráfico para los propósitos anteriores dependerá del tamaño del

recorrido de las variables así como del nivel de medición de estas.

Tipos de gráficos

En estadística los gráficos más comunes son:

  • - Gráficos de barras: Simples o separadas

Cada valor de las variables se representa por una barra cuyo largo corresponde a

la frecuencia con que se observa ese valor

  • - Histogramas y polígonos de frecuencias

Están constituidos por un conjunto de rectángulos contiguos, levantados en el eje

horizontal sobre cada uno de los intervalos de clase.

SMC

17

Los polígonos de frecuencias son adecuados para representar la distribución

de

frecuencias de una variable contínua cuando todos los intervalos de clase

tienen

la misma amplitud

  • - Gráficos lineales

Son gráficos adecuados para analizar la existencia de asociación entre dos

variables contínuas, con nivel de medición en escala de intervalos o razón

  • - Gráfico de correlación o diagramas de dispersión

Son gráficos adecuados para analizar la existencia de asociación entre dos

variables contínuas (x, y), con nivel de medición en escala de intervalos razón

  • - Gráficos Circulares

Se utilizan para representar distribuciones de frecuencias para el caso de

variables discretas y cualquier nivel de medición, con pocos valores

  • - Pictogramas

Se utilizan para presentaciones en público o para fines publicitarios

Todos estos tipos de gráficos se pueden resumir en el siguiente cuadro

SMC

18

SMC 18

SMC

19

Otros gráficos de uso frecuente son:

Diagrama de tallo y hoja

Cada dato se divide en dos partes, una conocida como tallo, que se pone en una

primera columna, y la otra denominada hoja, que se pone en fila frente al tallo

correspondiente. No existe una regla fija para determinar cuál es el tallo y cuál es

la hoja de un dato.

Ejemplo 9: Hagamos 10 intervalos con el ejemplo 6

Diagrama de Tallo y Hoja para

x (unidad) = 1,0 donde 1.2 representa a 12

Frecuencia

Tallo y Hoja

  • 2 6. 69

  • 2 7. 34

  • 7 7. 7777899

  • 4 8. 0023

    • 12 8. 666677777899

      • 8 9. 01223344

      • 6 9. 566778

      • 3 10. 034

      • 4 10. 5577

      • 2 11. 24

El rango de la variable se ha dividido en 10 intervalos de clases llamados tallos,

cada uno de ellos reprensado por una fila del diagrama. El primer número de cada

fila presenta la cifra de las decenas de cada valor de la variable en su

correspondiente clase. El resto de los números de cada fila, llamados hojas, son

las cifras de las unidades de todos los elementos de la clase definida por la fila. De

esta forma, además de representar la distribución de los elementos en forma de

histograma horizontal, en el diagrama se observan los propios elementos. Las

hojas permiten analizar la simetría, la normalidad y otras características de la

distribución de igual forma que un histograma

Gráfico de cajas

Tanto la media como la desviación estándar podrían no ser medidas adecuadas

para representar un conjunto de datos.

Para superar estas dificultades y como forma de resumir gráficamente los datos,

se sugiere confeccionar un diagrama, conocido como diagrama de caja, que

contenga la siguiente información

SMC

20

  • i) La mediana

Md = Q

2

ii)

iii)

Los extremos

E

1

y

E

2

Los cuartiles

QyQ

3

1

El grafico

de

caja y bigotes permite

univariantes dado.

analizar y resumir un conjunto de datos

Esta herramienta de análisis exploratorio de datos va a permitir estudiar la simetría

de los datos, detectar valores atípicos y vislumbrar un ajuste de los datos a una

distribución de frecuencias determinada.

El gráfico de caja y bigotes divide los datos en cuatro áreas de igual frecuencia,

una caja central dividida en dos áreas por una línea vertical y otras dos áreas

representadas por dos segmentos horizontales (bigotes) que parten del centro de

cada lado vertical de la caja. La caja central encierra el 50 por ciento de los datos.

El sistema dibuja la mediana como una línea vertical en el interior de la caja. Si

esta línea está en el centro de la caja no hay asimetría en la variable. Los lados

verticales de la caja están situados en los cuartiles inferior y superior de la

variable. Partiendo del centro de cada lado vertical de la caja se dibujan los dos

bigotes, uno hacia la izquierda y el otro hacia la derecha. El bigote de la izquierda

tiene un extremo en el primer cuartil Q 1 , y el otro en el valor dado por el primer

cuartil menos 0,5 veces el rango intercuartílico, esto es,

(

Q 0,5 QQ

1

31

)

El bigote de la derecha tiene un extremo en el tercer cuartil Q 3 y el otro en el valor

dado

por

el tercer

cuartil

más

1,5

veces el

rango intercuartílico, esto es,

Q + 1,5(QQ

3

31

) . El sistema considera valores atípicos (outliers) los que se

encuentren a la izquierda del bigote izquierdo y a la derecha del bigote derecho. El

sistema separa estos datos del resto y los representa mediante puntos alineados

con la línea horizontal central para que sean fáciles de detectar. En el interior de la

caja central se representa la media con un signo más.

A continuación se presenta el grafico de caja y bigotes para la variable X de los

ingreso mensuales de 50 trabajadores (ejemplo nº 6)

SMC

21

SMC 21 70 80 90 S 100 110 El grafico permite afirmar que la variable varía

70

80

90

S

100

110

El grafico permite afirmar que la variable varía entre 64 y 114 y que el 50% central

de los sueldos gana entre 80 (Q 1 ) y 96,25 (Q 3 ). Por otra parte, no existen valores

de la variable anormalmente grandes (outliers), ya que en la figura no aparecen

puntos alineados con los bigotes. La distribución es aproximadamente simétrica,

ya que las zonas de la derecha e izquierda en el área central de la figura son

aproximadamente iguales. La mediana corresponde aproximadamente a 89 de la

variable

SMC

22

LABORATORIO Nº 1

Problema 1

Los siguientes datos corresponden a la duración, en años, de los componentes de

una vacuna

  • 2.0 3.0

0.3

3.3

1.3

0.5

  • 0.7 6.0

5.8

6.6

0.2

2.3

  • 1.5 4.0

5.8

1.9

4.8

0.7

  • 4.5 0-9

1.5

0.7

2.8

5.3

  • 1.3 6.2

5.7

6.3

1.5

0.4

a)

Construye una tabla de distribución de frecuencias usando 5 intervalos de

clase

b)

Dibuja su histograma y su polígono de frecuencias

 

c)

¿ Qué porcentaje de los componentes tienen una vida entre 1.48 y 2.75?. Usa

la tabla de distribución de frecuencias

 

d)

¿ Qué porcentaje de los componentes tienen una vida menor a 5.32 años?.

Usa la tabla de distribución de frecuencias

 

Problema 2

 

Los siguientes datos representan el periodo de vida, en segundos, de 50

mosquitos que están sujetos a un nuevo insecticida en un experimento controlado

de laboratorio

 
 

18

20

10

8

25

14

13

19

18

24

12

17

8

9

12

14

7

9

15

22

14

18

17

14

16

31

8

7

15

12

13

8

18

7

10

5

28

17

14

15

10

12

15

19

6

8

13

14

18

21

a)

Construye una tabla completa de distribución de frecuencias para este conjunto

de datos, usando 6 intervalos de clase

 

b)

Dibuja un gráfico de torta para las frecuencias relativas

 

Usando la tabla de distribución de frecuencias, responde:

c)

¿Qué porcentaje de los mosquitos lograron una vida bajo la presencia del

insecticida por arriba de 29,5 segundos?

 

d)

Interpreta el valor de:

 

1) La tercera frecuencia absoluta

2) La segunda frecuencia relativa

3) La cuarta frecuencia absoluta acumulada

4) La tercera frecuencia relativa acumulada

SMC

23

Problema 3

Los contenidos de nicotina, en miligramos, de 40 cigarrillos marca CANCER se

registraron de la siguiente manera

  • 1.02 2.31

1.93

1.78

2.28

  • 1.76 1.94

1.47

0.97

1.28

  • 2.14 1.87

2.36

0.67

1.29

  • 2.54 2.15

3.11

1.36

2.14

  • 1.54 0.78

1.78

1.54

1.35

  • 1.47 1.57

2.15

2.16

2.78

  • 1.35 1.27

2.17

1.36

1.47

  • 2.14 1.37

0.98

2.15

1.06

Encuentra para este conjunto de datos:

  • a) Una tabulación de frecuencias en intervalos cerrados de amplitud 0,41

  • b) Interpreta los valores de n 2 , h 3 y N 4

  • c) Grafica la frecuencia absoluta y la absoluta acumulada

  • d) ¿Que porcentaje de los cigarrillos tiene a los más 1,92 miligramos de nicotina?

Problema 4

 

La siguiente distribución muestra corresponde a los puntajes de un examen de

estadística:

 

63

88

79

92

86

87

83

78

41

67

68

76

46

81

92

77

84

76

70

66

77

75

98

81

82

81

87

78

70

60

94

79

52

82

77

81

77

70

74

61

  • a) Utilizando una amplitud de intervalo de 5, construye una tabla de frecuencias

  • b) Con una amplitud de 3, 10, 20 analiza la conveniencia o inconveniencia del empleo de estos tamaños de intervalos

  • c) Para el punto (a) construye los gráficos correspondientes

  • d) Tabula esta muestra sin agrupar los datos

  • e) Construye los gráficos para (d)

SMC

24

4.0 MEDIDAS ESTADÍSTICA

Las medidas estadísticas pretenden resumir o describir la información de la

muestra para de esta forma tener un mejor conocimiento de la población, cuestión

que es uno de objetivos de la estadística para así poder tomar una decisión. Por

ahora nos referiremos solo a variables que sean cuantitativas dado que con las

variables cualitativas no se pueden hacer operaciones aritméticas

Estas medidas las podemos clasificar en:

Medidas de resumen

Nos sirven para calcular los valores centrales de la variable, en este tipo de

medidas se identifican la Media, la Medina y la Moda

Media

Medidas de resumen: Mediana

Moda

Medidas de Dispersión

Nos dan una idea sobre la representatividad de las medidas de resumen.

Medidas de Variabilidad:

Minímo y Máximo

Rango

Varianza Desviación Estándar Coeficiente de variación Rango intercuartil y percentil

Medidas de la Distribución

Estas medidas miden la forma que tiene la distribución. Estas medidas son

Medidas de la distribución:

Asimetría

Curtosis

SMC

25

Medidas de la Asimetría o Sesgo

Nos permite ver si la distribución tiene el mismo comportamiento por encima y por

debajo de los valores centrales

Medidas de la Forma

Comparan la forma de la distribución con la forma de la Distribución Normal.

4.1 Medidas de Resumen

Las medidas de resumen que se analizarán son:

  • a) La Media

  • b) La Mediana

  • c) La Moda

4.1.1 La Media: La media o promedio es un valor representativo de un conjunto de

datos de la variable y se definirá como:

n

y n

i

·

i

n

i = 1 x =
i = 1
x =

Ejemplo: Supongamos la siguiente información tomada de la tabla nº 2

Intervalos de

       
 

clase

n i

 

y i

n i y i

Y i-1 - Y i

65

-

75

4

 

70

280

75

-

85

11

 

80

880

85

-

95

20

 

90

1800

95

-

105

 
  • 9 100

900

105

-

115

 
  • 6 110

660

 

Total

 

50

 

4520

 
   
  • 4520 = 90.4

y =

50

SMC

26

Esto significa que 90.4 es el valor que representa a los 50 sueldos

Propiedades de la Media

a) Media de una variable más o menos una constante

Si hacemos que M [x ] sea igual a la media y k = constante, entonces se tiene

M [ x ±= k Mx[ ] ± k

]

Es decir, si a una variable se le suma o resta una constante la nueva media es

igual a la media de la variable más o menos la constante

Ejemplo: supongamos que a todos los sueldos de la tabla nº

2

se

les

da

un

aumento de 10, entonces, calcula el valor de la nueva media

Solución I

Aumentaremos cada sueldo en 10 de modo que se tenga la siguiente información

Intervalos de

clase

     
   

n i

y i

(

y +

i

10

)

n

i

Y i-1 - Y i

 

65

-

75

4

70

 

320

 

75

-

85

11

80

 

990

 

85

-

95

20

90

 

2000

 

95

-

105

 
  • 9 990

100

   

105

-

115

 
  • 6 720

110

   
 

Total

 

50

   

5020

 

Por lo tanto, la nueva media es

SMC 26 Esto significa que 90.4 es el valor que representa a los 50 sueldos Propiedades

y =

  • 5020 = 100.40

50

Solución II

Usaremos la propiedad, donde k= 100, entonces, se tiene

[

My

i

k

]

+=

[

My

i

]

+

k

[

My

i

k

]

+=

90.40

+

10

=

100.4

SMC

27

  • b) Media de una variable por una constante

Ma[ x ] =⋅

aMx[ ] ;

Con a = constante, x = variable

Es decir, la media de una variable por una constante es igual a la media de la

variable por la constante

Ejemplo: Supongamos que a los 50 trabajadores de la tabla nº 2 se les da un

aumento del 5%, entonces calcula el valor de la nueva media

Solución I

Aumentaremos cada sueldo en 5%

Intervalos de clase ( y ⋅ 1.05 ) n i y i n i i Y
Intervalos de
clase
(
y
1.05
)
n i
y i
n
i
i
Y i-1 - Y i
65
-
75
4
70
294
75
-
85
11
80
924
85
-
95
20
90
1890
95
-
105
9
100
945
105
-
115
6
110
693
Total
50
4746
4746
y =
= 94.92
Por lo tanto, la nueva media es
50
Solución II
Usaremos la propiedad
M
[
a
y
]
=
aM y
[
]
i
i
M
[1.05 ⋅= ]
y
1.05 90.40
=
94.92
i
  • c) Media de una Constante

M[k] = k, donde k es una constante.

Es decir, la media de la constante es la constante

SMC

28

Observación: Todas estas las propiedades de la media se pueden demostrar

usando las propiedades de las sumatorias

d) - Sólo puede ser calculada en distribuciones de variables cuantitativas - Todos los valores son
d)
-
Sólo puede ser calculada en distribuciones de variables cuantitativas
-
Todos los valores son incluidos en el cálculo de la media
-
Una muestra sólo tiene una media
-
Es una medida de resumen útil para comparar dos o más poblaciones
-
Es la única medida de resumen donde la suma de las desviaciones
respecto a la media es igual a cero. Por lo tanto, podemos considerar a la
media como el punto de balance de una muestra
Si designamos a Z i como las diferencias entre un valor de la variable y su
correspondiente media, se tiene
Z = y − y
i
i
Ejemplo:
i) supongamos
que
el
sueldo
de
un
trabajador,
de
la
tabla
2,
es
de 100,
entonces,
Z =−
100
90.4
=
9.6
i

Esto quiere decir que este trabajador esta 9.6 unidades de sueldo por sobre el

promedio

ii) supongamos que el sueldo de un trabajador es de 80, entonces

Z

i

=

80

90.4

=−

10.4

Esto quiere decir que este trabajador esta 10.4 unidades de sueldo por debajo del

promedio

iii) Supongamos que el sueldo de un trabajador es de 90.40, entonces,

Z =−=

i

90.4

90.4

0

Esto quiere decir que el sueldo de este trabajador es igual al promedio

Relación entre las desviaciones

SMC

29

De acuerdo a la definición de desviación, entonces, se tiene que

n

y n

i

·

i

−= Y 0

i = 1 Z =
i
= 1
Z =

n

Esto es la media de las desviaciones respecto de la media es cero

Desventajas de la media aritmética

  • - Si algunos valores son extremadamente grandes o extremadamente pequeños la

media no es una medida apropiada para representar a la muestra

  • - No se puede determinar si en una distribución de frecuencias hay intervalos de

clases abiertos

Media en función de las Medias de las Submuestras

Por ejemplo si una distribución es dividida en “n” submuestras la media total de la

distribución se podría calcular usando la siguiente expresión:

yn y n · + · ++⋅ y n 1 1 2 2 n n
yn y n
·
+
·
++⋅
y
n
1
1
2
2
n
n

y =

+++

nn

1

2

n

n

Ejemplo: supongamos la información de la tabla nº 2

Intervalos de

     
 

clase

 

n i

y i

n i y i

Y i-1 - Y i

65

-

75

 
  • 4 70

280

75

-

85

11

80

880

85

-

95

20

90

1800

95

-

105

 
  • 9 900

100

 

105

-

115

 
  • 6 660

110

 
 

Total

 

50

 

4520

Calcular el promedio de

SMC

30

i) los que ganan menos de 85

ii) los que ganan 85 o más

iii) usados las medias anteriores calcula la media global

1160 y = = 77.3333 1 15 3360 y = = 96 2 35 77.333 15
1160
y
=
= 77.3333
1
15
3360
y
=
= 96
2
35
77.333 15
⋅+⋅
96
35
y =
15
+
35

= 90.399

Lo que comprueba la relación anterior

4.1.2 Media Geométrica:

  • x G

La media geométrica, que representaremos como G, se define como:

x

G

=

n

n

1

xx

1

2

n

2

nk

x

k

El empleo más frecuente de la media Geométrica es el promediar variables tales

como porcentajes, tasas, números de índices, etc.; se usa en los casos en los que

se supone que la variable presenta variaciones acumulativas

Ejemplo: tomemos la información de la tabla nº1

Personas que trabajan

Nº de

familias

  • 1 16

 
  • 2 20

 
  • 3 9

 
  • 4 5

 

Total

50

Calculemos la media geométrica

SMC

31

x

G

=

n

n

1

xx

1

2

n

2

nk

x

k

x =

G

50

(

1

16

2

20

9

3

⋅⋅

4

5

)

=

1,8471

4.1.3 Media Armónica:

  • x H

La media Armónica, que representamos como H, se define como:

x

H

n

=

k

i

= 1

1

x

i

n

i

Ejemplo: tomemos la información de la tabla nº 1

x

   

Personas que trabajan

Nº de familias

 

1

x

 

n

 

i

 

1

 
  • 16 116

 
 

2

 
  • 20

1

2

20

 

3

 
  • 9

1

3

9

 

4

 
  • 5

1

4

5

 

Total

 

50

 

30,25

   

H

=

 
  • 50 = 1,1620

k

  • 1 H

30,25

 
   

n

i

  • i = 1

x

i

Obsérvese que la inversa de la media armónica es la media aritmética de los

inversos de los valores de la variable. No es aconsejable en distribuciones de

variables con valores pequeños. Se suele utilizar para promediar variables tales

como productividades, velocidades, tiempos, rendimientos, tipos de cambio, etc.

SMC

32

  • 4.2 La Mediana (Med)

La mediana es el valor central de la variable, es decir, si la muestra esta ordenada

en forma creciente o decreciente, el valor que divide en dos partes iguales a la

muestra según el tamaño de esta

4.2.1 Cálculo de la mediana si los datos corresponden a variables discretas

Para esto tendremos en cuenta el tamaño de la muestra.

a) Si n es impar, hay un término central el que podrá determinarse de la siguiente

manera:

n + 1

2

y el término que ocupe ese lugar será la

siguiente muestra

mediana, por ejemplo si tenemos la

1, 4, 58, 10, 12, 14, 20

Entonces, “n = 7”, luego se tiene que

n +

1

71

+

 

=

= 4

2

2

Al ordenar la información se tiene que:

1

4

10

12

14

20

58

Med

Es decir, la Mediana será el término que ocupe el 4º lugar, o sea 12

b) Si “n” es par, hay dos términos centrales los que podrán determinarse de la

siguiente manera:

SMC

33

⎛⎞ n ⎛ y ⎜⎟ ⎜ ⎝⎠ ⎝ 2
⎛⎞ n ⎛
y
⎜⎟ ⎜
⎝⎠ ⎝
2

n

2

+ 1

La mediana será, entonces, la media de estos dos valores, por ejemplo

2, 3, 7, 21, 34, 45, 50, 86

Luego. n = 8, entonces se tiene que

⎛⎞ ⎛

8

⎜⎟ ⎜

y

⎝⎠ ⎝

2

2

3

7

21

34

8

+

1

   

2

45

50

86

4

to

5

to

Es decir, los términos 4º y 5º corresponden a los valores 21 y 34 respectivamente,

luego la mediana es

Med =

21

+

34

2

= 27,5

4.2.2 Propiedades de la Mediana

-

La

mediana

resulta

realizados a los datos

razonablemente

estable

frente a pequeños cambios

  • - La mediana es no sensitiva a valores extremos (outliers)

  • - Para un conjunto de “n” datos existe una única mediana

Si “n” es impar, la mediana resulta ser uno de los datos de la muestra. En caso en

que “n” es par, la mediana resulta igual a uno de los datos de la muestra sólo si los

datos ubicados en los lugares

n ⎛ y ⎜⎟ ⎜ ⎝⎠ ⎝ 2
n
y
⎜⎟ ⎜
⎝⎠ ⎝
2

n

2

+ 1

son iguales.

SMC

34

- La mediana no usa toda la información de la muestra, dado que la mediana es

calculada usando solo los valores centrales de los datos, el resto de los datos son

desestimados.

Ejemplo 1:

Int. de clase

n

i

Y

i

N

i

h

i

H

i

5

-

12

 

8.5

  • 12 0.15

12

 

0.15

12

-

19

 

15.5

  • 16 0.20

28

 

0.35

19

-

26

 

22.5

  • 20 0.25

48

 

0.60

26

-

33

 

29.5

  • 12 0.15

60

 

0.75

33

-

40

 

36.5

  • 10 0.125

70

 

0.875

40

-

47

6

43.5

76

0.075

0.95

47

-

54

4

50.5

80

0.05

1

 

Total

 

80

   

1

 

El grafico es:

SMC 34 - La mediana no usa toda la información de la muestra, dado que la

La

mediana se encuentra intersectando la recta Y= 50 con ojiva, es decir, se

encuentra intersectando la recta y = 50 con la recta que pasa por los puntos

(19, 35)

y

(26, 60).

La ecuación analítica de la recta que pasa por los puntos (19,35) y (26, 60) es

SMC

35

Y =

25

x

230

7

7

.

La intersección de esta recta con Y = 50 nos da el valor de x= 23,2

4.2.3 Calculo de la Mediana si la variable es continua, la tabla deberá ser de

intervalos, entonces, se calcula de la siguiente manera:

Donde:

Med L c

=

i

+

n

2

N

j 1

n

i

L i : Limite inferior del intervalo de la clase de la mediana

c: Amplitud del intervalo de la clase de la mediana

N j-1 : Frecuencia absoluta acumulada anterior a la de frecuencia absoluta

acumulada de la clase de la mediana

n i : Frecuencia absoluta del intervalo de la clase de la mediana

Ejemplo2: De la tabla 4 se tiene que

n

25; C = 10; N
2

=

j-1

15; n

==

i

20; L

i

=

85

Luego la mediana es:

Med =+

85

10

25

⎜ ⎝

15

⎟ ⎠

20

=

90

4.3 La Moda (Mod.)

La moda es el valor de la variable que tiene mayor frecuencia absoluta, es la

única medida de resumen que tiene sentido estudiar en una variable cualitativa.

SMC

36

Por su definición, la moda no es única, pues puede haber distribuciones que

tengan más de una moda. En cuyo caso tendremos una distribución que sea uni

modal o polimodal según sea el caso, como se muestra en el grafico siguiente

SMC 36 Por su definición, la moda no es úni ca, pues puede haber distribuciones que

Por lo que el cálculo de la moda en distribuciones discretas o cualitativas no

requiere de una explicación mayor, sin embargo, el cálculo de la moda para

distribuciones cuantitativas contínuas es necesario hacer algunos cálculos. La

moda se la define como:

i

)

Mod

ii

)

Mod

=

L +

i

n

i

n

i 1

·

(

nn

ii

+

1

)(

+−

nn

ii

1

)

c

=

L +

i

n

i + 1

n

i

+

1

+ n

i

1

·

c

Ejemplo 2: Veamos sus cálculos con un ejemplo para lo cual utilizaremos la

información de la tabla 4

Intervalos de

n i

 

clase

 

Y i-1 - Y i

65

-

75

4

75

-

85

11

85

-

95

20

95

-

105

9

105

-

115

6

 

Total

 

50

SMC

37

Como el intervalo que tiene mayor frecuencia absoluta es el tercero, entonces, al

reemplazar en las formulas anteriores se tiene lo siguiente:

i

)

Mod =+ 85

10·

(

20

11

)

(

20

−+

11

)(

20

+

9

)

=

87,37

ii

)

Mod =+ 85

10·

9

9

+

11

=

89,50

Observándose una buena aproximación entre estos valores

4.4 Medidas de Localización

Las medidas de localización dividen la distribución en partes iguales, sirven para

clasificar a un elemento dentro de una determinada población o muestra.

Este tipo de valores que identifican un cierto porcentaje de la muestra son

conocidos generalmente con el nombre de percentiles o fractilas.

En general,

si disponemos de “n” datos

y

0 < α < 1,

y

queremos calcular el

percentil

α 100% ,

conocido

como

cuantil α

procedemos

de

la

siguiente

manera:

  • i) Ordenar la muestra en forma ascendente

ii)

Calcular

q =⋅ α ( n + 1)

iii)

Si “q” es entero, el percentil α 100% será el dato ubicado en el q-ésimo

lugar. Si “q” no es entero, el percentil

datos ubicados en el lugar (q) y (q+1).

α 100% será el promedio de los

Ejemplo 3: Si disponemos de 30 datos, entonces el percentil 25% será

q = 0,25·30 = 7.5, por lo tanto el percentil 25% será el promedio de los datos

ubicados entre el 7º

ascendente)

y

lugar

(después de ordenar la

muestra en forma

SMC

38

4.4.1 Cuartiles

Esta medida de localización divide a la variable en cuatro partes iguales respecto

al tamaño de la muestra, los cuartiles son cuatro a saber:

Q 1 :

Cuartil

inferior, valor de la variable que supera al 25% de los datos de la

muestra

Q 2 : Valor de la variable que supera al 50% de los datos de la muestra, este valor

corresponde al valor de la Mediana.

Q 3 : Cuartil superior, valor de la variable que supera al 75% de los datos de la

muestra

Por lo tanto, los cuartiles primero y tercero se los define como:

Q

1