Datos y Azar Completo

dato zar.
el
UNIDAD 1
Población, muestras y datos
¿Qué nos dicen acerca de la realidad?
Material de Referencia
Eugenio Saavedra
GOBIERNO DECHILE
MIN1$TERlO DE (DUCAClON
Patrocinan Organizan
ISBN:
2° edición: Junio 2009
©2006 por Centro Comenius Universidad de Santiago de Chile
Editado por Centro Comenius Universidad de Santiago de Chile
San Martín 40 A, oficina 6, Santiago
Teléfono: 688 32 61 - Fax: 672 71 40
Impreso en
3f
Santiago de Chile
dato
Unidad 1,
Población, muestras y datos. ¿Qué nos dicen acerca de la realidad?
Introducción 5
¿Qué es la estadística? 5
Experimentos aleatorios y deterministas 7
Aplicaciones de la estadística 7
Muestras y Poblaciones en Estadística 8
Definición de población y muestra 8
Ejemplos 8
Algunas razones para considerar muestras en lugar de poblaciones 10
¿Qué se puede esperar de una muestra? 10
El tamaño de la muestra y la forma de seleccionarla 11
Muestreo aleatorio simple 12
Muestra aleatoria estratificada 13
Variables y Datos 14
Clasificación de variables 15
Variable cualitativa nominal 16
Variable cualitativa ordinal 17
Variable cuantitativa 19
¿Cómo pueden representarse los datos? 21
Datos a "granel" 21
Datos en tabla de frecuencia 22
Datos en un diagrama de tallo y hojas 23
Datos agrupados 23
Datos en un gráfico 24
Gráficos de barra 24
Histograma 28
Gráficos circulares (de torta) 29
Gráficos de línea 31
Datos en un diagrama de puntos 33
Medidas de Tendencia Central 34
La moda 35
El promedio (o media aritmética) 40
La mediana 47
Modelo de Probabilidades de Laplace 53
El modelo de Laplace y sus propiedades básicas 63
dato
Unidad 2,
La variabilidad de los datos
Introducción 73
Medidas de Dispersión 73
Medidas de dispersión para datos cualitativos 78
Radio (tasa) de variación (RV) 79
Medidas de dispersión para datos numéricos 83
Desviación estándar 83
Varianza 84
Aplicaciones de la desviación estándar 92
Estandarización de datos 92
Dispersión relativa - Coeficiente de variación 95
Cambio de escala 96
Test para comparaciones 97
Unidad 3,
Datos y Azar en la toma de decisiones
Introducción 104
Medidas de Localización 106
Percentiles 106
Diagrama de caja 112
Medidas de Asociación 119
Coeficiente de correlación lineal de Pearson 124
Recta de regresión 130
Anexo: Algo más sobre probabilidades 138
Probabilidades y el triángulo de Pascal 138
Números factoriales 147
Combinatoria 148
Referencias 151
dato
¿Qué es la Estadística?
A continuación se presentan algunos comentarios históricos y definicionesque aparecen
en algunos textos y en laWeb.
Hoy en día, en lenguaje coloquial se acostumbra a llamar "estadísticas" a ciertas

colecciones de datos, presentados comúnmente en forma de tablas y gráficos. Por esta
razón es común que se hable de estadísticas de precios, demográficas, económicas,
agropecuarias, de empleo, de deportes, etc.
- La palabra "estadística" procede del latín statisticum collegium ("consejo de Estado")

y de su derivado italiano statista ("hombre de Estado" o "político"). El término alemán
Statistik, que fue primeramente introducido por Gottfried Achenwall (1749), designaba
originalmente el análisis de datos del Estado, es decir, "la ciencia del Estado" (también
llamada "aritmética política"de su traducción directa del inglés). No fue hasta el siglo
XIX cuando el término estadística adquirió el significado de recolectar y clasificar datos.
Este concepto fue introducido por el inglés John Sinclair.
En su origen, por tanto, la estadística estuvo asociada a datos, a ser utilizados por el
gobierno y cuerpos administrativos (a menudo centralizados). La colección de datos
acerca de estados y localidades continúa ampliamente a través de los servicios de
estadísticas nacionales e internacionales. En particular, los censos suministran información
regular acerca de la población.
Desde loscomienzos de la civilización hanexistidoformas sencillas deestadística, puesya

se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palosde madera
y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia
el año 3000 a. C. los babilónicos usaban ya pequeñas tablillas de arcilla para recopilar
datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados
mediante trueque. Los egipcios analizaban los datos de la población y la renta del país
mucho antes de construir las pirámides en el siglo XI a. C. Los librosbíblicos de Números
y Crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos
censos de lapoblación de Israel y elsegundo describeel bienestar material de las diversas
tribusjudías. En China existían registros numéricos similares con anterioridadal año 2000
a. C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el594 a.
C. para cobrar impuestos.
5
dato
Los métodos estadístico matemáticos emergieron desde la teoría de probabilidad, la cual
data desde la correspondencia ciertamente entre Pierre de Fermaty Blaise Pascal (1654).
Christian Huygens (1657) da el primer tratamiento científico que se conoce a la materia. El
Ars Conjectandi (póstumo, 1713) de Jakob Bernoulli y la Doctrina de Posibilidades (1718)
de Abraham de Moivre estudiaron la materia como una rama de las matemáticas. En la
era moderna, el trabajo de Kolmogórov ha sido un pilar en la formulación del modelo
fundamental de la Teoría de Probabilidades, el cual es usado a través de la estadística.
- La estadística estudia el comportamiento de los fenómenos llamados de colectivo.

Está caracterizada por una información acerca de un colectivo o universo, lo que
constituye su objeto material; un modo propio de razonamiento, el método estadístico,
lo que constituye su objeto formal y unas previsiones de cara al futuro, lo que implica
un ambiente de incertidumbre, que constituyen su objeto o causa final. Como rama
de las matemáticas y utilizando el cálculo de probabilidades, la estadística estudia los
fenómenos o experimentos aleatorios intentando deducir leyes sobre los mismos y
aplicando dichas leyes para la predicción y toma de decisiones.
- La Estadística es una disciplina de naturaleza compleja que resulta difícil definir por la
variedad de susaplicaciones. Ella surge inicialmente de la necesidad de recoger y analizar
sistemáticamente los datos que necesitaba el Estado para apoyar sus políticas públicas,
por ejemplo, salud, educación y economía. En este sentido la Estadística forma parte de
lasCiencias Sociales. Por otra parte, ella puede sertambién considerada como una de las
Ciencias Matemáticas, pues desarrolla modelos en lenguaje matemático, investiga sus
propiedades generales y los aplica a la resolución de problemas concretos. En resumen, la
Estadística es una disciplina con una base empírica y con aplicaciones en múltiples áreas.
Ella tiene un núcleo central de conceptos y principios, así como una forma de pensar,
donde la matemática juega un papel importante en la formalización de las nociones de
incertidumbre e imprecisión. Esto permite obtener conclusiones rigurosas, que luego
se traducen en el contexto del problema original.
6
dato
Experimentos aleatorios y deterministas
Dentro de los diferentes hechos que pueden ser observados en la naturaleza, o de

los experimentos que pueden ser realizados, se distinguen dos categorías. Se llama
experimento o fenómeno determinista a aquél que siempre se produce en igual forma
cuando se dan las mismas condiciones. Esto ocurre, por ejemplo, con el tiempo que
tarda un móvil en recorrer un espacio dado con movimiento uniforme, a velocidad
constante.
Por el contrario, con el término "aleatorio"se indica la posibilidad de que en idénticas
condiciones puedan producirse resultados diferentes, que no son, por tanto, previstos
de antemano. Por ejemplo, el número de naranjas que trae una malla de 3 kilos, la
temperatura máxima o mínima del día martes de la próxima semana, la esperanza de
vida de una persona, el número de nietos que tendrá usted, la nota que obtendrá al
terminar el curso datosyazar.c1, los números sorteados en el Kino o el Loto del próximo
domingo/etc.
Aplicaciones de la Estadística
La importancia que la estadística ha alcanzado en nuestros días, tanto como cultura

básica, como en el trabajo profesional yen la investigación, es innegable. Ello se debe a
laabundancia de información con laque el ciudadano común debe enfrentarse a diario.
La mayor parte de las veces esta información viene expresada en forma de tablas o
gráficos, por lo que un conocimiento básicode esta ciencia es necesario para lacorrecta
interpretación de los mismos. Además, las situaciones de tipo aleatorio tienen unafuerte
presencia en nuestro entorno, por lo que las aplicaciones de la estadística podrían
clasificarse en cuatro grandes grupos: el hombre en su mundo biológico; el hombre en
su mundo social; el hombre en su mundo político y el hombre en su mundo físico.
Por ejemplo, dentro del campo biológico, aplicaciones en medicina o crecimiento
de poblaciones; dentro del mundo físico, aplicaciones en el clima o sobre recursos
naturales; dentro del mundo social, aplicaciones en losjuegos de azar o los seguros de
vida y dentro del mundo político, aplicaciones en los censos, las encuestas de opinión
o los índices de precios.
7
dato azar.el
Un curso del establecimiento X realizará una convivencia para finalizar el año escolar y
se le ha pedido a usted comprar el queso que se consumirá en la fiesta. Usted concurre
a un supermercado y el vendedor le ofrece 3 marcas diferentes de queso (cuyo precio
es el mismo). Como usted no sabe por cual decidirse, le pide al vendedor que le de una
"probadita" de cada una de las marcas, para luego decidir cual comprar. En otras palabras,
usted toma una muestra de cada una de las marcas y, luego, juzga el comportamiento
del trozo completo de queso, bajo el razonable supuesto que la "probad ita" tiene el
mismo sabor que el trozo completo.
Exactamente este mismo principio opera en estadística. Usualmente, en estadística se

emplean muestras para sacar conclusiones acerca de grupos enteros o poblaciones.
Acá la palabra población no necesariamente significa las personas que viven en un país
o región.
Definición. En estadística, una población se define como una colección de personas,

objetos o ítems en los cuales se tiene algún interés, esto es, interesa medir o determinar
alguna característica de sus elementos (también se les denomina unidades). Este
conjunto de interés lo define uno mismo.
Definición. Una muestra de una población esuna colección de personas o ítems tomados
desde ésta. En otras palabras, una muestra es un subconjunto de la población.
Cabe señalar que lo importante es que la población contenga todas las personas o
ítems, cualquiera sea el modo en que éstas estén definidas y que la muestra sea lo más
"representativa" de la población.
Ejemplos:
a) Población: Establecimientos educacionales de la región metropolitana que parti-

ciparon en el SIMCE el año 2008.
Muestra posible: Establecimientos educacionales de la comuna de Huechuraba
que participaron en el SIMCE el año 2008.
b) Población: Establecimientos educacionales de Chile que participaron en el SIMCE

el año 2008.
Muestra Posible: Establecimientos educacionales de la región metropolitana que
participaron en el SIMCE el año 2008.
c) Población: Días del año 2008

Muestra posible: Días feriados del año 2008.
8
dato
d) Población: Días feriados del año 2008.
Muestra posible: Días domingos del año 2008.
e) Población: Ballenas que hay en los océanos del planeta tierra.

Muestra posible: Ballenas que han sido capturadas el año 2008 con "fines
científicos':
f) Población: Polígonos (figuras geométricas).

Muestra posible: Cuadriláteros.
g) Población: Cuadriláteros.
Muestra posible: paralelogramos.
h) Población: Ratones portadores del virus Hanta en Chile.

Muestra posible: Ratones portadores del virus Hanta en Chile que han sido
capturados.
i) Población: Los números naturales.

Muestra posible: Los números primos.
j) Población: Los vehículos motorizados que circulan por el país.

Muestra posible: Los vehículos motorizados que circulan por el país y cuya patente
termina en 2.
k) Población: Los alumnos del (de los) colegio(s) donde usted trabaja.
Muestra posible: Los alumnos del (de los) colegio(s) donde usted trabaja y cuyo
apellido paterno comienzan con la letra C.
1) Población: Las personas con nacionalidad chilena.

Muestra posible: Las personas con nacionalidad chilena que viven en el
extranjero.
m) Población: Los estudiantes que rindieron la PSU el año 2008.

Muestra posible: Los estudiantes que rindieron la PSU el año 2008 y provenían de
establecimientos municipalizados.
9
dato
Algunas razones para considerar muestras en lugar de poblaciones.
i) Poblaciones "muy grandes': En este caso podría no disponerse del tiempo o los re-
cursos para identificar cada elemento de la población para la realización de un cierto
estudio. Por ejemplo, si la población son los chilenos mayores de 18 años y se quiere
saber si se está de acuerdo o no con el aborto terapéutico.
ii) Dificultad para identificar los elementos (también conocidos como unidades) de la
población (incluso imposible). Porejemplo, si[a población son las ballenas del planeta
y se quiere hacer un estudio taxonómico de estas.
iii) El proceso para identificar la población es destructivo. Por ejemplo, si la población

son los tarros de duraznos en conserva producidos por una fábrica el día de ayer, y
se quiere realizar un control de calidad del peso drenado de los tarros, entonces los
tarros deben ser abiertos (destruidos).
iv) Hay razones éticas o de seguridad. Si la población son todas las personas a los que
se les detectó el Sida el año 2007 y se quiere realizar una entrevista para la televisión,
entonces se mostrará sólo a aquellos que acepten.
En resumen, cuando se tienen poblaciones infinitas, o poblaciones finitas que son

difíciles, costosas o imposibles de inspeccionar es necesario seleccionar, con proce-
dimientos adecuados, algunos elementos de la población, los que constituyen una
muestra. Sobre la muestra se examina la característica en la cuál se está interesado y
después se generaliza a la población. Esta generalización se realiza por medio de la
inferencia estadística. Un requisito básico para que sean verdaderas las conclusiones
que se hagan sobre la población, es que la muestra inspeccionada sea representativa
de ésta.
¿Qué se puede esperar de una muestra?
Supongamos que un establecimiento educacional quiere saber cuál es el número de

hermanos que tiene cada alumno. Si elegimos una muestra de esta población y el
alumno XX es del colegio pero no esta en la muestra, ¿podemos decir algo del número
de hermanos de XX? La respuesta es que no. En general, una muestra entrega escasa
información sobre valores individuales de elementos de la población. Sin embargo, en la
mayoría de lasveces estamos interesados en características globales de los elementos de
la población. Por ejemplo, proporción de elementos que cumplen alguna condición (en
el ejemplo podría ser, proporción de alumnos del colegio que tienen más de 3 hermanos
o promedio de hermanos en el colegio).
En general, una muestra proporciona más información de características globales

(conocidos como parámetros) de la población que sobre valores individuales de
elementos de ésta.
10
dato
Cuando hemos tomado una muestra de la población esperamos que ésta sea
"representativa" de ella, esto es, que todas las características de la población estén
reAejadas en la muestra. Mientras mejor reAeje la muestra a la población, mejor serán
las conclusiones que se obtendrán de la población basada en la muestra.
El proceso de obtener conclusiones sobre características de la población en base a una
muestra es conocido en estadística como Inferencia.
Por ejemplo,si lapoblación son los alumnosde su cursoyalescoger 5 alumnos en laúltima

pruebade matemáticas resulta que el promedio es 5,6, ¿podremos concluirque el promedio
del curso (población) en la última prueba de matemática es "aproximadamente" 5,67
El tamaño de la muestra y la forma de seleccionarla
Desde el punto de vista estadístico (es decir, desde el punto de vista de los métodos
para describir y analizar datos), el tamaño de una muestra está relacionado con el tipo
de conclusión y el grado de precisión que se espera obtener de la muestra respecto de
la población y no con el tamaño relativo al tamaño de la población.
Ejemplo. La Universidad de Santiago de Chile a raíz de la"toma" de la Universidad en

el mes de junio de 2008, contrató una empresa que realiza encuestas de opinión para
que consultase entre los estudiantes de la Universidad si estaban de acuerdo o no con
la toma del plantel. Esta empresa consultora consideró una muestra de 400 estudiantes
(del orden del 2% de la población).
Ejemplo. El CEP (Centro de Estudios Públicos) realizó una encuesta nacional de opinión
pública enjunio-julio de 2006 acerca de lacalidadde laeducaciónen Chile. La población
considerada fue la de todos los chilenos de 18 años y más residentes a lo largo del país
(en base al censo de 2002). En esa encuesta se consideró a 1505 personas, esto es, del
orden de un 0,01% de la población en estudio.
Ejemplo. En su colegio trabajan 20 profesores, de los cuales 5 son mujeres (25%) y 15

hombres (75%). Si se considera a los profesores de su colegio como una muestra de
todos los profesores del país, entonces con esta información sería aventurado afirmar
que alrededor de un 25% de los profesores del país son mujeres.
Malas elecciones de una muestra corren el riego de ser "sesgadas".
Ejemplo. Si se estuviese investigandolos rasgos físicos de loschilenos y seescogiese una

muestra con personas sólo de Rapa Nui (Isla de Pascua), entonces, nuestra conclusión
acerca de la población (en este caso todos los chilenos) podría ser que, en general, los
chilenos tienen rasgos polinésicos. Claramente, la muestra escogida tiene un sesgo (Rapa
Nui no es representativa de los rasgos físicos de todos los chilenos.
11
dato
Ejemplo. Consideremos el grupo de profesores que está inscrito al comenzar el curso
DatosyAzar.cI (pensemos que son 700). Supongamos que estamos interesados en
conocer el manejo (nada, poco, suficiente) que tienen los profesores del curso sobre
la plataforma Moodle. Consideramos como muestra a todos aquellos que realizaron el
curso Geometría.e1. Si obtenemos que un 80% de ellos tiene un manejo suficiente de la
plataforma y, por esta razón, concluimos que cerca del 80% de los profesores del curso
DatosyAzar.c1 tiene un manejo suficiente de la plataforma Moodle, claramente podríamos
estar equivocados. En este caso, los profesores que hicieron el curso Geometría.c1 ya
tienen un entrenamiento previo en este tipo de plataforma.
Una mejor forma de escoger la muestra sería considerar la lista (orden alfabético) de los
profesores participantes del curso (población), enumerándolos del1 hasta el 700. Ahora,
en pedazos de papel (digamos 2 cm x 2 cm) escribimos los números 1,2, ... ,700, los
ponemos en una bolsa no transparente y sacamos (por ejemplo) 40 de estos papelitos.
A los profesores de la lista correspondientes a los números obtenidos en los papelitos
se les realiza la respectiva consulta. De esta forma cada profesor participante del curso
DatosyAzar.cl tiene igual chance de ser escogido para ser incluido en la muestra, por lo
que la muestra ahora sería representativa de la población (profesores del curso).
Esta forma, donde cada elemento de la población tiene igual chance de ser escogido
para ser incluido en la muestra se llama muestreo aleatorio simple.
El método anterior es más o menos simple cuando la población es relativamente

pequeña, aunque puede ser tedioso. En el caso de poblaciones "grandes': claramente
es poco practicable. Cualquiera sea el caso, una manera simple de escoger una muestra
aleatoria simple desde una población de tamaño finito es usando una planilla Excel y la
generación de números aleatorios.
A continuación se indica la manera de escoger un número al azar desde los números

l,2,,,.,m.
Primero se coloca en la barra superior la instrucción =ALEATORIO() y luego introducir.

Después se multiplica el número obtenido por m, y a continuación se redondea
hacia arriba. Por ejemplo, si m= 70 y el número aleatorio generado es 0.04517066,
entonces m ·0.04517066 = 3,1619462. Así, el número escogido al azardesde los números
1,2, " .,70 es el 4.
Para escoger una muestra aleatoria simple de tamaño n desde una población de tamaño
N, se procede de la siguiente forma:
- Sé rotulan a los elementos de la población con los números 1,2, ...,N.
- Se escoge un número al azar desde los números 1,2, ... ,N.
12
dato
- De la población se escoge el elemento rotulado con el número obtenido en el paso
anterior.
- Se repite este procedimiento n veces. En caso de obtener un número que ya ha

sido generado, se vuelve a repetir el procedimiento.
Si el tamaño de la población es "grande': la solución que hemos dado anteriormente

podría aún ser un poco engorrosa. Una forma de simplificar la elección de la muestra la
mostraremos a través del ejemplo siguiente.
En el año 2003, 159.000 estudiantes rindieron la PSU. De esta población de tamaño

N = 159.00 escogeremos una muestra aleatoria de tamaño n = 1.300.
Primeramente 159.000 se divide por 1300 y luego se redondea hacia abajo, es decir,
obtenemos el número 122.
Ahora se elige un número al azar desde los números 1,2,....,122 (con el procedimiento
descrito anteriormente). Para este ejemplo generamos el número 0.28935411, por lo
que el número escogido desde los números 1,2 .... ,122 es 36.
Finalmente, los 1300 elementos escogidos de la población serán aquellos identificados

con los números:
36, 36 + 122, 36 + 2 . 122, 36 + 3 . 122, ... , 36 + 1298 . 122, 36 + 1299 . 122
Supongamos ahora que en el curso DatosyAzar.cl, de los 700 inscritos hay 420 mujeres
(60%) y 280 hombres (40%). Si realizamos un muestreo aleatorio simple de tamaño (por
ejemplo) 40, no tenemos garantía que ésta contenga la misma proporción de mujeres
y hombres que hay en la población. Si nosotros queremos asegurar que los hombres y
mujeres (se les llama estratos) estén presentes en la muestra en las mismas proporciones
como lo están en la población, entonces primero consideramos una lista con sólo las
mujeres (en este caso numeradas del1 al 420) y luego una lista con sólo los hombres (en
este caso numerados del1 al 280). Luego se obtiene una muestra aleatoria simple (con el
procedimiento descrito anteriormente) de tamaño 24 (60%de 40) desde el estrato de las
mujeres y otra de tamaño 16 (40% de 40) del estrato de los hombres. Estas dos muestras
se reúnen obteniendo lo que se conoce como muestra aleatoria estratificada.
Ejemplo. Una fundación tiene 3 colegios de enseñanza media. Uno tiene 600 alumnos,
otro 400 alumnos y el último 1.000 alumnos. De la población de 2.000 alumnos se
sacará una muestra de 80, con el fin de realizarles una encuesta para saber que talleres
deportivos serían de su preferencia.
13
dato
Como una forma de que los 3 colegios queden representados en la misma proporción que
están en la población. se consideran 3 muestras aleatorias simples, una por cada colegio,
esto es, una de cada estrato. Del primer colegio se extrae una muestra aleatoria simple
de tamaño 24 (30% de 80), del segundo colegio se extrae una muestra aleatoria simple
de tamaño 16 (20% de 80) y del tercero una muestra aleatoria simple de tamaño 40 (50%
de 80). La reunión de las tres muestras será nuestra muestra aleatoria estratificada.
Como vimos anteriormente, el estudio de una población o muestra significa (en

estadística) medir o determinar alguna característica de sus elementos. Como ésta
característica varía de un elemento a otro (en la población o muestra según corresponda)
se acostumbra a llamar variable a esta característica.
Por ejemplo, si consideramos la población compuesta por los profesores del curso
DatosyAzar.c1, algunas variables que podríamos considerar son:
Sexo, AFPa la cual pertenecen, número de hijos, edad (en meses), nivel de conocimiento
de la planilla Excel (bajo, medio, avanzado), grupo sanguíneo, etc.
Las variables son clasificadas de acuerdo al conjunto de valores posibles que estas
pueden tener. Esta clasificación la desarrollaremos más adelante. También, los valores
que obtenemos al considerar una característica sobre cada uno de los elementos de la
población o muestra los llamaremos datos.
En general, datos muestrales pueden ser analizados incluyendo cualquiera o todos los
siguientes objetivos:
Obtener una visión panorámica de la distribución de los datos obtenidos de la

muestra, identificando cualquier característica de interés que pudiera estar pre-
sente. Usualmente, esto requerirá que los datos sean arreglados u organizados en
alguna forma de tabla y,tal vez,también la representación de los datos organizados
mediante un gráfico o diagrama. Valores numéricos que resumen información
también pueden ser determinados.
Determinar una medida numérica que resuma, de alguna manera, el "centro" de los
datos; por ejemplo, el promedio o media aritmética. A menudo, habrá más de una
de estas medidas que sea apropiada para estos fines. A este tipo de medidas se les
conoce como medidas de tendencia central o localización central. Es importante
mencionar que la utilización de un solo valor (como el promedio, por ejemplo) es
una drástica reducción de los datos y suele contener escasa información sobre el
verdadero comportamiento de estos.
14
dato
Determinar una medida numérica que resuma el grado de dispersión entre los
valores de la muestra. Por ejemplo, dos grupos de alumnos rindieron un examen
obteniendo las siguientes notas.
Grupo A 5.5 4.5 5.2 4.8
Grupo B 2.2 6.8 4.0 7.0
Vemos que tanto el grupo A como el grupo B tienen el mismo promedio, 5.0, pero las
notas del grupo Bestán más "disparejas" que las del grupo A. Las medidas que resumen
este tipo de variabilidad se conocen como medidas de dispersión.
Los métodos empleados para obtener los objetivos antes mencionados se conocen con
el nombre de Estadística Descriptiva (en tiempos actuales también se usa Análisis
Exploratorio de Datos).
Clasificación de las Variables
Las variables se presentan en dos tipos diferentes; a saber, cualitativas y cuantitativas,

de acuerdo al tipo de datos usados para medir su valor.
Las variables cualitativas se subdividen en nominales y ordinales y las variables
cuantitativas en discretas y continuas.
Nominal
Cualitativa
{ Ordinal
Variable
Discreta
Cuantitativa
{
Continua
Es muy importante que podamos establecer con qué tipo de variables estamos tratando
porque los métodos que podemos usar (en cualquier análisis descriptivo o inferencial)
dependen del tipo de variable. Algunos procedimientos pueden ser usados con un
tipo de variables, pero no con otro tipo (como veremos más adelante), de manera que
la identificación correcta de un tipo de variable es fundamental para evitar errores en
su análisis.
Establecer diferencias entre tipos de variables, significa en el fondo, establecer diferencias

entre tipos de datos.
15
dato
Variable Cualitativa Nominal
Una variable se dice cualitativa nominal si datos nominales son usados para medir su
valor. Diremos que los datos son nominales si:
estos consisten en etiquetas simples o categorías tales como femenino/masculino;

si/no; casado/soltero; sangre tipo A, tipo B, tipo O/ tipo AB, etc.
y las categorías o etiquetas no tienen un orden inherente; esto es, no importa si

escribimos masculino/femenino o femenino/masculino o si escribimos tipo de
sangre A; O; AB; B o tipo de sangre O; AB; A; B, etc.. En otras palabras, el orden de
las categorías es completamente arbitrario.
Las categorías que se usan con variables nominales son invariablemente alfabéticas
o no numéricas. Debido a esto no podemos usar las reglas usuales de la aritmética
con variables nominales, por ejemplo, no podemos encontrar el sexo promedio de 10
hombres y 20 mujeres sumándolos y dividiendo por 30/ como si podríamos encontrar
el promedio de las notas 5,6 y 6/2/ haciendo la operación
5,6+6/2 =5/9.
2
Ejemplo. Una encuesta realizada por la Cámara Chilena del Libro en 1999, encuestó
a 17.458 personas mayores de 15 años, de las ciudades de Santiago, Valparaíso y
Concepción. En la encuesta se les consultó, entre otras cosas, acerca de las razones por
las cuales compra o compraría libros. Las respuestas que se registraron fueron: cultura
general, ayuda a capacitarse, aumentar conocimientos, satisfacción personal y otras
razones.
La variable que está midiéndose en este caso es "razones" paracomprar un libro y toma
uno de los cuatro valores antes mencionados.
La tabla siguiente resume la información recogida en la encuesta.
Culturo Generol 10.708

Ayuda a Capacitarse 2.416
AumentodeConocimientos 3.015
Satisfacción Personal 1.007
Otras 312
Total 17.458
16
dato
Variable Cualitativa Ordinal
Una variable se dicecualitativa ordinal si datos ordinales son usados para medir su valor.
Diremos que los datos son ordinales si
estos constan de categorías tales como satisfecho/insatisfecho, nivel escolar su-

perior/medio/bajo, rendimiento en matemática muy bueno/regular/malo, etc.
las categorías tienen un orden naturalo inherente, como en el caso de losejemplos

anteriores.
En los datos ordinales se tiene un orden natural pero, no se puede cuantificar (es decir,
medir precisamente) la diferencia entre las categorías. En consecuencia, al igual que
para las variables nominales, no se pueden aplicar las reglas ordinarias de la aritmética
a datos ordinales.
Ejemplo. Los siguientes datos muestran los resultados de estudios realizados por una
compañía de telefonía móvil acerco de la calidad de atención que ellos entregan a sus
clientes.
Mala 73/4
Regular 41,5
Buena 34/2
Muy Buena 4,9
Total 700
La variable aquí es "grado de satisfacción del c1iente"y puede asumir cualquiera de los
cuatro valores que muestra la tabla, desde"mala" (13.4% de clientes) hasta "muy buena"
(4.9% de clientes). Es común que se coloquen las categorías en la primera columna y que
éstas se encuentren ordenadas en forma ascendente o descendente, respecto del orden
inherente dentro de las categorías. En nuestro caso, el orden natural es "mala'; "regular';
"buena"y"muy buena" o en su defecto,"muy buena'; "buena'; "regular"y "mala".
En consecuencia, podemos decir que los dientes que respondieron "muy buena';
están más satisfechos con la atención que entrega la compañía que aquellos que sólo
respondieron "buena': Sin embargo, no se puede decir cuanto más satisfechos están
estos clientes. Las respuestas de los clientes son juicios subjetivos, que no han sido
medidos con algún instrumento científico y que,además pueden cambiar en cualquier
momento.
17
dato
Por esta razón, no podemos, por ejemplo, decir que un cliente que respondió que la
atención era "muy buena" se sienta el doble de satisfecho que uno que respondió
"buena", o una vez y media más satisfecho, o un 35% más satisfecho, etc. En otras
palabras, no podemos decir exactamente cual es la diferencia entre las categorías. En
consecuencia, aunque las categorías en datos ordinales pueden ser ordenadas, no es
posible decir algo acerca del tamaño de la diferencia entre éstas.
La variable ordinal vista en el ejemplo anterior tiene como valores categorías (que tienen
un orden inherente) lascuales son "alfabéticas" o no "numéricas': Pero, también es común
que las categorías tomen forma de "números': Ejemplos de este tipo de variables son
las escalas de clasificación, como la escala Apgar (usada para evaluar la salud de un niño
recién nacido) o la escala de Mercalli para medir la intensidad de los temblores, etc.
En muchos casos, lasescalas de clasificación requieren la completación de un cuestionario,

el que usualmente requiere de juicios subjetivos, y/o la elección entre categorías cuyo
límite es confuso. Por ejemplo "muy bueno" y "bueno" o "totalmente de acuerdo" y
"de acuerdo': Entonces, los datos provenientes de estas escalas no son exactamente
mediciones, por loque son datos ordinales "numéricos':
Ejemplo. El test de Apgar es un test que se realiza a un niño recién nacido para evaluar
su estado general de salud. La siguiente tabla muestra los parámetros en que se basa el
test y las puntuaciones que se asignan.
Frecuencia cardíaca
Ausente <100 >100
(pulsaciones/minuto)
Esfuerzo respiratorio Ausente Lento, irregular Bueno, llora
Tono muscular Laxo de Cierta flexión Movimiento activo

extremidades
Respuesta a sonda
nasal
Sin respuesta Mueca Tose o estornuda
(luego de limpiar
área ORL)
Cuerpo rosado!
Completamente
Color Azulado! pálido extremidades
rosado
azuladas
18
dato azar.el
La suma de los puntos obtenidos en los cinco parámetros es el valor que tiene el test
de Apgar del recién nacido.
Si el test arroja un valor mayor que 7 (8,9 ó 10) indica que el niño presenta buen estado
general de salud. Luego,según va bajando de 7,significa que su estado es "menos bueno':
En consecuencia, el resultado del test de Apgar es un número que puede ser 0,1,2,.. . ,
10, por lo que los datos resultantes son de tipo ordinal "numérico'; ya que el hecho de
que un recién nacido tenga Apgar 10 no significa que es el doble más saludable que uno
con Apgar 5; es decir, no se pueden realizar operaciones aritméticas con estos valores.
En resumen, variables ordinales pueden tomar tanto valores no numéricos como

"numéricos" y, en ambos casos, existe un orden natural entre ellos. Sin embargo, en el
caso "numérico" no es posible realizar sumas, multiplicaciones, etc.
Variable Cuantitativa
Una variable se dice cuantitativa si datos numéricos (también llamados métricos) son
usados para medir su valor. Diremos que los datos son numéricos si:
• estos consisten en valores específicamente definidos, tales como 15°C, 25°C,

etc. Ó 29 cm, 11 cm, ó 3 kg, 1.7 kg, 8.2 kg, etc.
• Y si x; z; x+h; z+h son datos, entonces z - x = (z+h) - (x+h).
Esta última propiedad es una diferencia fundamental que existe entre datos ordinales
"numéricos"y datos numéricos o métricos. Recordemos que en el ejemplo del test de
Apgar esta propiedad no se cumplía, ya que la diferencia entre un puntaje de 9 con uno
de 7 no era lo mismo que la diferencia entre un puntaje de 6 con uno de 4.
Por ejemplo, la temperatura, el peso, la altura, el número de hijos, son variables numéricas
o métricas.
Datos numéricos son números "reales". Es decir, las operaciones aritméticas (suma,
resta, multiplicación y división) son válidas con este tipo de datos. También, es posible
calcular el promedio u otras medidas numéricas cuando se dispone de datos métricos.
Por ejemplo, se puede calcular la altura promedio de dos alumnos que miden 1.68 mt
y 1.72 mt, sumando y luego dividiendo por dos (se obtiene 1.70 rnt).
Variables cuantitativas tienen unidades de medida lo que no ocurría con variables

nominales y ordinales, por ejemplo, el peso se mide en mg, gr, kg, etc.; la altura se mide
en cm, mt, etc.; latemperatura se mide en grados Centígrados, etc. También el conteo de
objetos o cosas son variables cuantitativas, por ejemplo, el número de hijos, el número
de docentes en un establecimiento educacional, etc.
19
dato
Ejemplo. Consideremos el área (en cm-) de 5 triángulos.
Triángulo 7 2 3 4 5
Area (crrr) 40 50 55 70 80
En este caso la diferencia de área entre el primer y el segundo triángulo es exactamente

la misma que la diferencia entre el cuarto y el quinto. En otras palabras si x = 40, z = 50
Y h = 30, entonces z - x = (z + h) - (x + h).
También, vemos que el área de 80 cm- es exactamente el doble que el área de 40 cm-.
y podemos sumar el área de los cinco triángulos y, luego, dividir por cinco para obtener
el área promedio de estos. En otras palabras, podemos usar todas las operaciones
aritméticas con estos datos numéricos.
En resumen las variables cuantitativas son medidas con datos que constan de números
reales, a los cuales se les pueden aplicar todas las operaciones algebraicas válidas con
este tipo de números. Por esta razón, existe una amplia gama de métodos para presentar,
resumir y analizar variables cuantitativas, como lo veremos más adelante.
Finalmente, las variables cuantitativas siempre tienen asociadas unidades de medida.
Como vimos anteriormente, lasvariables cualitativas las podemos subdividir en variables

nominales y ordinales, estas últimas, a su vez, las podemos clasificar en "alfabéticas"
y "numéricas". En el caso de variables cuantitativas también existe una subdivisión,
clasificándose en discretas y continuas.
Diremos que una variable cuantitativa es discreta si el número de posibles valores

que asume es un conjunto contable (es decir, es finito o numerable). Frecuentemente,
provienen de conteodecosas, tales como número de accidentes de tránsito, número de
fumadores en Chile, número de hijos, etc.
Por otra parte, diremos que una variable cuantitativa escontinua si el conjunto de posibles
valores que asume es un conjunto no contable. Por ejemplo, el peso de una persona
es una variable continua, aunque por limitaciones del instrumento utilizado para medir
pareciera ser discreta. Usualmente, variables continuas provienen de mediciones decosas,
por ejemplo, peso, altura, tiempo, volumen, temperatura, presión, etc.
20
dato
El siguiente diagrama esquematiza lo que hemos visto en esta sección.
Tipos de Variables
I
Cualitativas Cuantitativas
I I
Nominales Ordinales Discretas Continuas
(Categorías) (Números) (Números)
Alfabéticas "Numéricas"
(categorías) (Números) Asociadas Asociadas
a conteo a mediciones
de cosas de cosas
No hay un orden Hay un orden natural

Inherente en las entre las categorías o
categorías entre los números
¿Cómo pueden presentarse los datos?

Como dijimos anteriormente, es importante poder establecer el tipo de variables con
los cuales se está trabajando ya que los métodos de análisis dependerán del tipo de
éstas. De igual manera es importante observar la forma en que se presentan los datos,
pues su análisis también dependerá de esa presentación.
Datos a "granel": Se muestran uno a uno todos los datos. Por ejemplo, la edad en
meses de 116 profesores participantes en un perfeccionamiento de matemática, el año
2002, se muestra a continuación.
474 552 599 556 547 362 554 305 423 536
557 564 608 682 445 739 462 366 484 454
522 500 329 485 328 720 443 578 462 392
622 460 643 453 453 646 552 588 574 591
668 682 582 474 446 418 445 462 354 520
606 577 517 545 427 520 459 385 493 405
522 412 539 456 702 383 483 605 413 390
661 331 459 481 564 409 375 496 432 767
677 640 636 344 564 650 396 443 576 542
542 505 658 672 352 649 587 472 516 410
363 570 651 447 600 ,-'" 578 475 396 600
544 539 355 540 508 589
21
dato
Por ejemplo, el número 599 significa que un profesor tenía 49 años y 11 meses. En este
caso lavariable considerada (edad) es cuantitativa continua (eltiempo se midió en meses
como una forma de aproximación a la edad exacta).
Datos entabla de frecuencia: Se muestran los datos en una tabla, donde aparece el
dato con su respectiva frecuencia (número de veces que se repite). Por ejemplo, latabla
siguiente muestra los resultados de una consulta que se realizó en un colegio de Buin
sobre el número de hermanos que tenía cada alumno.
55
221
2 167
3 95
4 42
5 8
6 2
7
Total 591
Por ejemplo, el número 221 significa que hubo 221 alumnos que declararon que tenían
1 hermano. En este caso la variable considerada, número de hermanos, es cuantitativa
discreta.
En muchas ocasiones, aliado de la columna frecuencia, aparece la columna frecuencia

relativa (que es la frecuencia dividida por el total) y también la columna frecuencia
relativa porcentual (que eslafrecuencia relativa multiplicada por 100%). Por ejemplo, en
la fila 3, la frecuencia relativa y la relativa porcentual serían 167/591 Y(167/591) . 100%,
respectivamente. Cabe señalar que es común usar aproximaciones decimales cuando
se calculan frecuencias relativas. En el ejemplo anterior, si se aproxima a la milésima
(tres decimales significativos) seobtiene como frecuencia relativa el valor 0,283 y como
frecuencia relativa porcentual a 28,3%.
Es necesario enfatizar que los números 167/591 y 0,283 no son iguales. De hecho, una
aproximación decimal puede llevarnos a cometer errores. Por ejemplo, si se desea
encontrar un natural n que satisfaga la ecuación
4.180 5
8.500-n 7
y aproximamos 2 por 0,714, obtenemos que n = 2.645,66, cuando el verdadero valor

7
es n = 2.648.
22
dato
Datos en un diagrama de tallo y hojas: Se muestran losdatos através de un diagrama
que permite mayorsimplicidad para su análisis. Por ejemplo,losconsumos mensuales de
gas de cañería (medida en metros cúbicos), entre el 1 de diciembre de 1998y el 30 de
noviembre de 2001, de un cierto hogar de Santiago, se muestran en el diagramade tallo
y hojas siguiente. En este caso el tallo representa las decenas y las hojas las unidades.
1 9
2 8 240 8
3 O 1 2 6 8 2 7 8 9 5 O5
4 7
5 7 7 3 9 76
6
7 O 5 640
8 7
9 7
10 5 783
Por ejemplo, la fila I2 I 8 2 4 O 8 significa que tenemos los datos 28, 22, 24,
20 Y 28. También, la fila []]] 5 7 8 3 I significa que tenemos los datos 105,
107, 108Y 103. En el caso de la fila significa que no hay datos
de la forma sesenta y algo. No significa que se tiene el dato 60.
En este ejemplo la variable considerada (consumo de gas) es cuantitativa continua.
El diagramade tallo y hojas fue introducido por uno de losgrandes estadísticos del siglo
XX, John Tukey, en su célebre libro "Exploratory Data Análisis" del año 1977.
Datos agrupados: Se muestran los datos en una tabla donde aparece el número de
datos que se encuentran en un intervalo determinado, pero no se sabe exactamente
cuales son losdatos. Por ejemplo, lossiguientes datos son puntajes de matemática de la
prueba SIMCE 2008 (4 básico), en establecimientosde las comunas de Estación Central,
Lo Prado y Pudahuel en la región Metropolitana.
23
dato"azar.cl
Intervalo Frecuencia
[210 - 220[ 13
[220 - 230[ 18
[230 - 240[ 13
[240 - 250[ 10
[250 - 260[ 16
[260 - 270[ 9
[270 - 280[ 6
[280 - 290] 5
Total 90
Acá, por ejemplo, la frecuencia 10 significa que hay 10 datos que son mayores o iguales
a 240 (por esto el símbolo [ antes del 240) y menores que 250 (por esto el símbolo [
después del 250), pero no se sabe el valor exacto de cada uno de los 10 datos.
También, en la pen últ im a fi la de la tabla. la frecuencia 5 significa que hay 5 datos que
son mayo res o iguale s a 280 y menores o ig uales que 290. '
Datos en un gráfico: Se muestran los datos el] una repre sentación gráfica. Est a
representación permite observar rápidamente patron esde com portamiento de los datos.
Es com ún (pero no excluyente de otras formas) qu e gr áficos de barras se usen ta nto
para variables cualitativas como cuantitativas. También, gráficos circulares (conocidos
como gráficos de torta) son más comunes en datos cualitat ivos y gráficos de línea en
dat os cuantitativos co n alguna base cronol ógica . Finalmente el histograma es un gráfico
part icu lar de barras q ue se usa para datos cuant it at ivos (agrupados).
Gráficos de barras
Si los dat os son cualitat ivos y en un número suficientem ente pequeñ o de categoría s (lo
cual a menudo signifi cará no numérico), entonces, un gráfico de barras es apropiado.
No hay una regla para el número máximo de categorías que puedan ser representadas
en un gráfico de barras; no obstante, construir demasiadas categorías no ayudará al
propósito de proveer informació n efectiva.
Los gráficos de barras pueden ser "simples'; mostrando sólo una variable, o "múltiples';
most rando varias variables. No obstante, graficar dema siadas variables en un mismo
diag rama, probablemente confundi rá la información qu e pudiere obte nerse del gráfico
de barras, esto es, dar un cuadro claro de las caracte rísticas esenciales de los datos.
24
dato"azar.el
Convencionalmente, un gráfico de barra s tiene la frecuencia o frecuencia relativa
porcentual (porcentaje) en el eje vertical y las categorías en el eje horizontal.
Se dibuja una barra por cada categoría con una altura igual a su frecuencia o frecuencia
relativa porcentual;todaslas barrastienen la misma longitud en su base,y todaslas barras
están separadas por espacios iguales. La longit ud de la base y la división en espacios
son asuntos de elección (restringidos, por supuesto, por el tamaño de la página), y el
número de categorías que un gráfico de barras puede exhibir,está limitado por la misma
consideración .
Ejemplo.
Resultados de consulta sobre preferencia de

Talleres Extraprogramáticos a 700 alumnos
140 .------
- - - - - - - - - - -- - - - - - - - - -- - - - - - -----,
124
120 +--------------------------~_-------j
100 +- -H5- -I c, •• ;} -_ ------j
SO +----~------IT0f_--------~------!i 'C\} _ _ -j
60 .¡-;""--~l---41--_¡___----{ j--- -- - - -- --;¡
40
20 +---J,~""'1l_--I'L>!I_____¡¡
ltl
u
QJO
=1::
lI'l
ltl
QJ
1::
1::
'0 o
~ (5
..o
...
ltl
U
.¡¡;
ltl
~ "t:l
ltl ....ltl...
o .!!!
1i ltl ... '0 O '0 u .... ....ltl::J ....1::
::J
:Q
C'l
o
'0
(¡¡
cx:lQJ
"t:l
o
1::
QJ ....::J
ltl
(5
.::J
u.. ... '::J
~ a::: iii ~ :e
« ~
O O-
u.. ....QJ ::J
x :::J
::J QJ
E Vl
o
u
Talleres
El valor 24 sobre la barra asociada al taller Folclore significa que hubo 24 alumnos que
prefieren éste taller.
25
dato azar.el
Mismo gráfico anterior, pero ahora con barras horizontales,
Resultados de consulta sobre preferencia de Talleres
Extraprogramáticos a 700 alumnos
Ufología t:~~::=~~J--~---------------l
Teatro
Sexualidad
t=============:=============]
Pintura
Música
Literatura
Fútbol
1-'--------,
Folclore
Computación
t===
Cine
Ciencias
Baile Moderno
Aeróbica J:::::;:::::;;::L-,----.-----,-------,.--J
20 40 60 80 100 120 140
Ejemplo, Resultado (en porcentaje) de una consulta a 124 profesores participantes de

un perfeccionamiento en matemática, en el año 2002, acerca de la AFP a la cuál estaban
afiliados,
25,0 % .,------_~.--.-----_----_----------_-.---------___;
20,0%
15,0%
10,0%
5,0%
+"'
ro ro
E
::l
O-
ro
+"'
1i
1V
+"'
'"
+"'
's
-o
's
.!!:!
ro
::¡¡;
-o
1V
c ...'"
~
o
::l
ro
::c
'o,
ro
c
ro e
e, ro '"
ro
U ::¡¡; c: +"'
C
C
ro
ro ..a
VI ro
E
::l
VI
~bres 11 Mujeres I
Las dos barras sobre laAFP Ha bitat, significan que el 8,9% de los hom bres (11) y el 23,4%
de las profesoras mujeres (29) estaban afiliados a esta AFP
26
dato
Ejemplo. Los datos siguientes corresponden a puntos de rating promedio hogar, desde
1 de marzo al 5 de noviembre 2003. Fuente, El Mercurio de Santiago, 09 de noviembre
de 2003.
Cabe recordar que el sistema a través del cual se mide este tipo de rating es el People
Meter. El principal objetivo del People Meter es la medición de una muestra de audiencia
televisiva, con el objeto de estimar indicadores de rating en toda la población. El tamaño
la muestra esdel orden de400 hogares del Gran Santiago,escogidos probabilísticamente.
Esta muestra de hogares representa aproximadamente a 2000 personas. Además, la
muestra de hogares es clasificada de acuerdo al nivel socioeconómico en 4 niveles:
Alto (ABCn. Medio Alto (C2). Medio Bajo (C3,) y Bajo (D). También existe otro tipo de
caracterizaciones en función de otras variables que son de interés para las empresas
publicitarias (para más información sobre el People Meter visite el sitio Web www.
peoplemeter.c1).
26,3
Teletrece 24 Horas Meganoticias Chilevisión Telediario

Noticias
Debemos señalar que en el gráfico anterior existen fuertes distorsiones que podrían
entregar información que no es real.
En primer lugar, la barra asociada a Teletrece tiene un ancho de 2,2 cm, mientras los
anchos de todas las otras son iguales a 2,1 cm.
Además, si consideramos como punto de referencia la altura de la barra asociada a

Telediario (0,5 cm), entonces la altura asociada a la barra Teletrece debería ser 2,53 cm,
en lugar de los 4,60 cm que muestra el gráfico.
Así, el área asociada a Teletrece debería ser 5,31 cm 2, en lugar de los 10,12 cm 2 que
muestra el gráfico anterior. Es decir, el área correspondiente a la barra de Teletrece es
un 97% más grande de lo que debería ser.
27
dato
Histograma
El histograma es un gráfico de barras particular. Se usa habitualmente para representar

gráficamente variables continuas, cuyos valores se agrupan en intervalos. En este
gráfico las barras son contiguas (pegadas) y la altura de cada barra es proporcional a la
frecuencia relativa porcentualdel respectivo intervalo. La altura de labarra es lafrecuencia
relativa porcentual del intervalo,dividida por el largo de su base. Así, el área de esa barra
corresponde exactamente a la frecuencia relativa porcentual del respectivo intervalo.
De esta forma, la suma de las áreas de todas las barras es 100%.
En algunos casos en lugar de frecuencia relativa porcentual se usa frecuencia relativa o
simplemente frecuencia.
Ejemplo. El gráfico siguiente representa el histograma para losdatosdel ejemplo sobre

los 90 puntajes de matemáticas en la prueba SIMCE 2008, en algunos establecimientos
de la región Metropolitana.
210 220 230 240 250 260 270 280 290 puntaje
Así, la barra sobre el intervalo [220-230[ tiene área igual a 20%. En este caso el
largo de la base del intervalo es 10 Y la frecuencia es 18 (por lo que la frecuencia
relativa es ~ = O, 2 Yla frecuencia relativa porcentual 0,2· 100% = 20%.

90
20
Por lo tanto, la altura de esta barra es - = 10.
10
28
dato
Gráficos Circulares (de torta)
Los gráficos circulares, también conocidos como gráficos de torta, proporcionan una
alternativa para el gráfico simple de barray una de sus ventajasesque resultan familiares
para la mayoría de los lectores.
El ángulo en el centro de cada "tajada"de la torta (de un ángulo total de 360°) es igual
a la frecuencia de su categoría respectiva, comparada con la frecuencia total. Es decir.
se obtiene al multiplicar 360° por la frecuencia relativa de la categoría que se desea
representar.
Los gráficos de torta y los gráficos de barra son maneras efectivas de ilustrar las
características de mayor importancia de los datos, y la elección de ellos es a menudo
subjetiva. Sin embargo, un gráfico de torta puede ser más apropiado si el propósito es
comparar la frecuencia de cada categoría con la frecuencia total, en vez de compararla
con lafrecuencia de otra categoría. En el caso de comparación entre frecuencias, podría
preferirse un gráfico de barras.
La limitación principal de un gráfico de torta es que puede representar solamente una

variable, aunque desdeluego,variosgráficosde torta pueden serusados para representar
varias variables.
Ejemplo. El siguiente gráfico de torta ilustra la producción de cobre del año 1999, de
las distintas divisiones que conforman Codelco.
Andina
R.Tomic
I!I Salvador
li\!RJ Teniente
• Chuquicamata
23,20%
Porejemplo, para encontrar el ángulo asociado a ladivisión Andina, debemos multiplicar

la frecuencia relativa asociada a esta categoría por 360°. En consecuencia, el ángulo
asociado a la división Andina es 0.163 .360° = 58.7°.
29
dato
Ejemplo. Los siguientes gráficos de torta representan los resultados de la encuesta
realizada por la Cámara Chilena del Libro acerca de las razones para comprar libros, pero
ahora separados por sexo.
4,82% 1,93%
1Il Cultura General
• Ayuda a Capacitarse
1Il Aumento de Conocimiento
Satisfacción Personal
Otros
Hombres
6,62% 1,66%
rII Cultura General
• Ayuda a Capacitarse
Aumento de Conocimiento
l!fII Satisfacción Personal
Otros
60,03%
Mujeres
En resumen, los gráficosde torta son una alternativa frente a losgráficosde barras y son
bastante simples de realizar. El tamaño, es decir, el diámetro de un gráfico de torta es
arbitrario.También, el ángulo de cada'tajada'de latorta es proporcionala la frecuencia de
la clase (o categoría) correspondiente en ladistribución de frecuencias. Finalmente, como
dijimos anteriormente, cada gráfico de torta puede mostrar solamente una variable.
30
dato azar.el
Gráficos de línea
Los gráficos de línea son usados comúnmente como una forma de exhibir datos,
particularmente si los datos tienen una base cronológica; es decir, si los datos consisten
en mediciones regulares en el tiempo, digamos cada minuto, día, semana, año, etc. Es
común anotar el tiempo en el eje horizontal y la frecuencia de una o más categorías en
el eje vertical.
Ejemplo. El siguiente gráfico muestra los precios de venta diarios de la libra de cobre
en la Bolsa de Metales de Londres en el año 1999. Los valores están expresados en
centavos de dólar.
90,0
~ .r-
..DVl' 80,0
OQJ ~"Vv"\,lvl -v--
u~
-0-0
QJ~
ruQJ
70,0
60,0 -'" -:»: ~
15'"0
._ VI
50,0
-ru>
o 40,0
- ro
QJ+-' 30,0
-o§5
OU
.- e
20,0
UQJ
~~ 10,0
e, I I I I I I I I I I
E F M A M J J A s o N D
Días (meses) 1999
Por ejemplo, el valor de la libra de cobre del día 12 de enero de 1999 fue de 66,4 centavos
de dólar, que corresponde al último valor en que se cotizó la libra de cobre ese día.
Los 66,4 centavos de dólar corresponden a 66,4 = 0,664 de un dólar, y como el dólar al
100
final del día 12 de enero de 1999 fue 472 pesos chilenos, 0,664 de un dólar corresponde
a 313,4 pesos chilenos.
31
dato
Ejemplo. El gráfico siguiente muestra los precios de cierre (expresados en pesos
chilenos) de las acciones de Endesa en la Bolsa de Comercio de Santiago, en el período
comprendido entre el 1 de enero de 1987 y el 31 de diciembre de 1994.
Pesos
Chilenos
400 - , - - - - r - - - - - - - - - ¡ - - - - , - - - - - - - - r - - - - , - - - - - - - - - , - - - - - , - - - - - - ,
350
300
250
200
150
100
50
O~~:=:;:===::::::~:::::::;::::::::==-¡---_____,__-___r-----,--~
1987 1988 1989 1990 1991 1992 1993 1994 años
Fuente: Bolsa deComercio deSantiago
Ejemplo. El siguiente gráfico corresponde a las toneladas de locos (aproximadas)

extraídas en el litoral chileno entre los años 1950 y 1990.
Apertura del mercado

Ton
t
800
400
1950 1970 1982 1984 1990 Tiempo
Fuente: Sesma Pesca
32
dato
Ejemplo. El siguiente gráfico muestra 105 cambios en las presiones sistólicas (presión
que genera en una arteria la sístole del corazón) y diastólicas (presión que genera en
una arteria la diástole del corazón) con respecto a la edad. Estas presiones se miden en
milímetros de mercurio. Fuente, Biología 1° año medio, Editorial Mc Graw-Hill, 2000.
Presión
(mmHg)
200
Sistólica
150
Diastólica
100
50
O
O 20 40 60 so Edad (años)
Ejemplo. Tasas brutas de natalidad y mortalidad (por mil) en Chile, en el período 1900-
2000.
Natalidad 38,4 39,5 39,4 39,8 36,4 31,0 37,5 26,4 22,2 23,3 18,3
Mortalidad 31,5 30,7 31,0 24,7 21,3 15,012,5 8,7 6,6 6,0 5,4
Por ejemplo, en el año 1970 la tasa de mortalidad fue de 8,7 y la de natalidad 26,4.
vi
+-'
..o 45
s:
o 40
o
2 35
ro
-o 30
ro
u
25
o 20
Tasa Natalidad
-3
V1
ro 15
V1
~ 10
~-- Tasa Mortalidad
5
1900 1910 1920 1930 1940 1950 1960 1970 1980 1990 2000 años
Datos en un diagrama de puntos. Los datos se muestran a través de un gráfico

de puntos (pares ordenados), donde la abscisa representa el dato y la ordenada su
33
dato
frecuencia. Por ejemplo, el gráfico siguiente representa el número de hijos de profesores
de matemáticas participantes de un curso de perfeccionamiento.
Frecuencia
25
20
15
10
O
O 2 3 4 5 6
Para una mejor visualización es común unir con una línea el punto con el eje de las
abscisas. Por ejemplo, el par (0,10) significa que 10 profesores (del total de 51) no tienen
hijos. En este caso, la variable considerada es cuantitativa discreta.
Las medidas de resumen que se utilizan comúnmente para describir, en alguna forma,
el "centro" de un conjunto de datos son:
La moda
El promedio (también conocido como media aritmética o simplemente media)
La mediana
Cada una de estas medidas representa la idea de "centro" en diferentes formas y, la

elección y cálculo de estas, en cualquier conjunto de datos, dependerá de al menos
tres factores.
Los aspectos de la "localización central" que se pretende capturar.

El tipo de datos de que se dispone, o sea, si los datos son nominales, ordinales o
numéricos.
La forma como se representan los datos, es decir, si los datos se representan en una
tabla de frecuencia, agrupados, en un gráfico, etc.
34
dato
Es preciso mencionar nuevamente que la utilización de un sólo valor para representar
un conjunto de datos es una drástica reducción de estos. En general este valor contiene
muy poca información sobre el comportamiento de los datos.
la Moda
La moda interpreta el significado de "centro" como el dato que más se repite.
Ejemplo. Al lanzar 10 veces dos dados comunes y observar, en cada lanzamiento, la

suma de las pintas de los dados, se obtuvieron los siguientes resultados.
8; 2; 8; 1; 11; 8; 10; S; 11; 8.
Entonces la moda es el dato 8 (es el que más se repite, se repite 4 veces).
Ejemplo. Las notas de matemática de Pedro durante el primer semestre 2008 fueron:
6,2; S,1; 6,2; 4,6; S,9; 4,6; 6,2; S,S; 4,6.
Par este conjunto de datos existen dos modas, las que corresponden a las notas 4,6 y
6,2 (cada nota se repite 3 veces).
Ejemplo. La tabla siguiente muestra los resultados en 7 séptimos básicos de un liceo

de Buin sobre una consulta que se realizó acerca del número de hermanos que tenía
cada alumno.
o 32
106
2 82
3 48
4 16
5 6
6 2
7
Total 293
Para estos datos la moda es el dato 1 (es el que más se repite, 106 veces).
35
dato azar.el
Ejemplo. El diagrama de tallo y hojas siguiente muestra puntajes de matemática en la
prueba SIMCE 2001, en establecimientos de la zona norte y de nivel socioeconómico
medio alto. En este caso el tallo representa las centenas y decenas y las hojas las
unidades.
23 8 5
24
25 8 7
26 5 8 6
27 3 1 3 1 7 4 7 3
28 8 2 3 2 4 5
29 7 9 8 1 2 6 4 4
30 7 7 7
31 1 O 6 O
32 6
33 7 1
34 5 O
Para estos datos hay dos modas, el dato 273 y 307 (cada uno se repite tres veces, lo que
se visualiza observando las hojas que más se repiten en cada fila).
Ejemplo. La tabla siguiente muestra las edades (en meses) de 35 alumnos de un primero
medio.
[160 - 164[ 4
[164 - 168[ 8
[168 172[ 6
[172 176[ 15
[176 - 180J 2
Total 35
En este caso no conocemos exactamente cuáles son los datos (la edad en meses de cada
uno de los 35 alumnos). Para suplir este desconocimiento, supondremos que los datos
que pertenecen a un intervalo, son todos iguales al punto medio de éste. Por ejemplo,
supondremos que los 4 datos que pertenecen al intervalo [160 -164[, son iguales a 162
(que es el punto medio entre 160 y 164). De esta forma obtenemos los siguientes datos
"ficticios" (presentados en una tabla de frecuencia).
36
dato
162 4
166 8
170 6
174 15
178 2
Total 35
En consecuencia, la moda es 174 (es el dato que más se repite, se repite 15 veces). Notar
que la moda corresponde al punto medio del intervalo con mayor frecuencia. Cabe
señalar que este valor podría ser bastante diferente de la verdadera moda. Por ejemplo,
si los datos fuesen
160, 162, 163, 163, 164, 164, 164, 164, 164, 165, 166, 167, 168, 168, 169, 169,
169,170,172,172,172,172,173,173,173,173,174,174,174, 174, 175, 175,
175,177,180,
la moda sería 164.
Ejemplo. En un séptimo básico con 44 alumnos, se consulta acerca de cuál de los

siguientes talleres escogerían como actividad extra programática: Teatro, Baile, Folclore,
Literatura. Los resultados se muestran en la siguiente tabla.
Teatro 15
Baile 14
Folclore 9
Literatu ra 6
Total 44
Para estos datos la moda es el dato (categoría) Teatro (es el dato que más se repite, se
repite 15 veces).
37
dato azar.el
Ejemplo. La tabla siguiente muestra los índices de calidad del aire en la comuna de
Pudahuel, durante todo el mes de agosto de 1999, medidos cada una hora.
Malo 36
Regular 173
Bueno 503
Total 724
En este caso la moda es el dato (categoría) Bueno. Este dato es el que más se repite, se
repite 503 veces.
Ejemplo. El siguiente gráfico de torta representa una muestra de personas afiliados a

cuatro AFP.
AFP 1
49% IIAFP 2
IIlIAFP 3
IIAFP 4
5%
Para estos datos la moda es la categoría AFP 4. Esta categoría (dato) es la que más se
repite, ya que tiene el más alto porcentaje de afiliados (49%).
38
dato
Ejemplo. Se simulan 2000 lanzamientos de un dado junto a una moneda (ambos
normales). Los resultados se muestran en el gráfico de barras siguiente.
2000 LANZAMIENTOS
1C 15 2C 25 3C 35 4C 45 5C 55 6C 65
Resultados
La notación, por ejemplo, 1C, significa que en el dado sale el número 1 yen la moneda
sale cara.
En este caso la moda es el resultado 2S, pues es el dato que másse repite,ya que tiene
la mayor frecuencia relativa porcentual (es la barra más alta). Cabe mencionar que los
datos en este caso son las categorías 1C, 1S, 2C, ... , etc.
Ejemplo. El siguiente gráfico representa losregistros de las longitudes (en centímetros)

de 1400salmones.
25%
Para estos datos la moda esel punto medio del intervalo que tiene mayorfrecuencia, en
estecaso el intervalo [19 - 26[. Por lo tanto la modaes el valor 22,5 cm. En otras palabras,
la moda es el punto medio del intervalo, cuya barra tiene más alta frecuencia relativa
porcentual (mayor altura).
39
dato azar.el
Observaciones:
La moda es una medida de tendencia central que puede calcularse en cualquiertipo de

datos (cosa que no ocurrirá con las otras medidas que veremos más adelante).
La moda no necesariamente es única (como se vio en ejemplos anteriores).
El Promedio (o media aritmética)
El promedio o media aritmética es una de las medidas de tendencia central más

comúnmente usada (en adelante sólo nos referiremos a ésta como promedio). Si
disponemos de n datos, entonces el promedio es el valor que se obtiene al sumar
todos los datos y luego dividir esta suma por n. Es común anotar X para simbolizar el
promedio.
Observación:
Para calcular el promedio de un conjunto de datos es necesario, como dijimos

anteriormente, sumar los datos. Por esta razón, el promedio no se puede calcular
cuando tenemos datos que provienen de variables cualitativas, pues en ese caso,
las operaciones algebraicas (por ejemplo, suma) no son válidas.
Ejemplo. Un comerciante tiene cuatro mallas de papas. La malla A tiene 25 kg, la malla
e
B 13 kg, la malla 48 kg Y la malla D tiene 34 Kg. Si el comerciante decide repartir las
papas de modo que todas las mallas queden con igual peso, ¿cuánto pesarán las mallas
después de la repartición?
40
dato azar.el
Algunas posibles reparticiones
t_ _17kg -----J
t _
1 kg
4kg
t _
13 kg
t _
5 kg
4kg
En ambos casos cada malla ahora pesará 30 kg.
Notar que 30 Kg corresponde al promedio de los datos 25Kg; 13Kg; 48Kg; 34Kg. En este
sentido decimos que esas mallas de papas pesan en promedio 30Kg.
Ejemplo. Juan obtuvo en matemáticas, duranteel primer semestre de 2008, las siguientes
notas:
5,8; 6,2; 5,3; 4,4; 6,6; 4,1.
Entonces el promedio de las notas de Juan en el primer semestre de 2008fue:
x=5,8+6,2+5,3+4,4+6,6+4,l 5,4.
6
Esto es, 5,4 es un "representante" de las notas de Juan.
En este mismo sentido, cuando un docente dice en consejo de profesores que su curso,
el séptimo A, tuvo promedio 5,6 en matemáticas, está nombrando al representante del
curso, no dice la nota de cada uno de sus alumnos.
41
dato
¿Cuál es la suma de los errores de representación en las notas de Juan?
Se llama error de representación de un dato a la diferencia entre el dato y el

promedio.
Para el caso de las notas de Juan, los errores de representación son:
5,8 - 5,4 = 0,4 4,4 - 5,4 = -1,0

6,2 - 5,4 = 0,8 6,6 - 5,4 = 1,2
5,3 - 5,4 = -0,1 4,1 - 5,4 =-1,3
En consecuencia, la suma de los errores de representación de las notas de Juan es:
0,4 + 0,8 + (-0,1) + (-1,0) + 1,2 + (-1,3) = O.
En el caso de las mallas de papas, los errores de representación son:
25Kg - 30Kg =- 5 Kg 48Kg - 30Kg = 18Kg

13Kg - 30Kg = - 17 Kg 34Kg - 30Kg = 4Kg
Así, la suma de los errores de representación en las mallas de papas es:
- 5Kg + (- 17Kg) + 18Kg + 4Kg = OKg .

¿Será siempre verdad que la suma de los errores de representación es igual a
cero?
Sean XI'"'' xn , n datos. Entonces la suma de los errores de representación es cero.
Para evitar abstracción, asumimos que n = 3, la demostración general es totalmenteanáloga.
Datos: XI
Promedio:
Errores de
representación: XI - X
Suma de errores
= (XI - x)+(x2 - x)+(x3 - x)
de representación
= (xl +x2 +xJ- 3x
X +x +x J
= (XI + x2 + x3 ) - 3( 1 ; 3)
= (x 1 + X 2 + xJ - (X 1 + x2 + X J
=0.
42
dato
Ejemplo. La tabla siguiente muestra el número de personas que viven en cada uno de
los 16 departamentos de un edificio de 4 pisos.
2 3
3 2
4 7
5 2
Total 16
Entonces el número promedio de personas que viven por departamento será igual al
número total de personas que viven en el edificio, dividido por 16. El promedio en este
caso puede ser interpretado de la siguiente forma:
Las personas se reparten en los 16 departamentos de modo que cada uno de los
departamentos quede con la misma cantidad de personas.
¿Cuál es el total de personas que viven en el edificio?
Hay 1 departamento en el cual vive 1 persona.
Hay 3 departamentos, en cada uno de los cuales viven 2 personas, luego en estos
3 departamentos viven en total 6 personas.
Por lo tanto, el total de personas que vive en el edificio es:
7· 7+2'3+3'2+4·7+5'2=57.
En consecuencia, el número promedio de personas que viven por departamento es

. - 57
Igual a x= = 3,7875.
76
43
dato azar.el
El valor x =3,7875 se interpreta en el sentido que cada departamento quedará con
aproximadamente 3 personas. Por ejemplo:
13 departamentos, cada uno con 3 personas.

3 departamentos, cada uno con 4 personas.
Ejemplo. Las notas de un curso de 40 alumnos se muestran en la siguiente tabla:
[1,0-2,0[ °
[2,0 - 3,0[ 3
[3,0 - 4,0[ 7
[4,0 - 5,0[ 10
[5,0 - 6,0[ 15
[6,0 - 7,0] 5
Total 40
Si deseamos calcular el promedio, tendríamos que sumar las notas de los 40 alumnos.
El problema es que no conocemos exactamente cuales son las notas (sólo sabemos
cuantas notas hay en cada intervalo).
Para suplir este desconocimiento, usamos el mismo argumento descrito en el cálculo
de la moda para el caso de la edad en meses de 35 alumnos.
En este caso obtenemos la tabla de frecuencia:
1,5
2,5 °
3
3,5 7
4,5 10
15
6,5 5
Total 40
Ahora, usando el mismo procedimiento descrito en el ejemplo anterior obtenemos

que:
x= 7,5· O+ 2,5 . 3 + 3,5 .7 + 4,5 . 70 + 5,5 . 75 + 6,5 . 5

40
esto es, x = 4,8.
44
dato
Si conociéramos exactamente las 40 notas¡ el promedio sería¡ seguramente¡ diferente
(pero parecido¡ lo que es una diferencia con el caso de la moda). La razón de la posible
discrepancia es que el cálculo que hacemos a través de los puntos medios es una
aproximación (por el desconocimiento de los datos exactos).
Ejemplo. Una prueba de matemática la rindieron 30 alumnos¡ obteniendo promedio

4¡6. Seis alumnos rindieron la prueba posteriormente (faltaron el día de la prueba)¡
obteniendo promedio 3¡5. ¿Cuál es la nota promedio de la prueba finalmente?
Como son 36 alumnos en el curso¡ debemos sumar sus notas y dividir por 36.
Como el promedio de los 30 alumnos que rindieron la prueba inicialmente es 4¡6¡

entonces
46
,
= suma de las notas de los 30 alumnos
30
O sea¡ 4,6'30 = suma de las notas de los 30 alumnos.
Análogamente, 3,5'6 = suma de las notas de los 6 alumnos retrasados.
Así,
4,6·30 + 3,5·6 = suma de las notas de los 36 alumnos.
Por lo tanto,
4,6· 30 + 3,5·6
x=-----
36
esto es¡
- 30 6
x = 4,6 . -36 + 3'5· 36 = 4,4.
En el caso en que la prueba la hubiesen rendido inicialmente 18 alumnos y los que

faltaron hubiesen sido 18¡entonces
4,6 . 78 + 3,5 . 78
x= .
36
O sea¡
- 78 78
x=46·-+35·-
, 36 ' 36 ¡
por lo que
7 7
x=46·-+35·-.
, 2 ' 2
En consecuencia¡ sólo en este caso se tendría que:
x= 4,6 +3,5 =4,7.

2
45
dato
Ejemplo. El siguiente gráfico representa el histograma córrespondiente a los metros
recorridos en el test de Couper por un grupo de alumnos.
1450 1760 2070 2380 2690 3000
¿Cuál es el promedio de metros recorridos en el test de Couper por este grupo de

alumnos?
Como no sabemos cuantos datos hay, asumiremos que son n (aunque veremos que
esto no es relevante).
¿Cuántos datos hay en el intervalo [1450-1760[ ?
Recordar que en un histograma, el área de la barra (en este caso 40%) corresponde a
la frecuencia relativa porcentual del intervalo (en este caso del intervalo [1450-1760[).
Además,
Frecuencia relativa porcentual = -Frecuencia

- - - -del- -intervalo
- - - .700%.
n
En consecuencia,
Frecuencia del intervalo [7450 - 7760[.700% =40%, por lo que

n
Frecuencia del intervalo [1450-1760[ = n- 7: .
20 7,5 75
Análogamente, las frecuencias de los otros intervalos serán n · - n·- n·-y
700 700 700
77,5 .
n· 700 .respecnvarnente.
Ahora, como tenemos las frecuencias por intervalos (datos agrupados), usamos el mismo
argumento visto anteriormente para calcular el promedio de las notas de 40 alumnos,
las cuales estaban agrupadas por intervalos.
46
dato
Así, obtenemos la siguiente tabla de frecuencia:
1605 n ·0,4
1915 n·O,2
2225 n ·0,075
2535 n·O,15
2845 n 0,175
Total n
Finalmente, el promedio que resulta es:
1605· n ·0,4 + 7915· n·O,2 +2225· n '0,075 +2535· n ·0,75 +2845· n- 175
x =----'------'------'------'-----'---
n
o sea,
-
x = 1605 '0,4 + 7915 '0,2 +2225 '0,075 +2535 '0,75 +2845 '0,175 .
Esto es, x = 2070 .
En conclusión, para obtener el promedio desde un histograma, basta con multiplicar

cada punto medio del intervalo por su frecuencia relativa (que es la frecuencia relativa
porcentual dividida por 100) Y luego sumartodos estos valores.
La Mediana
La mediana identifica el valor central de un conjunto de datos. O sea, aproximadamente

la mitad (50%) de los datos será igualo menor que la mediana y la otra mitad será igual
o mayor que ésta.
Observación:
Para identificarel valorcentral, debemosordenarlosdatosen forma creciente. Además, en

el caso de haber dos valores centrales, estos deberán serpromediados. En consecuencia,
la mediana no se puede calcular cuando tenemos datos que provienen de
variables cualitativas.
47
dato
Ejemplo. Pedro tiene 5 notas en la asignatura de matemáticas y Diego 6. Las notas son
las siguientes:
Pedro 6,1 4,2 5,4 5,7 3,1

Diego 4,3 4,8 6,6 4,6 3,4 5,7
Ordenando los datos de menor a mayor se obtiene:
Pedro 3,1 4,2 5,4 5,7 6,1

Diego 3,4 4,3 4,6 4,8 5,7 6,6
Para Pedro, el centro está en el tercer lugar, por lo que el valor central, o sea la mediana,
corresponde al valor 5,4.
Para Diego, haydoscentros, ubicados en los lugares tercero y cuarto. Por lo tanto la mediana
correspondeal promedio entre losvalores 4,6y 4,8. Esto es, la mediana es igual 4,7.
Cabe mencionar que el promedio de notas tanto para Pedro como para Diego es igual
a 4,9.
En general, si el número de datos es impar, se obtendrá un único centro, mientras que

en el caso en que el número de datos sea par, habrá dos centros.
¿Cómo obtener el lugar donde estáín) elílos) centroís}?
Se calcula el valor (no de datos + 1) . 0,5. Si este número es entero (cosa que ocurrirá
cuando el número de datos sea impar), entonces el centro está en el lugar (nO de datos
+ 1) . 0,5.
Si no fuese entero (cosa que ocurrirá cuando n sea par), los centros estarán en loslugares
[(no de datos + 1) . 0,5J Ysu sucesor, donde [(no de datos + 1) . 0,5J representa la parte
entera del número (no de datos + 1) ·0,5.
Ejemplo. La tabla siguiente muestra el número de lápices que tenía en su estuche cada
uno de los 42 estudiantes en un sexto básico.
3 7
4 11
5 9
6 8
7 4
Total 42
48
dato
Encontremos la mediana para estos datos.
Primeramente, como el número de datos es 42, entonces:
(nO de datos + 1)·0,5 = (42 + 1) . 0,5 = 21,S.
Así, los centros están ubicados en los lugares 21 y 22.
Ordenemos de menor a mayor los 42 datos.
Posiciones 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
datos 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4
Posiciones 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36
datos 4 4 4 5 5 5 5 5 5 5 5 5 6 6 6 6 6 6
Posiciones 37 38 39 40 41 42
datos 6 6 7 7 7 7
Por lo tanto, el dato ubicado en el lugar 21 es 4 y el dato ubicado en el lugar 22 es 5.
. Ia me dilana para estos d atas es -

En consecuenCia, 4+5
- = 4,5 .
2
Ejemplo. Los siguientes datos corresponden al puntaje obtenido en la PSU del año
2007 por 100 alumnos de un establecimiento educacional particular pagado de la región
Metropolitana.
[570-595[ 14
[595 - 620[ 12
[620 - 645[ 15
[645 - 665[ 16
[665 - 690[ 19
[690 - 715[ 10
[715-740[ 8
[740 - 765] 6
Total 100
49
dato
Para calcular la mediana de estos datos, usamos el histograma asociado a la tabla de
datos agrupados mostrada anteriormente.
Primeramente calculamos lasfrecuencias relativas porcentuales.
[570 595[ 14 0,14 14%

[595 - 620[ 12 0,12 12%
[620 - 645[ 15 0,15 15%
[645 - 670[ 16 0,16 16%
[670 - 695[ 19 0,19 19%
[695 - 720[ 10 0,10 10%
[720 - 745[ S O,OS S%
[745 - 770J 6 0,06 6%
Total 100 1,00 100%
Ahora graficamos el histograma
570 595 620 645 670 695 720 745 770 puntaje
Para encontrar la mediana debemos buscar un valor entre 570 y 770 de modo que
divida al área del histograma en dos mitades iguales, 50% a cada lado del valor.
El área del primer rectángulo corresponde al 14% del total, que es 100%, Y es menor
que 50%.
El área de los dos primeros rectángulos corresponde a 14% + 12% = 26% Y es menor
que 50%.
50
dato
El área de los tres primeros rectángulos corresponde a 26% + 15% = 41 % Y es menor
que 50%.
El área de los cuatro primeros rectángulos es igual a 41 % + 16% = 57% Yes mayor que
50%.
En conclusión, la mediana será un valor situado entre 645 y 670.
19%
15%
14%
12% 10%
8%
6%
570 595 620 645 la 670 695 720 745 770 puntaje
La mediana, que anotamos Md, cumplirá las siguientes condiciones:
Md = 645 + x, donde x será la base del rectángulo sombreado.
El área del rectángulo sombreado debe ser igual a 9% (el área de los tres primeros
rectángulos es 41 %, por lo que falta 9% de área para completar 50%).
La altura del rectángulo sombreado corresponde a la altura, en el histograma,

del rectángulo con base en el intervalo [645 - 670[. Como el área de ese
rectángulo es 16%, y su base mide 645 - 670 = 25, entonces su altura es
16% = O, 64% (altura = área ).
25 ba~
Así, se obtiene que el área sombreada es igual a x . 0,64% (área = base x altura).
51
dato
Por otra parte, como vimos anteriormente, el área achurada debe ser igual a 9%, por lo
tanto,
x . 0,64% = 9%,
de donde
9
x=--=141
,
064 '
En consecuencia, la mediana es igual a
Md = 645 + 14,1 = 659,1.
Observaciones:
Para un conjunto de datos existe una única mediana (no como en el caso de la
moda, en que pueden haber, dos, tres, etc.).
Al igual que en el caso de la moda, la mediana no usa toda la información presente

en los datos, la mediana se calcula usando sólo el(los) valor(es) central(es), los otros
datos no son usados.
52
dato azar.el
Primeramente estudiaremos una serie de experimentos aleatorios relativamente

simples, de manera de descubrir alguna leyque los rija. Poreste motivo experimentaremos
sólo con dados y monedas.
Experimentos aleatorios equiprobables
Experimento 1: Se lanza una moneda normal (no cargada) y se observa si sale cara o
sello. Hemos realizado una"tirada" cuando lanzamos una vez la moneda. Los resultados
posibles de una tirada son: sello (O), cara (1), Realizamos 15 tiradas de la moneda, y
obtuvimos la secuencia
110100111011001
Entonces, en las 15 tiradas, salieron 6 sellos y 9 caras.
Realizamos, nuevamente, 15 tiradas de la moneda y obtuvimos la secuencia
o O 1 O O 1 O O O O 1 101 O
o sea, en este caso salieron 10 sellos y 5 caras.
Realiza 15 tiradas de una moneda normal, ¿cuántos sellos obtuvistej. ¿cuántas caras?
Compara tus resultados con los de alguna otra persona.
Posiblemente el número de caras (y por consecuencia el de sellos) resulte diferente de

los conseguidos por nosotros anteriormente.
Podríamos decir entonces, que el número de caras que obtenemos al lanzar la moneda
15 veces depende del azar.
¿Existirá algún patrón o tendencia que siga la razón de las caras, o de los sellos,
después de lanzar la moneda 15 veces, 35 veces, 100 veces, o un"gran número"
de veces?
Esta razón (que dependerá del azar) es la que se modela matemáticamente. Por este
motivo realizaremos "muchas" tiradas de la moneda. Como lanzar, por ejemplo, 300
veces la moneda, es un poco lento y engorroso, los lanzamientos se simulan en el
computador.
53
dato
Las tablas siguientes muestran los resultados obtenidos en una simulación.
Columna uno: Indica el número de veces que se tira la moneda.
Columna dos: Indica el número de sellos que se obtuvieron altirar la moneda la cantidad
de veces que indica la columna uno.
Columna tres: Indica el número de caras que se obtuvieron altirar la moneda la cantidad
Columna cuatro: Indica la columna dos dividida por la columna uno (a este cuociente
lo llamaremos frecuencia relativa del sello y la anotaremos por fa).
Columna cinco: Indica la columna tres dividida por la columna uno (a este cuociente
lo llamaremos frecuencia relativa de la cara, y la anotaremos por f ,).
Gráfico 1: Frecuencia relativa de los sellos obtenidos según laTabla a)

dato
La tabla siguiente muestra las frecuencias relativas (tanto para lacara como para el sello)
obtenidas al lanzar una moneda el número de veces que indica la primera columna.
10 5 5 0,5000 0,5000
20 12 8 0,6000 0,4000
30 11 19 0,3667 0,6333
40 18 22 0,4500 0,5500
50 27 23 0,5400 0,4600
60 31 29 05167 04833
70 31 39 0,4429 0,5571
80 36 44 0,4500 0,5500
90 43 47 0,4778 0,5222
100 40 60 0,4000 0,6000
150 67 83 0,4467 0,5533
200 111 89 0,5550 0,4450
250 136 114 0,5440 0,4560
300 147 153 0,4900 0,5100
350 165 185 0,4714 0,5286
400 205 195 0,5125 0,4875
450 237 213 0,5267 0,4733
500 251 249 0,5020 0,4980
550 255 295 0,4636 0,5364
600 325 275 0,5417 0,4583
650 315 335 0,4846 0,5154
700 359 341 0,5129 0,4871
750 367 383 0,4893 0,5107
800 409 391 0,5113 0,4888
850 408 442 0,4800 0,5200
900 446 454 0,4956 0,5044
950 492 458 0,5179 0,4821
1000 498 502 0,4980 0,5020
Tabla b)
55
dato
,
o
-
0,5
100 200 300 400 500 600 700 800 900 1000 N°de tiradas
Gráfico 2: Frecuencia relativa de los sellos según Tabla b)
De lo anterior, podemos observar que mientras mayor es el numero de tiradas

que realizarnos, las frecuencias relativas varían "muy poco" obteniéndose que fo es
"cercano" a 1 que f es "cercano" a ~ .

2 ' 2
Como dijimos anteriormente, los resultados posibles al lanzar una moneda son sello
(O) y cara (1). Estos elementos forman un conjunto que llamaremos espacio muestral
y que se acostumbra escribir con la letra O . Al número de elementos del conjunto lo
anotamos # o.
o = {a ,l} Y # o =2
Como, por ejemplo, A = {O}, es subconjunto de O, entonces A se llamará suceso. En este

caso, el suceso A representa el hecho que en la moneda lanzada resultó sello.
Las Tablas al y b) motivan la siguiente definición de probabilidad para el suceso A= {O}.

Que anotamos P(A),
P(A) = as = # A
, # O
De igual forma, si B es el suceso salió cara al lanzar la moneda, es decir, B = {1}, entonces,
se define:
p(s)=a5
,
=~
# O
Es común referirse al número de elementos de A (o de B) como número de casos

favorables. Al número de elementos de O se le conoce como número de casos totales
o posibles.
56
dato
Experimento 2: Se lanza un dado normal y se observa su cara superior. Al igual que en
el Experimento 1, diremos que hemos realizado una tirada cuando lanzamos una vez el
dado. Los resultados posibles de una tirada son: 1,2,3,4, S, 6. Realizamos 20 tiradas del
dado y obtuvimos los siguientes resultados:
en 5 ocasiones salió uno,

en 1 ocasión salió dos,
en 2 ocasiones salió tres,
en 3 ocasiones salió cuatro,
en 4 ocasiones salió cinco,
en 5 ocasiones salió seis.
Realizamos nuevamente, 20 tiradas del dado, obteniéndose que
en 3 ocasiones salió uno,

en 2 ocasión salió dos,
en 6 ocasiones salió tres,
en 5 ocasiones salió cuatro,
en 4 ocasiones salió cinco,
en Oocasiones salió seis.
Realiza 20 tiradas de un dado normal, ¿en cuántas ocasiones te salió 1,2,3,4,5

ó 6? Compara los resultados con otras personas y con los obtenidos por nosotros
anteriormente. Con seguridad, los resultados que tú obtengas o que obtengan otras
personas serán diferentes los nuestros.
Podríamos decir, nuevamente, que el número de veces que obtenemos 1,2,3,4,5 Y 6,

al lanzar un dado 20 veces, depende del azar.
¿Existirá algún patrón o tendencia que "siga" la proporción de 1,2,3,4,5 ó 6,

después lanzar el dado 20 veces. 100 veces, o un gran número de veces?
Tabla c), muestra los resultados obtenidos en una simulación.
Columna uno: Indica el número de veces que se tira el dado.
Columna dos: Indica el número de veces que salió uno al tirar el dado la cantidad de
veces que indica la columna uno.
Columna tres: Indica el número de veces que salió dos al tirar el dado la cantidad de
veces que indica la columna uno.
Columna cuatro, cinco, seis y siete tienen análoga interpretación a la columna tres.
57
dato
10 2 2 4 O O 2
20 2 3 4 4 4 3
30 4 2 6 S 7 6
40 8 9 8 3 9 3
50 7 11 10 5 11 6
60 12 10 10 9 13 6
70 14 16 9 8 14 9
80 15 19 12 10 14 10
90 16 18 12 14 15 15
100 18 21 15 17 16 13
150 24 28 26 22 26 24
200 30 38 31 32 33 36
250 42 45 40 41 39 43
Tabla c)
La primeracolumna de latabla siguiente, Tabla d), es lacolumna dos de latabla c)dividida

por la columna uno de laTabla c), la llamamosfrecuencia relativa del uno, y se anota fl.
Análogas interpretaciones tienen el resto de las columnas de la tabla d),
0,2000 0,2000 0,4000 0,0000 0,0000 0,2000

0,1000 0,1500 0,2000 0,2000 0,2000 0,1500
0,1333 0,0667 0,2000 0,1667 0,2333 0,2000
0,2000 0,2250 0,2000 0,0750 0,2250 0,0750
0,1400 0,2200 0,2000 0,1000 0,2200 0,1200
0,2000 0,1667 0,1667 0,1500 0,2167 0,1000
0,2000 0,2286 0,1286 0,1143 0,2000 0,1286
0,1875 0,2375 0,1500 0,1250 0,1750 0,1250
0,1778 0,2000 0,1333 0,1556 0,1667 0,1667
0,1800 0,2100 0,1500 0,1700 0,1600 0,1300
0,1600 0,1867 0,1733 0,1467 0,1733 0,1600
0,1500 0,1900 0,1550 0,1600 0,1650 0,1800
0,1680 0,1800 0,1600 0,1640 0,1560 0,1720
Tabla d)
58
dato azar.el
Nuevamente, podemos observar que mientras mayor es el número de tiradas que
0
realizamos, las frecuencias relativas varían "muy poco'; obteniéndose que es cercano
al, para ¡E {1, 2, 3,4, S, 6}.

6
(,
0,5
25 50 75 100 125 150 175 200 225 250 N°de tiradas
Gráfico 3: Frecuencia relativa de los unos obtenidos de acuerdo a laTabla d)
0,5
25 50 75 100 125 150 175 200 225 250 N°detiradas
Gráfico 4: Frecuencia relativa de los seis obtenidos según laTabla d)
En este experimento, el espacio muestral resultante es:
0= {l,2,3A5,6} Y # 0= 6
59
dato azar.el
Si A¡ = {¡}, para ¡ E {1, 2, 3,4, S, 6}, entonces A¡ representa el suceso salió el número ¡al
lanzar el dado.
La tabla anterior motiva la siguiente definición de probabilidad para el suceso A¡, que
anotamos P(A),I
Desde la tabla anterior, también podemos observar que la cantidad de veces que sale
número par, es aproximadamente la mitad de lasveces que se tira el dado, lo que motiva
la siguiente definición de probabilidad para el suceso A={2,4,6}, que representa el hecho
que sale par al lanzar el dado.
P(A) = P({2}) + P({4}) + P({6})
P(A) = ~ + ~ + ~
666
3
6
# O
# O
Más aún, se puede verificar, a partir de la tabla anterior, que si A es un suceso cualquiera,
esto es, cualquier subconjunto de O, entonces la proporción de veces que ocurre A
respecto del total de tiradas del dado, es aproximadamente igual a # A ,lo que
#0
sugiere la definición:
P (A) = I P ({j})
JEA
_ 1 .# A
- 6
#A
-#0
Cabe señalar que el símbolo L se lee sumatoria, y representa la suma de los números
que esta indique. En nuestro caso, Ip({j}) , significa que se deben sumar los
JEA
números p({j}) , cuando j "recorre" todo el conjunto A.
60
dato
Experimento 3: Se lanzan tres monedas normales y se observa si salió cara o sello en
cada una de las monedas. Diremos que hemos realizado una tirada cuando lanzamos
las tres monedas una vez. Los resultados posibles de una tirada son:
Moneda 1 Moneda 2 Moneda 3

e e e
e e S
e S e
S e e
e S S
S e S
S S e
S S S
Realizamos ahora 30 tiradas y obtuvimos los siguientes resultados.

La última columna de latabla indica el número de veces que ocurrió el resultado, dividido
por 30.
Resultado Número de veces que Frecuencia

Moneda 1 Moneda 2 Moneda 3 ocurrió el resultado relativa
e e e 2 0,0667
e e s 3 0,1000
e s e 1 0,0333
S e e 7 0,2333
e s s 6 0,2000
S e s 2 0,0667
S S e 4 0,1333
S S S 5 0,1667
Tabla e)
Por ejemplo, en cinco oportunidades las tres monedas resultaron sello.
Repetir el experimento, pero ahora en lugar de 30 tiradas, hacer SO tiradas, 100 tiradas
y 500 tiradas.
Los resultados que se obtendrán mostrarán que a medida que aumenta el total de
tiradas, las frecuencias relativas comenzarán a variar "muy poco'; obteniéndose que el
número de veces que salen tres sellos, dividido por el total de lanzamientos realizados,
es aproximadamente igual a ~ . Lo mismo ocurre para cualquiera de los otros siete
resultados. 8
61
dato
El espacio muestral para este experimento es:
(2 = {(c, c, c), (c, c, s). (c, s, c), (s, c, c), (c, s, s), (s, c, s), (s, s.c), (s, s, s)} y #O =8
Si A = {(s, s. s)t entonces A representa que en las tres monedas salió sello, y definimos:
P(A) =~ .
8
Similarmente, definimos por 1 a la probabilidad de cualquier suceso con un solo

8
elemento (suceso elemental).
¿Cuál es la probabilidad de que en dos monedas salga cara y en una sello?
Si A={(c,c,s),(c,s,c), (s,c,c)}, es decir, A representa el suceso en dos monedas sale

cara y en una sello (sin importar en cuales monedas), entonces, definimos
1 1 1
+ -+-
888
3
8
#A
#0 .
Los resultados experimentales deberían indicar que el número de veces que en
dos monedas sale cara y en una sello, es aproximadamente igual a l , más aún,
8
experimentalmente se puede verificar que si A es cualquier suceso,esto es, A escualquier
subconjunto de (2 , entonces la proporción de veces que ocurre A, respecto del total
de lanzamientos realizados, es aproximadamente igual a # A , lo que motiva la

#0
definición:
P(A)= IP({a}) = I ~ = 1.# A = #A .

aeA aeA 8 8 #O
62
dato
El Modelo de laplace y sus Propiedades Básicas
Observemos que los experimentos aleatorios estudiados anteriormente tienen las
siguientes características en común.
i) Existe número finito (digamos n) de resultados posibles del experimento. Cada

resultado lo llamamos suceso elemental. La unión de todos los sucesos elementales
es el espacio muestral O.
ii) Todos los sucesos elementales son igualmente probables.
iii) Todo suceso A es la unión de m sucesos elementales, donde m ::;; n.
Estas características motivan la siguiente definición.
Definición. Sea O conjunto no vacío, O = {al' a2, . • .,a n} y A subconjunto de O tal

que #A = m. Se define la probabilidad de A, se anota P(A), como:
P(A) =#A =m = n° de casos favorables

#O n nO de casos posibles
Al par ( O, P), se le conoce como Modelo de Probabilidades de Laplace, también

llamado Modelo de Probabilidades Equiprobable.
Este modelo representa la siguiente situación experimental:
Se tiene un experimento aleatorio, cuyo conjunto de resultados posibles es O, el

cual es finito.
Cada resultado de Oes igualmente probable (equiprobable).
Algunas propiedades que se desprenden de la definición del modelo de Laplace

son las siguientes.
a) Para todo suceso A, O::;; P(A) ::;; 1.
b) P( 0)= 1
c) P(0)=O
d) Si A n S = 0, entonces P(A u S) = P(A) + P(S).

e) Para todo suceso A, P(N) =1- P(A) (complemento respecto de O)
f) Si A e S, entonces P(A) ::;; P(S).
63
dato
Estas afirmaciones se verifican usando las siguientes propiedades de cardinalidad de
un conjunto finito.
#(0) = O, #(A u B) = #A + #B - # (A n B).
Otras propiedades complementarias.
g) Si A Y B son sucesos cualquiera, entonces
P(A n BC) = P(A) - P(A n B)
P(AC n B) = P(B) - P(A n B).
h) Si B1, B2, ••• ,Bn, forman una partición de B, entonces
P(B)=P(B 1) + P(B) + ...+ P(BJ
Esta propiedad generaliza d), para el caso de n sucesos (n :? 3).
i) Si A Y B son sucesos cualquiera, entonces:
P(A u B) = P(A) + P(B) - P(A n B).
Esta propiedad es una generalización de d) al caso en que los sucesos A y B tienen

intersección no necesariamente vacía. Observar que si A n B= 0, entonces P(A n B)= O,
por lo que esta propiedad se reduce a d).
Ejemplo. Se lanzan dos dados normales. Calcular la probabilidad de que ambas caras
superiores de los dados muestren número primo.
Para dar respuesta a la pregunta seguiremos el siguiente esquema de respuestas.
• ¿Cuál es el experimento aleatorio?
En este caso el experimento aleatorio es "Lanzar dos dados normales".
64
dato
.. ¿Cuál es el conjunto de todos los resultados que pueden darse en el
experimento aleatorio? Es decir, ¿Cuál es el espado muestral
En este caso O son todas las parejas que se muestran en la tabla de doble
entrada siguiente:
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
4 (4,1 ) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
- ----
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
. ¿Cuántos elementos tiene ?, es decir, ¿Cuál es el valor de # ?
En este caso # O = 36.
.. ¿Cuáles el suceso en el que estamos interesados en calcular su probabilidad?
En este caso el suceso (lo anotamos con la letra A), que es un subconjunto de O,
serán algunos de los pares ordenados que se encuentran en la tabla anterior.
.. ¿Cuáles pares ordenados?
Aquellos que cumplen la condición que pide el problema. En este caso que
ambos números del par ordenado sean primos.
1 (1,1) (1,6)
2 (2,1 ) (2,6)
3 (3,1 ) (3,6)
4 (4,1) (4,2) (4,3) (4,5) (4,6)
5 (5,1) (5,6)
6 (6,1) (6,2) (6,3) (6,5) (6,6)
.. ¿Cuántos elementos tiene el sucesor, es decir, ¿Cuál es el valor de #A?
En este caso #A = 9.
65
dato
En conclusión, la probabilidad de que ambas caras superiores de los dados muestren
número primo es
P (A) = # A =~ = 1 .
# (2 36 4
Si usáramos una escala porcentual para calcular P(A), entonces P(A) sería 25%.
Ejemplo. Se lanzan 4 monedas de S100, las cuales son normales. ¿Cuál es la probabilidad
de que en al menos 3 de las monedas salga cara?
Para responder la interrogante seguiremos el mismo esquema del ejemplo anterior.
¿Cuál es el experimento aleatorio?
Lanzar 4 monedas normales de S1OO.
¿Cuál es el espacio muestral?
El espacio muestral (2 son todos los cuádruples que se muestran a continuación:
(C,C,C,C) , (C,C,C,S) , (C,C,S,C) , (C,C,S,S)

(C,S,C,C) , (C,S,C,S) , (C,S,S,C) , (C,S,S,S)
(S,C,C,C) , (S,C,C,S) (S,C,S,C) , (S,C,S,S)
(S,S,C,C) , (S,S,C,S) (S,S,S,C) , (S,S,S,S)
Por ejemplo, (c,c,c,s) significa que en la moneda 1,2 Y3 salió cara y en la moneda 4 salió
sello.
El esquema siguiente muestra gráficamente todos los cuádruples.
e s
e
r-. s e
r>. s
/\/\
e s e s
/\/\
e s e s
e
/\/\/\/\
se se se s e
/\/\/\/\ se se se s
66
dato azar.el
¿Cuántos elementos tiene el espacio muestral?
# 0= 16.
¿Cuál es el suceso en el que estamos interesados en calcular su probabilidad?
El suceso, que lo anotamos con la letra A, son todos los cuádruples que cumplen
la condición: en al menos 3 de las monedas sale cara.
, (C,C,S,S)
, (C,S,C,S) (C,S,S,C) , (C,S,S,S)
, (S,C,C,S) (S,C,S,C) , (S,C,S,S)
(S,S,C,C) , (S,S,C,S) (S,S,S,C) , (S,S,S,S)
¿Cuántos elementos tiene el suceso A?
#A= 5.
En consecuencia, la probabilidad de que al lanzar 4 monedas honestas en al menos 3

salga cara es
P(A)= #A =~.
# O 16
Si usamos una escala porcentual para calcular P(A), entonces P(A) sería 31,25%.
Ejemplo. Una caja no transparente contiene fichas (todas de idéntico tamaño y textura)
numeradas del 13 al 37. Se saca al azar una ficha de la caja y se observa su número.
Si usted repitiera esteexperimento 3000 veces, ¿En qué porcentaje, aproximadamente,

de esas repeticiones ocurriría que el número obtenido es divisible por 7?
Para responder esta pregunta calcularemos la probabilidad de que al sacar una ficha de
la caja, el número sea divisible por 7.
Ahora seguimos el esquema anteriormente desarrollado.
Extraer una ficha de la caja.
67
dato
El espacio muestral O son todas las fichas (números) de la caja.
@ G @ G @ @ B @
@ @ ® ® § 0
@ @ ® @
@ @ ® G
0 @
@
#0=25
Notar que 37 - 12 = 25
El suceso, que lo anotaremos con la letra A, son todas las fichas que cumplen la
condición: el número de la ficha es divisible por 7.
@ @ G ® @ B @
@ ® ® @ 0
@ ® @
@ @ ® G
@
@
¿Cuántos elementos tiene el suceso A?
#A=4.
68
dato
o sea, la probabilidad de que al sacar una ficha de la caja, el número de la ficha sea
divisible por 7 es
P(A)=#A =~.
# O 25
Si usamos una escala porcentual para calcular P(A), entonces P(A) sería 16%.
En consecuencia, en aproximadamente 16% de las repeticiones ocurriría que el número

de la ficha sería divisible por 7.
Ejemplo. Una bolsa no transparente contiene 800 fichas, del mismo tamaño y textura.
De las 800fichas, 174, son blancas y el restonegras. ¿Cuál es el número de fichas blancas
que deben agregarse a la bolsa para que, al extraeral azar una ficha, la probabilidad de
que ésta sea negra sea igual a 0,4?
Usemos nuevamente el esquema de resolución visto anteriormente, suponiendo que

son b las fichas blancas que se han agregado.
Extraer una ficha de la bolsa no transparente.
El espacio muestral (2 son las 800 + b fichas de la bolsa.
# (2 = 800 + b.
El suceso, que lo anotaremos con la letra N, son todas las fichas que cumplen la
condición, esto es, que son negras.
¿Cuántos elementos tiene el suceso N?
#N = 626.
Notar que inicialmente habían 800 fichas en la bolsa, de las cuales 174eran blancas, por
lo que habían 626 negras. Después de agregar b fichas a la bolsa, siguen habiendo 626
negras, pues las fichas que se agregaron eran de color blanco.
69
dato azar.el
Por lo nto, la probabilidad de que al sacar una ficha de la bolsa, ésta sea negra es
P(N)= #N = 626 .
#O 800 + n
Pero el problema impone la condición de que P(N)=O,4, por lo que se tiene la

ecuación:
626
---=0,4.
800 + n
o sea,
626 (800 + b)· 0,4,
de donde
626 - 800 ·0,4 =b ·0,4.
Esto es,
626 - 320
----=b·
0,4
En conclusión, se deben agregar b =765 fichas blancas a labolsa, para que laprobabilidad
de sacar una ficha negra sea igual a 0,4.
Observación:
Notar que para calcular la probabilidad de un suceso cualquiera con el modelo de

Laplace, no es necesario mostrar los elementos del espacio muestral ni tampoco los
elementos del suceso, basta con saber cuántos elementos tiene el espacio muestral y
cuantos elementos tiene el suceso. Esta es la razón por la cual son tan útiles las técnicas
de conteo (permutaciones, combinaciones, etc.) en el cálculo de probabilidades con el
modelo de Laplace.
70
dato azar.el
UNIDAD2
La variabilidad en los datos
Eugenio Saavedra G.
GOBIERNO DECHILE
M1NlsnRlO DE rDl1CAClON
dato
En la Unidad I fueron estudiadas las medidas de tendencia central para un conjunto

de datos, lascuales son medidas que se utilizan comúnmente para describir, en alguna
forma, el "centro" de estos.
Sin embargo, la utilización de un sólo valor (que describa el "centro" de los datos)
representa una drástica reducción de estos y suele contener escasa información sobre
su verdadero comportamiento, escondiendo, por ejemplo, la variabilidad de los datos,
es decir, el mayor o menor agrupamiento de estos respecto a su "centro".
Por este motivo es necesario contar con indicadores que resuman de alguna manera la
variabilidad de un conjunto de datos. Estos indicadores son conocidos con el nombre
de medidas de dispersión y serán desarrollados en esta Unidad.
Comenzamos mostrando algunos ejemplos que ilustran la idea de dispersión.
Ejemplo. Cuatro estudiantes de un séptimo básico tienen las siguientes notas en la

asignatura de matemáticas:
... .. ...
•
.
. . . . . . . . .0;0
.
... _---
.. .
................ .
................ .
................
Jorge 5,0 5,0 5,0 5,0 5,0
Claudia _ _ o
4,8 5,0 5,2 4,9 5,1
Antonio 5,5 1,8 5,3 7,0 5,4
Gladys 1,8 2,3 6,9 7,0 7,0
Cada uno de los cuatro estudiantes tiene promedio 5,0 en sus notas, pero ¿hay
homogeneidad entre las notas de cada uno de ellos? Si los representamos gráficamente,
veremos claramente que le respuesta es negativa.
73
dato
!
,
j ;! i .. i
7,0 7,(
i i
1 I i i ¡
~,c
, .....
t ¡
¡ ... . ... ¡ ...... I i····¡!!il
'11··1
>¡,
..... .. ...... . ..
ha ...
~ia ..... ; ,
..... ¡ ; ...
,
¡ 1+ i ti •••.•. !
~,c
~:
~'--
¡
.J.v
..... ....
1,0
.... ..... . ...... ..... i
i
j i ¡ !
[lo i tic i i
¡ i i i i .¡ i i i i i i
Jorge Claudia
¡ i ,
; i ... , .... ..... !
; ....
r,c r,c
>;~
I~~ --
+--~-
;.-+..- ,
...
,
..... .......
.. . ....
¡ .... ! ,
,;1 ..
~iC ... ~iC f

, , ....
I
•.......
'i
; ....
, , ,
....
;·····1[····
>,'
, "
, ... , .... ;
~,( ~,(
,."
! ...
rri :
11
...
...
,
,
..
¡ ! ¡ ! i ',.
ric
i ! ! ¡ ¡ ¡ !
Antonio Gladys
74
dato
Al compararlos4 gráficos, observamos, por ejemplo, que las notasobtenidas por Gladys
están "bastante" más dispersas (respecto de 5,0) que las notas de Claudia. Las notas de
Gladys están "lejos"del 5,0 (su promedio), en cambio las notas de Claudia están "cerca"
de 5,0 (su promedio).
También podemos observar que las notas de Antonio están un poco menos dispersas
que las notasde Gladys, pero más dispersas que las de Claudia. Por último, vemos que
las notas de Jorge no tienen variación.
Ejemplo. Dos balanzas diferentes pesan cien bolsas de azúcarcon peso nominal de 1
kilo cada una (1.000 g). Los registros de sus pesos (frecuencias de sus masas, para ser
más precisos) se observan en las dos tablas siguientes:
Balanza 1
Balanza 2
A continuación. se muestran los gráficos de frecuencias asociados a las mediciones

hechas con la balanza 1 y 2 respectivamente:
Frecuencia
30
25
20 --
15
10
•,,
,,,
•,, ,,,
,
•,,,
5 ,, ,,, ,, ,, ,,
, ,,, ,
,,,
.>
;:;:/ •: ,,, , ,, , ,
•,,,
/; , ,, , , ,,
O :
/1 I
995 996 997 998 999 P 1001 1002 1003 1004 1005
1000
Peso (9)
Gráfico: Distribución de frecuencias de la balanza 1
75
dato azar.el
Frecuencia
30
25
20
15
,
I
I
10 I
I
/:
:;;/1/
O /1
995 996 997 998 999 IJ 1001 1002 1003 1004 1005
1000
Peso (g)
Gráfico: Distribución de frecuencias de la balanza 2
Las dos balanzas tienen promedios prácticamenteiguales, el promedio de losvalores que

registra la balanza 1es999,95 g Yel promedio para losvalores obtenidos con la balanza
2 es 999,99 g, pero ¿hay homogeneidad entre los pesos que arrojan las dos balanzas? Si
los observamos gráficamente, veremos claramente que le respuesta es no.
Al comparar ambos gráficos, notamos que los pesos obtenidos con la balanza 1 están
"bastante"más dispersos (respecto de 999,95 g)que los que entrega la balanza 2. En el primer
caso, varían entre 995 g Y1005 g; Yen el segundo caso varían entre 998 g Y 1002 g.
Como consecuencia de lo anterior, los datos obtenidos con la balanza 1están "más lejos"
del promedio 999,95 g, en comparación con los datos obtenidos con la balanza 2 que
están "más cerca" de su promedio 999,99.
Una medida que indique de alguna manera esa cercanía o lejanía de los datos
respecto de un "centro" será llamada medida de dispersión.
76
dato
Las medidas de dispersión que se utilizan comúnmente son:
• Las medidas basadas en las frecuencias.
• Las medidas basadas en el rango.
• Las medidas basadas en las desviaciones.
Cada una de estas medidas representa la idea de dispersión en diferentesformas.
Las medidas de dispersión basadas en las frecuencias usan la forma en la cual los datos
están dispersos en las diferentes categorías o clases, incluye el radio o tasa de variación
(RV), el índice de diversidad (ID) y el índice de variación cualitativa (IVQ).
Las medidas de dispersión basadas en el rango usan la diferencia (o rango) entre el dato
mayor y el dato menor. Estas incluyen el rango (R) y el rango intercuartil (RIQ).
Las medidas de dispersión basadas en las desviaciones usan ladiferencia entre cada valor
de los datos yel promedio. Estas incluyen la desviación estándar (SO) y la desviación
media (OM).
Al igual que en el caso de las medidasde tendencia central, laelección de una apropiada
medida de dispersión dependerá del tipo de datos con los que estemos trabajando. A
continuación se enuncian criterios a usar para dicha elección.
a) Con datos nominales se debería restringir normalmente a las medidas basadas

en las frecuencias.
b) Con datos ordinales (no numéricos) también se deberían usar las medidas
basadas en las frecuencias.
c) Con datosordinales "numéricos"normal mente se debería n elegirmedidas basadas

en el rango. No obstante, si el número de valores posibles es suficientemente
pequeño para no requerir una distribución de frecuencias agrupadas, podría
usarse una medida basada en las frecuencias.
d) Con datos numéricos usualmente debería trabajarse con medidas basadas en

las desviaciones. Sin embargo,cuando la distribución de losdatoses asimétrica
(es decir, que no es simétrica1), medidas basadas en el rango pueden ser
apropiadas.
1Se diceque una distribución es simétrica cuandodados dosvalores cualesquiera que seubican a igualdistancia del centro
de ladistribución (el promedio o bien la mediana), la cantidad de datos (porcentaje) que se encuentran entreesos valores y el
centrode la distribución son aproximadamente la misma. Esta idea se explicará con más detalleen la Unidad 3 cuando sevean
las medidas de localización,
77
dato azar.el
Cabe recordarque los datos ordinales numéricos son aquellos que pueden tomar forma
numérica pero que no corresponden a mediciones (no tienen unidad de medida) y no
cumplen las reglas algebraicas básicas de los números reales.
Finalmente, el cálculo de una medida de dispersión dependerá de cómo se encuentren

organizados los datos.
En resumen, la elección de una medida de dispersión y su cálculo, dependerá de al

menos tres factores:
Los aspectos de la dispersión que se pretende capturar.
El tipo de datos de que se dispone, o sea, si los datos son nominales, ordinales o
numéricos.
La forma como están organizados los datos, es decir, si los datos se presentan en
una tabla de frecuencia, agrupados! en un gráfico, etc.
En este materialde referencia se mostraránsólo las medidasde dispersiónmás comunes,

estas son: radio o tasa de variación (RV), rango (R), rango intercuartil (RIQ), desviación
estándar (SO).
Medidas de dispersión para datos cualitativos
Datos nominales
Las medidas de dispersión para datos nominales están basadas en las frecuencias y
miden el grado de heterogeneidad del conjunto de datos. En otras palabras, miden el
grado en el cual los valores están divididos entre las categorías. En un extremo, si todos
los datos están en una sola categoría,diremos que la dispersión es homogénea, es decir,
ladispersión es cero. En el otro extremo, si hay igual número de datos en cadacategoría,
diremos que la dispersión es heterogénea, es decir, los datos están dispersos tanto
como es posible. Los ejemplos de las tablas siguientes, que muestran la distribución de
hombres y mujeres en un grupo curso, ilustran ambas situaciones.
Distribución de frecuencias homogénea
Mujer o
Hombre 42
78
dato
Distribución de frecuencia heterogénea
Mujer 21
Hombre 21
Radio (tasa) de variación (RV)
El radio de variación mide la proporción de datos que no están en la clase modal (clase
con mayor frecuencia). El valor de RV escero cuando no hay dispersión, es decir, cuando
todos los datos están en una sola categoría. El valor máximo teórico es 1, pero sólo
se alcanza cuando hay un número infinito de categorías y en cada categoría hay un
solo dato, cosa que nunca se da en la práctica. Para efectos prácticos, el valor máximo
siempre es menor que 1 y depende de la cantidad de datos y del número de categorías,
pero resulta cercano a 1 cuando el número de datos es el mismo para cada categoría.
El hecho que el máximo valor de RV dependa del número de categorías hace que sea
difícil comparar conjuntos de datos con distinto número de categorías.
El cálculo del RV se realiza de la siguiente forma:
- Construir la distribución de frecuencias para el conjunto de datos.
- Encontrar la moda (es decir, la categoría con más alta frecuencia) y la frecuencia
asociada a la moda, que denotaremos fmoda.
- Dividir fmoda por la cantidad total de datos (digamos n).
El valor de RV se define como:
RV = n - f moda = 1_ f moda
n n
Ejemplo. En el caso ilustrado en la tabla anterior de distribución de frecuencias

homogénea, la categoría con más alta frecuencia es"hombre"y su frecuencia es 42. Así,
fmoda es igual a 42, de donde,
RV =1- 42 = O
42
79
dato
Para el caso ilustrado en la tabla de distribución de frecuencias heterogénea¡ tenemos
que fmoda = 21 (cualquiera de las categorías sirve¡ pues en este caso ambas categorías
son modas). En consecuencia¡
RV = 1_ ~ = 1- 1 1
42 2 2
Esto significa que la mitad de los valores (50%) está fuera de la categoría modal.
Ejemplo. La siguiente tabla muestra el número de estudiantes que rindieron la PSU el

año 2008¡ según establecimiento educacional y año de egreso.
Municipal Subvencionado 69.792 29.066

Particular Subvencionado 82.787 33.709
Particular 18.878 6.462
Total 171.457 69.237
Para los estudiantes que rinden la PSU y son de la promoción del año 2008 se tiene que
fmoda = 82.787¡ por lo que
RV = 1- 82.787 = O 517.
171.457 ¡
o sea¡ poco más de la mitad de los datos (51 )%) no pertenecen a la clase modal¡ es
decir¡ el 51 )% de los que rinden la PSU el año 2008 y que egresaron ese año no eran de
establecimientos particulares subvencionados.
Para los estudiantes que rinden la PSU y son de promociones anteriores al año 2008¡
fmoda = 33.709¡ por lo que
RV =1- 33.709 =0513.

69.237 ¡
o sea¡ el 51 J% de los que rinden la PSU el 2008 y que egresaron en promociones

anteriores no eran de establecimientos particulares subvencionados.
El hecho que 0¡517 sea más cercano a 1 que 0¡513¡ sig n ifica que la dispersión sobre las
categorías (tipos de establecimiento educacional) es más grande en el caso de provenir
de la promoción del año que en el caso de promociones anteriores.
80
dato
Datos ordinales
Para los datos ordinales también se puede usar como medida de dispersión el radio de
variación (RII).
Ejemplo. Los siguientes datos muestran los resultados de estudios realizados por dos
compañías de telefonía móvil acerca de la calidad de atención que entregan a sus
clientes.
En el caso de la compañía A, el radio de variación resultante es:
RV =1- 47,5% = 0525.

100% '
En el caso de la compañía B, el radio de variación resultante es:
RV =1- 53,8% = 0462.

100% '
En consecuencia, la dispersión sobre las categorías (gradode satisfacción) es más grande

en la compañía A que en la B.
Otra medida de dispersión usada en datos ordinales, pero "numéricos'; son el rango y
el rango intercuartil.
Rango (R)
El rango es la más simple de las medidas de dispersión para datos ordinales"numéricos"

y es fácilmente calculable, ya que corresponde a la diferencia entre el valor máximo y
el valor mínimo de 105 datos.
81
dato
Ejemplo. Dos test sicológicos son aplicados a 16 postulantes a un puesto de trabajo.
Los resultados se presentan en la tabla siguiente:
1 24 24
2 29 28
3 44 90
4 32 40
5 49 42
6 60 56
7 53 48
8 28 24
9 44 35
10 19 19
11 44 44
12 40 56
13 19 24
14 31 40
15 40 28
16 32 32
En el test 1, el rango resultante es R = 60 - 19 = 41; mientras que en el test 2, el rango

es R = 90 - 19 = 71. Lo anterior indica que la dispersión (medida con el rango) que se
produce con el test 2, al mismo conjunto de postulantes, es considerablemente más
alta que la dispersión que se obtiene con el test 1.
Notar que si se omiten los puntajes del postulante 3, el rango obtenido con el test 1 es
R= 60 -19 = 41, mientras que el rango para el test 2 es R = 56 -19 = 37. En consecuencia,
parecería ahora que las dispersiones asociadas al test 1 y al test 2 son cercanas. Esto
muestra lo sensible que es esta medida de dispersión a los valores extremos (outliers).
Una manera de resolver el problema de la sensibilidad del rango frente a los valores
extremos (outliers) es eliminar algún número predeterminado (o más usualmente, un
porcentaje predeterminado) de datos desde la parte inferior y superior (después de
ordenarlos de menor a mayor). Estoelimina la influencia de valores extremos. La medida
del rango ahora es el valor máximo de los que no fueron eliminados menos el respectivo
valor mínimo.
Si el porcentaje de eliminados tanto en la parte superior como en la parte inferior es

el 25%, entonces el rango de los datos no eliminados es conocido como el rango
intercuartll (IRQ), y se define como hs - P2S, donde P7S corresponde la percentil 75 y
P2S al percentil 25 (percentiles serán estudiados en la siguiente unidad).
82
dato
Medidas de dispersión para datos numéricos
Para los datos numéricos¡ se usan generalmente las medidas de dispersión basadas en
las desviaciones¡ aunque en loscasos en que losdatostengan valores extremos (outliers)
o sean "marcadamente" sesgados¡ la mediana (como medida de tendencia central) yel
rango intercuartil (como medida de dispersión) pueden ser más representativos del
conjunto de los datos. Las diferencias o desviaciones entre cada dato y el promedio son
conocidas como errores de "representación'
Por ejemplo, como vimos en la Unidad 1, si Juan obtuvo en matemáticas¡ durante el

primer semestre de 2008¡ las notas 5,8; 6,2; 5,3; 4,4; 6,6; 4¡1, entonces el promedio
de estas notas es 5,4 y los errores de representación para este conjunto de datos es:
5,8 5,4 = 0,4 4,4-5,4=-1,0

6,2 - 5,4 = 0¡8 6,6 - 5,4 = 1,2
5¡3 - 5,4 = -0,1 4¡ 1 - 5,4 = -1¡3
Una manera posible de medir la dispersión de un conjunto de datos sería sumartodos

los errores de "representación" (que en adelante comenzamos a llamar simplemente
errores). Un primer problema que surge con esta forma de medir la dispersión es que si
dos conjuntos de datos no tienen la misma cardinalidad, el número de errores para cada
conjunto sería distinto¡ por lo que comparar las sumas de loserrores no sería apropiado.
Una solución a este inconveniente sería comparar los promedios de los errores de cada
conjunto de datos. Sin embargo¡ la dificultad fundamental aun permanece¡ ya que en
cualquier conjunto de datos¡ la suma de los errores es cero (ver Unidad I)¡ por lo que
siempre el promedio de los errores será cero.
Una manera de resolver la dificultad anterior¡ consiste en considerar el promedio de los

errores absolutos¡ de esta manera se evita lacancelación de los errores negativos con los
positivos¡ que es lo que conduce a que la suma de los errores sea cero. Este promedio
de los errores absolutos es una medida de la dispersión de los datos¡ conocida como
desviación media. Sin embargo¡ las "dificultades" para su manejo algebraico hacen que
sea poco utilizada.
Otraforma de evitar la cancelación de loserrores negativos con lospositivoses considerar

los errores cuadráticos (significa el error al cuadrado). Así una medida de la dispersión
sería promediar loserrores cuadráticosy luego tomar su raíz cuadrada (para "reqresar" a
los datos originales o¡ en el caso de datos con unidades de medida¡ puede verse como
un "reqreso" a las unidades originales). La medida de dispersión así obtenida¡ se conoce
con el nombre de desviación estándar.
83
dato
Másformalmente, si tenemos un conjunto de n datos numéricos, Xl'····' X n ,entonces
la desviación estándar, que a menudo se abrevia SO y se denota generalmente con
el símbolo s o bien Sx, se define por:
S = {( Xl - -x) 2 + ( x 2 - -x) 2 + ... + (Xn-X)

- 2
x n
Al valor S ~ se le conoce como varianza de los valores x., .... ' X n . En otras palabras,
la varianza se define como:
S~= (X 1-X)2+(X 2-X)2+ ... +(X n-X)2.

n
Se puede observar que la desviación estándar es nula (su valor es igual a O)

cuando cada error cuadrático (x, - X)2 es nulo, es decir, Sx es nula si no hay error al
representar Xi por el promedio. Lo anterior significa que la desviación estándar será
cero cuando todos los Xi sean iguales.
Por otra parte, si El representa el mínimo de los datos y E2 el máximo, entonces, para
cada dato Xi , El ::;; Xi ::;; E2 Ypor ende, El ::;; X::;; E2 . En conclusión, para cada dato Xi,
O ::;; (x, - x)2 ::;; (E2 Ed2.
pero, E2 - El es el rango R, por lo que
( X1 - x) 2 + (x 2 - x) 2 + ... + (x n-x) 2 R2 + R2 + ... + R2

- ' - - - - - - - = - - - - - - - - ' - ' - - - - ::;; - - - - - - -
n n
Es decir, S~ ::;; R2, de donde Sx .s: R. En conclusión,
O ::;; Sx ::;; R.
En este sentido, podemos decir que la desviación estándar es grande si ella esta "cerca"
de r y pequeña si esta "cerca"de cero. el problema es que significa "cerca':
84
dato
La desviación estándar es una "medida" del error que se comete al representar los datos
por su promedio. sin embargo, no podemos decir si esta"medida; por si sola, es grande
o pequeña (salvo en el sentido antes mencionado). en una analogía, si una persona
mide un metro, no podemos decir si ésta es grande (su medida es grande) o pequeña
(su medida es pequeña). el que la "medida" sea grande o pequeña tendrá que ver con
una cierta comparación. en el caso de la persona, si ésta tiene 16 años y se compara
con personas de su misma edad, diríamos que la medida es pequeña. en esta misma
forma, diremos que la desviación estándar es grande o pequeña en un sentido relativo
(ver siguiente sección).
Por lo anterior, los ejemplos sobre desviación estándar que mostramos a continuación,
sólo tienen por objeto ilustrar su forma de cálculo.
Ejemplo. Los siguientes datos representan el tiempo de sobrevida de un conjunto de

pacientes infectados con el VIH y que desarrollaron el SIDA. El tiempo es medido en
semanas, desde el momento en que fue realizado el diagnóstico hasta la fecha de su
deceso.
45 73 84 68
52 80 76 56
66 62 58 104
69 51 70 57
49 95 65 50
58 54 158 60
El tiempo de sobrevida promedio para estos pacientes fue de 69,2 semanas. Veamos
ahora los errores (desviaciones) para cada dato.
85
dato
45 -24,2 585,64
69 -00,2 000,04
73 +03,8 014,44
51 -18,2 331,24
84 +14,8 219,04
70 +00,8 000,64
68 -01,2 001,44
57 -12,2 148,84
52 -17,2 295,84
49 -20,2 408,04
80 +10,8 116,64
95 +25,8 665,64
76 +06,8 046,24
65 -04,2 017,64
56 -13,2 174,24
50 -19,2 368,64
66 -03,2 010,24
58 -11,2 125,44
62 -07,2 051,84
54 -15,2 231,04
58 -11,2 125,44
158 +88,8 7885,44
104 +34,8 1211,04
60 -09,2 084,64
Total -0,8 (*) 13.119,36
(*) La suma de los errores debería ser O, pero debido a las aproximaciones realizadas se
produce una "pequeña" diferencia, haciendo que la suma de los errores sea distinta de
O.
Por lo tanto, y dado que tenemos 24 datos, la desviación estándar es
s, = 13.119,36 =J546,64 =23,38.

24
Notemos que:
x-S x = 69,2 - 23,38 = 45,82,

x+ S x = 69,2 + 23,38 = 92,58
86
dato
y entre estos dos valores hay 20 datos, que representan aproximadamente el 83% del
total.
83 % de los datos
x - Sx = 45,8 x = 69,2 x+Sx = 92,6
x
En general, para cualquier conjunto de datos donde representa el promedio y Sx su
desviación estándar, se cumple que aproximadamente e195% de los datos se encontrará
entre dos desviaciones estándar a la izquierda del promedio y dos desviaciones a la
x-
derecha, esto es, en el intervalo [ x
2S x ' + 2S x J. Del mismo modo, aproximadamente
el 70% de los datos se encontrará entre una desviación estándar a la izquierda del
promedio y una desviación a la derecha, esto es, en el intervalo [ x - Sx ' x + Sx].
Ejemplo. La siguiente tabla muestra los precios de la libra de cobre (en centavos de
dólar) durante el mes de enero de 2000.
1
2
3
4 83,1 -0,5 0,25
5 82,S -1,1 1,21
6 83,1 -0,5 0,25
7 83,1 -0,5 0,25
8
9
10 83 -0,6 0,36
11 82,5 -1,1 1,21
12 82,7 -0,9 0,81
13 84,2 0,6 0,36
14 83,8 0,2 0,04
15
16
17 83,7 0,1 0,01
18 83,7 0,1 0,01
19 85 1,4 1,96
20 86,1 2,5 6,25
87
dato azar.el
21 85,6 2,0 4,00
22
23
24 84,9 1,3 1,69
25 84,1 0,5 0,25
26 83,6 0,0 0,00
27 82,5 -1,1 1,21
28 83,5 -0,1 0,01
29
30
31 82,2 -1,4 1,96
Total 1.672,9 0,9 22,1
Como la suma de los datos es 1.672,9, la media es x = 1.6;0 9 = 83,6 . También, la
suma de los errores cuadráticos es 22 11 1 por lo que la desviación estándar resultante es
sx = )2220 = 1' 05.

11
Utilizaremos Sx para medir cuán concentrados están los precios en torno al valor 83,6.
La figura siguiente muestra el gráficode los precios diarios de la libra de cobre en enero
de 2000.
Gráfico 1
Precios
87
86 ..
"
85
" "
84
- " -Ef- - - - - -
x=83,6
83
" .. " .. "
" " " "
82 "
81
o 5 10 15 20 25 30 35
Días
Si consideramos la"banda" de precios entre los valores x - S x = 82 6 Y x +S x = 84,7,

1
vemos que el 60% de los precios, es decir, 12 de los 20, se encuentra en esta banda.
88
dato
Gráfico 2
Precios
87
86
84,7 85 +- "'-- _
"
_ 84 "
__ J!1 __ -iI.J!_
x= 83,6
83
82,6 " "" "
" "
82 "
81
o 5 10 15 20 25 30 35
Días
Si en cambio, la banda de precios que consideramos está entre los valores

x- 2S x = 81{5 x
Y +25 x = 85{ 7 {vemos que el 95% de los precios, es decir, 19 de los
20, se encuentra en esta banda.
Gráfico 3
Precios
87
86
85,7 + - - - - - - - - - - - - - - - - - - - ". .
85
" "
_
x= 83,6
84 __ " ~ mJi1l _ "
--",
83
" " mi mi
mi mi
82 " " mi
----------------------------------------------------------
81,5
81
O 5 10 15 20 25 30 35
Días
Ejemplo. La tabla siguiente muestra los puntajes obtenidos en una prueba de Historia
por un grupo de 10 estudiantes.
50
60 2
70 4
80 3
Total 10
89
dato
°
Entonces el puntaje promedio de los 1 estudiantes es:
_50_'_1_+_6_0_.2_+_7_0_·_4_+_8_0_.3 = 69 .
10
Veamos ahora los errores (desviaciones) para cada dato.
50 -19 361
60 -9 81
60 -9 81
70 1 1
70 1 1
70 1 1
70 1 1
80 11 121
80 11 121
80 11 121
Suma O 890
La tabla anterior se puede resumir de la forma siguiente:
50 1 361
60 2 162
70 4 4
80 3 363
Suma n=10 890
Ahora bien, como la suma de los errores cuadráticos es 890, entonces la desviación
estándar es:
S =)890 =94.
x 10 '
Es decir,
s = 1·(50- 69)2+2'(60- 69)2+ 4.(70- 69)2+3'(80- 69)2

x 10
90
dato azar.el
En general, si losdatos están organizados en una tabla de frecuencia del tipo
Xl n,
entonces la desviación estándar es igual
S ~)n, .(x, - xl' +n, .(x, - xl' + +n, ·(x, - x)'

x n
Ejemplo (Desviación estándar con datos agrupados).
Las notas de un curso de 40 alumnos se muestran en la siguiente tabla:
[1,0 - 2,O[ O
[2,0 3,O[ 3
[3,0 - 4,O[ 7
[4,0 S,O[ 10
[5,0 6,O[ 15
[6,0 7,OJ 5
Total 40
Si deseamos calcular la desviación estándar, tendríamos que sumar loserrores cuadráticos

de las notas de los40 alumnos. El problema es que no conocemos exactamente cuales
son las notas (sólo sabemos cuantas notas hay en cada intervalo).
91
dato
Para suplir este desconocimiento, usamos el mismo argumento descrito para el cálculo
del promedio con datos agrupados (Unidad 1). Esto es, supondremos que los datos
que pertenecen a un intervalo son todos iguales al punto medio de éste. Por ejemplo,
supondremos que los 10 datos que pertenecen al intervalo [4,0 - 5,0[, son iguales a 4,5
(que es el punto medio entre 4,0 y 5,0). De esta forma obtenemos los siguientes datos
"ficticios" (presentados en una tabla de frecuencia).
1,5 O
2,5 3
3,5 7
4,5 10
5,5 15
6,5 5
Total 40
Por lo tanto x = 1,5'O+2,5'3+3,5'7~i;5'1O+5,5'15+6,5'5 , es decir, x = 4,8. Usando el mismo
procedimiento descrito en el ejemplo anterior, obtenemos que
4,8)2 +3'(2,5- 4,8)2 +7·(3,5- 4,8)2 +10'( 4,5- 4,8)2 +15·(5,5-
Si conociéramos exactamente las 40 notas, la desviación estándar sería, seguramente,

diferente, pero "parecida" a 1,12. La razón de la posible discrepancia esque el cálculo que
hacemos a través de los puntos medios es una aproximación (por el desconocimiento
de los datos exactos).
Observación. En muchos casos la desviación estándar también se define como el

valor
s = lX, -Xl' + (x, - Xl' + ... + (x" - xl'

x n-1
La razón por la cual se divide por n-! en lugar de n tiene que ver con el uso de la
desviación estándar de la muestra como un estimador de la desviación estándar de toda
la población. Al dividir por ri-¡ mejoran las propiedades matemáticas de la desviación
estándar de la muestra como estimador de la desviación de la población, pero eso escapa
a los temas tratados aquí.
92
dato
Es común encontrar en las calculadoras los símbolos e n y e n-l. El primero representa
la desviación de n datos usando como denominador n y el segundo se refiere al cálculo
de la desviación estándar usando como denominador n-t.
También, en diferentes programas computacionales aparece la opción de calcular la

desviación estándar muestral (que equivale a dividir por n-t; y la desviación estándar
poblacional (que equivale a dividir por n). Otro símbolo comúnmente usado es Sn que
equivale a la desviación estándar muestral rr n-l'
En este material de referencia la desviación estándar seguirá usando n en el denominador

cuando el número de datos sea n.
Algunas Aplicaciones de la Desviación Estándar
Estandarización de datos
Al representar un dato por el promedio, se produce un error (dato menos promedio). Al

dividir el error por ladesviación estándar, se está expresando el error del dato en unidades
de desviación estándar. Este valor se conoce como estandarización del dato.
Por ejemplo, si en un conjunto de datos el promedio es 510 Y la desviación estándar

610-510
50, entonces la estandarización del dato 610 es = 2 ,o sea, el dato 610 está
50
2 desviaciones estándar por encima del promedio. Por otra parte, si el dato es 460,
Ia estan darí , es 460 - 51 o = - 1 ,o sea, eI d ato 460 esta'1 d esvracion

anzacion . ., estan
ind ar por
50
debajo del promedio.
En general, si tenemos los datos x 1 , ••• , X n ,los cuales tienen promedio x y desviación
estándar 5 x ,entonces los datos estandarizados (también se usa la palabra tipificados)
asociados a los x, se definen como:
- -
- x - x X
z, = ; Z2 = ; ; zn = --'-'-._--
Sx -. Sx
Notar que
(x - x) +(x 2 - x) + ....... +(x n - x) =_0_ =o,esdecir,elpromedio

n n.5 n·5 x
x
de los datos estandarizados es O.
93
dato azar.el
También,
2 2
(2,-0) +.... +(2
0-0)
~ x)2 +.... +(x 0- x)2
o 2
o·S x
Es decir, la desviación estándar para los datos estandarizados es 1.
Una de las utilidades de la estandarización es que nos permite comparar conjuntos

de datos medidos en escalas diferentes, o cuando se tienen las mismas escalas, pero
promedios diferentes (por ejemplo, dos establecimientos donde las exigencias no son
comparables).
Ejemplo. Dos establecimientos educacionales evalúan con escalas diferentes. El

establecimiento 1 evalúa con notas de 1 a 7, mientras el establecimiento 2 evalúa con
notas de Oa 100. Las notas de matemática de 6 estudiantes de séptimo básico de cada
establecimiento se muestran a continuación.
Juan 4,9 Erika 88

Marisol 6) Lucia 91
Antonio 3,8 Joel 83
Teresa 5,8 Ana 63
Jaime 5,5 Doris 74
Andrea 5,6 Alfonso 57
- ¿Qué nota es "relativamente" mejor, el 5,8 de Teresa o el 83 de Joel?
- El rango donde varían las notas del establecimiento 1 es 6,2-3,8 = 2,4 Yel rango donde
varían las notas del establecimiento 2 es 91-57 = 34, ¿qué rango es "relativamente"
mayor?
- ¿Qué nota del establecimiento 1 es relativamente la misma que en el establecimiento

2?
Primeramente, se tiene que
Promedio SJ 76
Desviación estándar 0,78 12,6
94
dato
A continuación mostramos dos tablas con las notas estandarizadas de ambos
establecimientos.
Establecimiento 1
Juan 4,9 -0,513

Marisol 6,2 1,154
Antonio 3,8 -1,923
Teresa 5,8 0,641
Jaime 5,5 0,256
Andrea 5,6 0,385
Establecimiento 2
Erika 88 0,952
Lucia 91 1,190
Joel 83 0,556
Ana 63 -1,032
Doris 74 -0,159
Alfonso 57 -1,508
Por lo tanto, como Teresa tiene nota estandarizada 0,641 y Joel 0,556, entonces Teresa
tiene mejor nota (relativa) que Joel.
También,
Mínimo de las notas

estandarizadas -1,923 -1,508
Máximo de las notas
estandarizadas 1,154 1,190
Rango 3
1077 2,698
95
dato azar.el
Por lo tanto, el rango (relativo) de las notas del establecimiento 1es mayor que el rango
(relativo) de las notas del establecimiento 2.
Finalmente, la nota 6,2 del establecimiento 1 es relativamente la misma que la nota 91

del establecimiento 2 (ambas notas tienen aproximadamente el mismo valor después
de estandarizarlas).
Dispersión relativa - Coeficiente de Variación
Las medidas de dispersión que hemos revisado son medidasde dispersión absoluta y se
expresan en las mismas unidades con las que se miden losdatos. Si se necesita comparar
dos o más conjuntos de datos, por lo general no es posible la comparación utilizando
la dispersión absoluta. Dos son los casos posibles:
Que las unidades de medida de los datos sean iguales

Que las unidades de medida de los datos sean diferentes
En el caso de unidades de medida iguales, las desviaciones estándar son comparables,

pero no aportan una correcta apreciación sobre los datos que se comparan si estos
tienen promedios diferentes.
En el caso de unidades de medidadiferentes, simplemente no es posible lacomparación

por medio de la dispersión absoluta.
Por estas razones, para efectuar comparaciones entre conjuntos de datos se utiliza
la dispersión relativa, que es adimensional. Esta se define como el cuociente entre la
dispersión absoluta y el promedio.
Si ladispersión absolutaes ladesviación estándar, ladispersión relativa recibeel nombre

de Coeficiente de Variación. Esta dispersión relativa es la más común y se acostumbra
a denotar por Cv. Por lo tanto,
cv =
s!. .
x
Ejemplo. En un establecimiento educacional, el año 2008, el séptimo A tuvo promedio

final 5,3 y desviación estándar 0.61. En cambio, el séptimo B tuvo promedio 4,8 y
desviación estándar0,56.
El coeficiente de variación para el séptimo A es 0,61 = 0, 1151 Y el coeficiente de

5, 3
variación del séptimo B es ~~~ = 0, 1167 . En consecuencia, en el séptimo B hubo
4,8
mayor dispersión (relativa) que en el séptimo A.
96
dato
Ejemplo. En dos pruebas de conocimiento Ay S, lapruebaA secalificó sobre 100 puntos
y la prueba Ssobre 80 puntos.
El promedio de las calificaciones de la prueba A fue de 72 puntos con una desviación

estándar de 9 puntos. En cambio, el promedio de las calificaciones de la prueba S fue
de 52 puntos con una desviación estándarde 6 puntos.
El coeficiente de variación para la prueba A es 9 = 0,125 Yel coeficiente de variación

6 72
para la prueba S es - = 0,115 . En consecuencia, en la prueba A hubo mayor
52
dispersión (relativa) que en la prueba S.
Cambio de Escala
Un curso tiene nota promedio 3,8 en una prueba de matemática, con desviación
estándar 1,4.
Se desea hacerun cambio de escala (lineal) de modo que el nuevo promedio sea 4,5 y la
nueva desviación estándar 1,1. Con este cambio de escala, ¿Qué nota le correspondería
a un 4,27
Si consideramos los datos x., .... ' X n ' y Zl'·· .. ' Zn son las respectivas
estandarizaciones, entonces los datos y 1'····' y n definidos por
tienen promedio a y desviación estándar b (debido a que el promedio de los datos

estandarizados es Oy su desviación estándar 1).
En nuestro ejemplo a = 4,5 Y b =1,1. Además la estandarización de la nota Xi es
En consecuencia, si un alumno obtiene nota 4,2 inicialmente,con este cambio de escala

su nueva nota será
1,1 . 4,2 -3,8 +4,5 =4,8.

1,4
97
dato
En cambio, si un estudiante obtiene inicialmente 6,5, con este cambio de escala su
nueva nota sería
Test para Comparaciones
La creatinina es un elemento importante en el estudio del funcionamiento de losriñones.

La tabla siguiente muestra los resultados de un estudio realizado en un cierto hospital:
para cada persona de una muestra de 22 hombres y 28 mujeres se dan los valores
(cantidad de creatinina por unidad de volumen por hora) obtenidos.
Hombres Mujeres
1 8,04 1 6,62
2 7,71 2 5,71
3 6,54 3 4,29
4 6,96 4 5,08
5 7,62 5 3,71
6 6,96 6 4,79
7 8,25 7 4,21
8 7,46 8 3,42
9 8,17 9 4,92
10 7,83 10 4,92
11 9,79 11 6,29
12 4,25 12 5,08
13 6,88 13 4,50
14 9,12 14 4,08
15 11,37 15 4,17
16 6,42 16 6,96
17 7,29 17 7,21
18 3,83 18 6,71
19 6,96 19 4,63
20 7,87 20 9,92
21 6,62 21 3,29
22 11,0 22 7,58
23 4,71
24 3,13
25 6,46
26 3,33
27 4,58
28 4,25
98
dato
Para analizar la diferencia entre los resultados obtenidos por hombres y mujeres, se
adopta el siguiente test (que tiene su base teórica en la Inferencia Estadística sobreTest
de Hipótesis).
Sea,
- - 2 2
t =
Xh - Xm S2 = nh • S h + nm . Sm
-----'..:.,=~== y
J~h +
l P nh + nm - 2
SP .
n"
Donde:
Xh = promedio de los valores en los hombres,
Xm = promedio de los valores en las mujeres,

nh = número de hombres en la muestra,
nm = número de mujeres en la muestra,
52h = varianza de los valores en los hombres
52m = varianza de los valores en las mujeres.
El test dice que en el caso en que -2<t<2, no hay diferencias "significativas" en los
resultados obtenidos por hombres y mujeres. En caso contrario, habría diferencia en los
resultados que obtienen hombres y mujeres.
Lo cálculos arrojan los siguientes valores:
nh =22; r; =28; xh =7,5882; xm =5,1625; 5\ =2,9423;
52m= 2' 3575', 52 p

= 2' 7238', t = S, 1588,'
En consecuencia, como 5,1588> 2, entonces, según este test, habríadiferencia entre los
resultados obtenidos por los hombres y los resultados obtenidos por las mujeres.
99
dato azar.el
Observación. Otra forma de calcular la varianza
Cabe hacer mención que, manipulando algebraica mente la fórmula de la desviación
estándar, se puede obtener otra forma de calcularla, la cual no requiere de calcular los
errores cuadráticos, esta es:
~
2 2 2
S = Xl + x 2 + ... + xn _ x2
x n
En efecto, como
-2 -2 -2
52 = (Xl - X) + (X2 - X) + ... + (Xn - X)
x I
n
entonces desarrollando los cuadrados de binomio se obtiene que:
52 = (X/ - 2 XX l + X 2) + (X/ - 2 XX 2 + X 2) + ... + (x n2 - 2 XX n + x2)

x n
Ahora, ordenando y sumando los términos semejantes, queda:
Separando los términos de la expresión anterior en fracciones con denominador común

n, se obtiene:
Notar que en el segundo término aparece la expresión del promedio, por lo que:
222
52 = Xl + X2 + ... + Xn _ 2 x2 + X 2
x n
Sumando los términos semejantes, finalmente obtenemos:
2 2 2
5x
=2Xl + X2 + ... + Xn
- X
- 2
.
n
Es decir,
100 _
dato azar.el
UNIDAD 3
Datos azar en la toma de decisiones
Eugenio Saavedra
GOBIERNO DECHILE
MINISTERIO OE [DUCAC10N
datollJazar.cl
Ya llegamos al tercer y último tramo de este camino donde te ha tocado
recorrer algunos aspectosfundamentalesde laestadística y las probabilida des
y la importancia que tienen en nuest ra vida cotidiana. Esperamos el haber
despertado tu interés por seg uir profundizandoel conocimiento aquílogrado
así como también la búsqueda de nuevas formas para hacer accesible este
conocimiento a tus estudiantes. En ese sentido, la ayuda de la tecnología
informática para recolectar, procesar, visualizar y presentar información es
fundamental y las nuevas generaciones de estudiantes están cada vez mejor
prepa radas para haceruso productivo de estas tecnologías.
iAnimo entonces para este último tercio del camino! Si ya has llegado hasta
este punto y sorteado todos los desafíos, entonces significa que ya has
realizado de manera exitosa la mayor parte del esfuerzo. Un poco másy habrás
comp letado la experiencia de esta seg unda versión del curso Datos y Aza r.e1,
la cual esperamos haya sido provechosa y útil para tu desarrollo profesional
como educador.
Equipo académico del cursoDatosy Azar. e/
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ ------: 103
dato"azar.el
Int rodu cción
Lossigu ientes artícu los sacados de laWeb muestran el uso cotidiano del término percent il
(part icularme nte, los deciles, qu intiles y cuartiles). Estas son las llam adas m edi das de
localizació n, las qu e serán tr atadas en det alle en esta unidad.
- ¿Sabía usted que las políticas sociales multiplican por 2,7 veces el ingreso
efectivo del 10% de los hogares más pobres de Chile?
Las po líticas sociales en Chile han estado especialm ente focalizadas en los ho gares
más pobres, y han teni do como pr incipales canales los subsidios monetar ios direc tos,
subsidios en educación yen salud. Esto hace que el 10% de los hogares más pobres,
cuyo ing reso autónomo pro medio es apro ximadamente 75 mil pesos, incremente su
ingreso tota l llegando a poco más de 200 mi l pesos. En cambio, en los hogares del l 0%
más rico no hay increme ntos en su ingreso asociadas a estas políticas.
Un instrume nto muy im po rtante que ha guiado la foca lización del gasto social en Chile
es la encuesta de Caracterización Socioeconómica Nacional (CASEN). En esta encuesta
se indaga sobre los ingresos, educación, salud y viv ienda de aproximadamente 83 mi l
hogares representa tivos a nivel nacional. Es en base a estos datos que el Ministerio de
Planificación (MIDEPLAN) puede o rdenar a los hogares de acuerdo a sus ing resos. Cuando
ordenamos a los hogares de esta manera ag rupados en cor tes de 10%, nos referim os a
estos cor tes como deciles. Usualmente, el primer decil corresponde al más pobre y el
décimo al más rico.
Referencia: Consejo Asesor Presidencial para Trabaj o y Equidad, dirección electrónica

www.trabajoyequ idad .c1
- Sobre la beca de inscripción y los quintiles
Sit ienes dudas acerca de cómo acceder a la beca Junaeb para la inscripción de la PSU y
no sabes en qué quintil de ing resos estás, en este artículo te informamos al respecto.
¿Quiénes postu lan?
De acue rdo a la info rmació n oficial del siti o www.ju naeb.cl. el beneficio considera a los
estudiantes que egresan de 4° medio este año 2007,de establecimientos municipalizados
y particu lares subvencionados, y que presen tan buen rendimiento académico. La beca
está desti nada a estudia nt es cuya sit uación eco nó mica co rrespo nda a los cuatro
primeros quintiles de ingreso per cápíta. Ade más, esta beca t am bién contempla
a los egresados de 4° medio que estén dando la prueba por segunda vez y q ue se
encuentren entre los quintiles 1 y 4 de ingreso. El beneficio implica la cobertura total
del monto asociado a la inscripción.
104 _
dato
¿En qué quintil estoy?
Una de las dudas más frecuentes se asocia a los quintiles. Se sabe que el beneficio
corresponde a los cuatro primeros, pero ¿qué montos se asocian a cada quintil?
Los quintiles se definen de acuerdoa los datosobtenidos en la última Encuesta Casen, en

este caso, laque se realizó el año 2003. Cada quintil contempla el ingreso per cápita que
hayen los hogares del país. Es muy importante que entiendas bien este punto: para saber
en qué quintil estás, debes considerar el ingreso total de tu familia (incluyendo a todos
los miembros de ella que reciban algún sueldo), y dividirlo por el número de integrantes
que la componen. El resultado de esa división es el ingreso per cápita de tu familia.
Referencia: Educar Chile, dirección electrónica www.educarchile.cl/PSU
América Latina: Distribución de loshijosde 20a 24 añosde edad, según promedio de

años de estudiode lospadres y cuartiles de ingreso (percápita) del hogar (porcentajes),
en hogares urbanos de Argentina, Chile, Panamá, Perú y Uruguay, sobre la base de
tabulaciones especiales de las encuestas de hogares de los respectivos países.
24,5 ___41,4 28,8

-ª2.L 46,4 47,2
20,S 9,6 18,8
15,3 2,5 5,2 13,0 45,9
I 100,0 100,0 100,0 100,0 100,0
Referencia: CEPAL, Una década de desarrollo social en América Latina, 1990-1999.
Por otra parte, también es común preguntarse, por ejemplo:
- ¿Existe alguna relación entre el peso de un estudiante y su altura?

- ¿Existe alguna relación entre el promedio de notasde un estudianteal finalizar cuarto
medio y el puntaje obtenido en la PSU?
- ¿Existe alguna relación entre el nivel de ingresos de un trabajador y los años de es-
colaridad?
- ¿Existe alguna relación entre el PIS (producto interno bruto) de un país y laesperanza
de vida de sus habitantes?
- ¿Existe alguna relación entre el tiempo de consumo de un determinado fármaco y
la presión arterial (en personas hipertensas).
En la segunda parte de esta unidad mostraremos, para el caso de una posible relación
o asociación lineal, un método para responder a estas interrogantes, por medio del
coeficiente de correlación y de la recta de regresión.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 105
dato azar.el
Percentiles
Otra medida resumen utilizada en estadística descriptiva es la conocida con el nombre
de percentil.
Los percentiles son medidas de localización (o de posición) que sirven para identificar
o localizar valores particulares en un conjunto de datos, los cuales definen porcentajes
específicos del conjunto de datosen estudio. En otras palabras, los percentiles describen
la posición que tiene un dato en relación con el resto de ellos.
Recordemos que, si disponemos de un conjunto de datos, la mediana es un valor que

particiona al conjunto, después de ordenarlos en forma ascendente, en dos partes, de
modo que aproximadamente el 50% de los datos queda por debajo de la mediana y
aproximadamente el otro 50% queda por arriba de ésta.
Pero, en algunoscasos es necesario localizarvalores asociados aotros porcentajes que no

sean el 50%. Por ejemplo, se podría querer localizar un valor que deje aproximadamente
el 80% sobre él.
Este tipo de valores que identifican un cierto porcentaje del conjunto de datos, en el
sentido anteriormente descrito, son conocidos con el nombre de percentiles.
Observación: Nótese que la mediana es un caso particularde percentil (50%). También,

al igual que para el caso de lamediana, los percentiles no pueden ser calculados cuando
los datos provienen de variables cualitativas.
Además, como los percentiles son una generalización de la mediana, su cálculo es

análogo al de ésta. Sólo deberá reemplazarse el valor 50% (o 0,5) por el porcentaje
(fracción) respectiva.
Por ejemplo, si se quiere calcular el percentil 30% (lo anotaremos P30 ) , el rol del 50% lo
asumirá el 30%, por esto reemplazamos 0,5 por 0,3.
Nuevamentereiteramos que elcálculo de una medida resumen, en este caso el percentil,

dependerá de la forma como se presentan los datos, esto es, si los datos se presentan
en una tabla de frecuencia, agrupados, en un gráfico, etc.
106 _
dato
Ejemplo. Los consumos mensuales de agua potable (medidos en metros cúbicos),
entre el 1 de mayo de 2007 y 30 de junio de 2008, de un cierto hogar, se muestran a
continuación:
59 42 39 30 89
81 23 74 67 32
77 86 26 24
Calculemos el percentil 35% para este conjunto de datos, esto es, calculemos P35 .
Para calcular el percentil 35% se procede de la misma manera que en la mediana,

sólo que ahora en lugar de multiplicar el nO de datos más 1 por 0,5 = 50 ,se debe
35 100
multiplicar por 0,35 =- .
100
Como el número de datos es 14, entonces tenemos que (14 + 1) . OJ5 = 5,25.
El número 5)5 no es entero, por lo que el percentil 35% será el promedio de los
datos ubicados en las posiciones quinta y sexta (la parte entera de 5,25 es 5 y su
sucesor es 6).
Ordenando los datos en forma ascendente obtenemos que:
E
n conclusion,
' . P35 = 32 2+ 39 =35,5.
Notar que bajo 35,S hay 5 datos, que corresponden al 35)% del total de datos
(aproximadamente 35%).
Ejemplo. Las notas finales de un módulo de perfeccionamiento en matemática (125

horas presenciales) el año 2007 - 2008 fueron las siguientes:
4,6 5,2 4,5 5,1 5,8

4,1 5,8 5) 5,0 4,0
4,0 5,1 5,1 4,0 4,2
4,0 6,5 4,5 4,9 4,9
4,0 4,6 4,3 5,8 5,0
4,0 4J SA 5,1 5)
5) 4,2 5,6 5)
Calculemos el percentil 20%.
El número de datos en este caso es 34 y ( 34 + 1) . 0,2 = 7.

_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 107
dato
El 7 es un entero, por lo que el percentil 20% es el dato ubicado en la séptima posición
(después de ordenar los datos en forma ascendente).
4,0 4,2 4,6 5,1 5,7

4,0 4,2 4,9 5,1 5,7
4,0 4,3 4,9 5,2 5,8
4,0 4,3 5,0 5,2 5,8
4,0 4,5 5,0 5,4 5,8
4,0 4,5 5,1 5,6 6,5
4,1 4,6 5,1 5,7
Como el dato ubicado en la séptima posición es e14, 1, entonces P20 = 4,1.
Notar que bajo 4,1 hay6 datos, que corresponden al 17,6%del total de datos. Si incluimos
el dato 4,1, habrían 7 datos, que corresponden al 20,6% del total.
Si en este módulo de perfeccionamiento se eximió de dar examen al 25% con mejores

notas, ¿a partir de que nota los alumnos estaban eximidos?
Encontrar la nota a partir de la cuál los alumnos se eximían corresponde a encontrar

un valor de modo que bajo este quede un 75% de las notas y sobre él un 25%. O sea,
corresponde a encontrar el percentil 75%.
En este caso (34 + 1) . 0,75 = 26,25, por lo que P75 es el promedio de los datos ubicados
en la posiciones 26 y 27. Por lo tanto,
P75 -- 5,4 2+ 5,6 -

- 55
,
Notar que sobre 5,5 hay 8 notas, que corresponden al 23,5% del total y bajo 5,5 hay 26
notas que corresponden al 76,5% del total.
Ejemplo. La tabla siguiente muestra el número de hermanos que tenían los alumnos
de un octavo básico en un Liceo de Buin.
2
° 14
2 10
3 6
4 3
5
Total 36
108 _
dato
Encontremos el percentil 65%.
Como el número de datos es 36, entonces ( 36 + 1 ) . 0,65 = 24,05.
Entonces el percentil65% es el promedio de los datos ubicados en las posiciones 24 y

25, con los datos ordenados en forma ascendente.
El dato ubicado en la posición 24 es el 2 y el ubicado en la posición 25 también es el 2,

entonces
2+2
P65 =--=2.
2
Nótese que, observando la columna frecuencia de la tabla anterior, vemos que
2 + 14 = 16, por lo que las primeras 16 posiciones han sido ocupadas por los datos O
y 1. Además 16 + 10 = 26. Entonces las siguientes 10 posiciones (en las cuales está la
posición 24 y 25) están ocupadas por el dato 2.
Nota: Algunos textos o software emplean formas levemente diferentes a la presentada en

este material para calcular los percentiles. El motivo por el cuál no es única la definición
de percentil se debe al siguiente hecho.
Por ejemplo, calcular el percentil 20% en un conjunto de datos, significa buscar un valor
que deje aproximadamente un 20% de los datos bajo éste valor y aproximadamente un
80% de los datos sobre éste valor. Las diferencias entre los distintos modos de calcular
el percentil radican en la manera como se buscará la aproximación tanto al 20 % como
al 80%
En el caso que se tengan los datos
1,3 2,8 3,1 3,9 4,7 4,7 5,2 5,6 6,1 6,1 6,5
el percentil 20% corresponderá al valor 2,95 (para nosotros), sin embargo la planilla
electrónica Excel arroja el valor 3,1 como percentil 20%.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 109
dato
Ejemplo. Los siguientes datos corresponden a los resultados obtenidos por 40 alumnos
en la realización del test de Couper (metros recorridos en 12 minutos).
[1450-1760[ 16
[1760 2070[ 8
[2070 2380[ 3
[2380 - 2690[ 6
[2690 - 3000J 7
Total 40
Calculemos el percentiI65%.
Para calcular percentiles con datos agrupados, usamos el histograma asociado a la

tabla de frecuencia. Primeramente encontramos las frecuencias relativas y relativas
porcentuales.
[1450 - 1760[ 16 0,400 40%

[1760 - 2070[ 8 0,200 20%
[2070 - 2380[ 3 0,075 7,5%
[2380 - 2690[ 6 0,150 15%
[2690 - 3000J 7 0,175 17,5%
Total 40 1 100%
1450 1760 2070 2380 2690 3000 Metros

recorridos
110 _
dato
Para encontrar el percentil 65%, debemos buscar un valor entre 1450y 3000 de modo
que divida al histograma en dos partes, 65% de área a la izquierda de éste valor y 35%
de área a su derecha.
El área del primer rectángulo corresponde al 40% del total, que es 100%, Y es menor
que 65%.
El área de los dos primeros rectángulos corresponden a 40% + 20% = 60%, Yes menor
que 65%.
El área de los tres primeros rectángulos corresponde a 40% + 20% + 7,5% = 67,5%, Yes
mayor que 65%.
Por lo tanto, el percentil 65% será un valor situado entre 2070 y 2380.
1450 1760 2690 3000 Metros

recorridos
El percentil 65%, esto es P65 ,cumplirá las siguientes condiciones:
P65 = 2070 + x, donde x será la longitud de la base del rectángulo sombreado.
El área del rectángulo sombreado, debe ser igual a 5% (el área de los dos primeros
rectángulos es 60%, por lo que falta 5%de área para completar 65%).
La altura del rectángulo sombreado corresponde a la altura, en el histograma, del

rectángulo con base en el intervalo [2070 - 2380[. Pero, el área de ese rectángulo
es 7,5%, y su base mide 2380 2070 = 310, por lo cual su altura es 7,5% .
310
7,5%
Por lo tanto, eI área sombrea da es iguaI a X: - - (.area = base x a1
tura).
310
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 111
dato
Además, como vimos anteriormente, el área sombreada debe ser igual a 5%, por lo
cual,
x 7,5% = 5%
310
o sea,
x = 5 ·310 = 206,7.
7,5
En conclusión, el percentil 65% es igual a
P65 = 2070 +206,7 = 2276,7.
Diagrama de Caja
El diagrama de caja es otra de las representaciones gráficas de los datos (antes hemos
visto la representación por gráfico de torta, de barras, etc). Este gráfico fue descrito por
el estadístico John Tukey (denominándolo "box and whiskers").
Esta representación se construye a partir de cinco valores numéricos, que son:
El = mínimo de los datos (extremos inferior),

0 1 = primer cuartil, esto es, percentil 25%,
O2 = segundo cuartil, esto es, percentil 50% (o sea, la mediana),
0 3 = tercer cuartil, esto es, percentil 75%,
E2 = máximo de los datos (extremo superior).
El diagrama de caja consiste en graficar estos cinco valores en la siguiente forma:
Primero se ubican en un eje horizontal (también podría ser vertical) los cinco valores.
La mitad central de los datos (un 50%) se representa por medio de un rectángulo de altura
arbitraria y cuya base va desde el primer hasta el tercer cuartil. La mediana, esto es, el
segundo cuartil, se identifica mediante una barra vertical. Esta barra divide al rectángulo
en dos nuevos rectángulos (no necesariamente de igual área).
112 _
dato
El Ql
Finalmente, una línea horizontal (a laaltura de la mitad del rectángulo) se extiende desde
el primer cuartil Ql hasta el valor mínimo El y otra se extiende desde el tercer cuartil
Q3 hasta el valor máximo E2
El Ql
Algunas utilidades del diagrama de caja
- El diagrama proporciona la posición relativa de los tres cuartiles y los extremos.
- El diagrama entrega información acerca de la simetría o asimetría de la distribución

de los datos.
La "caja" del diagrama muestra gráficamente el intervalo donde varía el SO% de los
datos centrales
- La barra que identifica a la mediana, divide a la"caja" en dos rectángulos, cada uno de
los cuales indica la variabilidad de un 2S% de los datos.
- El diagrama informa sobre la variablidad de los datos al observar ambos extremos.
- El diagrama permite comparardosconjuntosde datos (como se muestra en un próximo

ejemplo).
- En algunos casos (para conjuntos "grandes" de datos o cuando hay datos"atípicos") se

puede usar en la construcción del diagrama, el percentil S% en lugar de El y el percentil
9S% en lugar de E2 . Esto permite que el diagrama de caja refleje con mayor precisión
la distribución de los datos.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 113
dato
Ejemplo. Los siguientes datos corresponden a puntajes de matemática de
establecimientos educacionales en el SIMCE 2007 (octavos básicos).
258 233 275 282 299

260 291 235 237 249
288 228 240 233 298
281 286 257 228 234
250 252 236 253 236
256 222 240 245 253
Primeramente, como una forma de ordenar los datos, los escribimos en un diagrama de
tallo y hoja. Usaremos como tallo la centena y decena y como hojas las unidades.
23 3 7 3 4 6
24 O 9
25 8 2 7 3 3
26 O
27 5
28 8 1 6 2
29 1 9 8
Ahora ordenamos los datos de menor a mayor. Para esto, basta ordenar las hojas (de
menor a mayor) frente a cada tallo.
Tallo
22 2 8 8
23 3 3 4 5 6 6 7
24 O O 5 9
25 O 2 3 3 6 7 8
26 O
27 5
28 1 2 6 8
29 1 8 9
De esta forma, podemos ver inmediatamente que El = 222 Y E2 = 299.
114 _
dato
Cálculo de 0 1 (percentil 25%).
El número de datos es 30 y (30+1) ·0,25 = 7,75. Por lo tanto, 0 1 es el promedio de los

datos ubicados en las posiciones 7 y 8. O sea,
Ql = 235 + 236
2
esto es,
Ql = 235,5.
Cálculo de O2 (percentil 50%).
En este caso (30 + 1) ·0,5 = 15,5, por lo que O 2 es el promedio de los datos ubicados en
las posiciones 15 y 16. O sea,
Q2 = 250 + 252
2
esto es,
Q2 = 251 .
Cálculo de 0 3 (percentil 75%).
Como (30+ 1) . 0,75 = 23,25, entonces 0 3 es el promedio de los datos ubicados en las
posiciones 23 y 24. O sea,
Q3 = 275 + 281
2
esto es,
Q3 = 278.
222 , 235,5 251 278 299 Puntajes
Cabe señalar que el promedio de los 30 puntajes es x = 254,4 Y la desviación

estándar Sx = 22,4 .
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 115
dato
Ejemplo. Los siguientes datos son puntajes de matemática en la prueba SIMCE
2007 (octavos básicos). El primer diagrama de tallo y hojas corresponde a
establecimientos del grupo socioeconómico B y el segundo a establecimientos del
grupo socioeconómico D.
En ambos diagramas el tallo corresponde a las centenas y decenas y las hojas a las
unidades.
Grupo B 23 8 3 2 4 6 7 3 8 5 o
24 7 O 1
25 1 2
Tallo
25 9
26 7 2 6 7 9 8 O
Grupo D
27 3 6 8
28 1 3
29 1 4 7 4 8 4 3
Ahora construimos los diagramas de caja para ambos grupos de datos.
Primeramente, ordenamos los datos en forma ascendente.
Tallo
22 2 3 8 9
Grupo B 23 O 1 2 3 3 4 5 6 7 8 8
24 O 1 7
25 1 2
116 _
dato
Grupo D
27 3 6 8
28 1 3
29 1 3 4 4 4 7 8
La tabla siguiente resume los cinco valores obtenidos para el grupo B y D,

respectivamente.
El 01 O2 03 E2 I
Grupo B
Grupo D
222
259
L ...
230,5
267
234,5
277
239
293,5 j8
Los diagramas de cajas para ambos grupos de datos se muestran en el gráfico siguiente,
lo que permite realizar una comparación de éstos.
Diagrama de Caja
Grupo D
Diagrama de Caja
Grupo B
I I I I I I I I I I
222 230,5 234,5 239 252 259 267 277 293,5 298
Promedio Grupo B = 235/5 Promedio Grupo D = 278/5

Desviación Estándar Grupo B = 7/8 Desviación Estándar Grupo D = 13/2
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 117
dato
Observación: En un diagrama de caja, la distancia entre El y O2 , que es la diferencia
O2 El, se denomina dispersión inferior. También, la distancia entre O2 y E2 , esto es,
E2 - O2 se denomina dispersión superior. Además, la distancia entre 0 1 y 0 3 , esto es,
0 3 0 1 se conoce con el nombre de rango intercuartil, y la distancia entre El y E2 , o
sea E2 - El, se llama rango.
La comparación de algunas de estas distancias entrega información sobre la dispersión

de los datos y también sobre la forma de su distribución. Por ejemplo, si la distribución
de los datos fuese "relativamente" simétrica, entonces la dispersión inferior debería ser
aproximadamente igual a la dispersión superior. También O2 - 0 1 debería ser similar a
0 3 - O2 Y 0 1 - El similar a E2 - 0 3 ,
118 _
dato
Los siguientes datos corresponden a los pesos de 22 alumnas de un séptimo básico.
Paula 48,5
Daniela 50,9
Javiera 54,3
Elisa 54,0
María José 61,6
Nicole 43,4
Constanza 42,3
Margarita 42,7
María Paz 63,2
Valentina 39,8
Paula 56,1
Elvira 50,0
Jme~ 5~5
Constanza 56,0
María Alejandra 35,6
Daniela 52,3
Michelle 42,3
Camila 67,2
Francisca 50,5
Tiare 46,4
Mildred 41,8
Si X fuese la variable peso de las alumnas, medido en kilogramos, e Y la variable peso

medido en gramos, es muy natural que se nos ocurra que la relación que hay entre
ambas es
y = 1000· X.
Sin embargo, si la variable Y fuese la altura de las alumnas medida en centímetros,
entonces no es tan evidente cuál sería la relación que hay entre X e Y. La razón es que no
es cierto que conocido el peso en kilógramos x, de una alumna, podamos determinar
de modo exacto su altura Yi . Por ejemplo, Constanza y Michelle pesan 42,3kg, pero ellas
podrían medir 152cm y 157cm, respectivamente. Sin embargo, alguna relación entre el
peso y la altura debe existir, ya que parece mucho más probable que una alumna que
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 119
dato
mide 148cm pese menos que otra alumna que mide 163cm.lncluso, podríamos pensar
que una relación más o menos aproximada entre ambas variables puede ser
y = X + 110 ± error.
¿Será posible determinar de un modo preciso una relación lineal entre el peso en
kilogramos y la altura en centímetros de las alumnas del séptimo básico?
o sea, ¿podemos determinar la altura en centímetros de una alumna del séptimo básico
si conocemos solamente su peso en kilogramos?
Ejemplo. Los siguientes datos corresponden a puntajes de lenguaje y matemática

de 27 establecimientos educacionales rurales del estrato A, en el SIMCE 2007 (octavos
básicos).
210 234
242 239
223 240
201 273
196 204
243 241
201 221
231 258
212 238
191 211
224 222
253 270
240 254
237 256
195 213
249 247
240 234
229 190
249 263
233 258
238 241
212 220
210 228
251 240
254 247
271 238
246 233
120 ~ _
dato
¿Será posibledeterminar si existe alguna relación o asociación entreel puntajede lenguaje
y el puntaje de matemática en el SIMCE 2007 (octavos básicos), en establecimientos
educacionales rurales del estrato A?
Es decir, ¿podemos estimar el puntaje de matemática de un establecimiento si sólo

conocemossu puntaje en lenguaje? Por ejemplo, si un establecimiento educacional rural
del estrato A tiene puntaje 247 en lenguaje, ¿cuál sería el puntaje en matemática?
Ejemplo. Un alumno esta examinando los tamaños de las manzanas que vienen en
mallas de 2 kg. Pesa las manzanas y tabula los siguientes resultados.
20 16
72 105
¿Será posible determinar si existe alguna relación entre el número de manzanas en la

malla y la mediana de los pesos de las manzanas de la malla?
Es decir, ¿podríamos estimar la mediana de los pesos de una malla de 2 kg si sólo

conocemos el número de manzanas en la malla? Por ejemplo, si el alumno toma una
malla y al contar las manzanas encuentra que hay 17, sin pesar las 17manzanas, ¿podría
determinar la mediana de los pesos?
También, ¿podríamos estimar el número de manzanas en una malla de 2 kg si sólo

conocemos la mediana de los pesos de éstas? Porejemplo, sial alumno le indican que la
medianade los pesos de las manzanas de una mallafue 160gramos, ¿podría determinar,
sin contarlas, el número de manzanas en la malla?
En general, si se observan dos características (nos abocamos sólo a las características

numéricas) en una población,es decir, si seobservandosvariables cuantitativas, digamos
X e y, ¿será posible determinar si existe alguna relación o asociación entre las variables
X e Y?
Como vimos anteriormente, si X fuese la variable peso de las alumnas, medido en

kilogramos, e Y la variable peso medido en gramos, es inmediata la relación que existe
entre ambas, quedando determinadosde un modo preciso losvalores de Y por medio
de losvalores de X (caso determinista).
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 121
dato Cazar.cl
Sin embargo, en el mismo ejemplo de las alumnas del séptimo básico, pero ahora
considerando como Yla altura de las alumnas medida en centímetros,o en el ejemp lo de
los puntajes del SIMCE, o también en el ejemplo de las mallas con manzanas, la relación
o asociación (si la hubiere) no es tan inmediata de determinar. Aún, en estos casos, si se
pudiesedeterminar una relación, los valores que se determinarían para Y (a partir de X)
sólo serían una estimación (dependencia aleatoria).
Un procedimiento bastante útil para tratar de dete rminar una posible relación o
asociación entre dos variables cuantitativas, es dibujar, en un sistema cartesiano, los
pares de valores que se obtienen al observar las variables X e Y. Este gráfico se conoce
como diagrama de dispersión o "Nube de punto s':
A continuación presentamos el diagrama de dispersión para cada uno de los ejemplos

anteriores.
...:
O'>
e 80000
Q)
o
V1
Q)
Q..
70000
•
•+
60000
•
50000
40000
30000
.'
20000
10000
O
O 10 20 30 40 50 60 70 80
Pesoen kg.
122 _
dato
Ptje.
Matemática
Ptje.
lenguaje
N°de manzanas
en malla
Mediana de
los pesos
Se aprecia que en el caso de los puntajes SIMCE no sería posible encontrar una relación
o asociación entre los puntajesde lenguaje y los puntajes de matemática. Sin embargo
se observa una variación conjunta de los puntajes, puesto que al crecer el puntaje de
lenguaje, crece el puntaje de matemática (relación directa).
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 123
dato
En el caso de lasmanzanas, pareciera factible que la relación entre el número de manzanas
y la mediana de los pesos sea por medio de una recta (dependencia lineal).
La relación sería inversa, pues si aumenta el número de manzanas en la malla de 2 kg,

decrece la mediana de los pesos de éstas.
En adelante, sólo buscaremos determinar si existe una relación o asociación lineal entre
dos variables cuantitativas X e Y.
Si llegamos a determinar que no hay relación lineal entre X e y, eso no significará que
no exista otro tipo de relación o asociación entre las variables.
Para determinar si existe una relación lineal entre X e y, calculamos un número real (el
coeficiente de correlación para los datos observados de X e Y).
En el caso que hallamos determinado que hay una relación lineal entre X e Y,
encontraremos la ecuación de la recta que las relaciona (recta de regresión).
Coeficiente de correlación lineal de Pearson
Estecoeficiente cuantifica cuán lineal es la relación entre dos variables, y se acostumbra

a llamarlo coeficiente de correlación o simplemente correlación. Mostraremos la forma
de calcularlo a través del ejemplo de las manzanas.
Usaremos las siguientes notaciones:
Xl :::: 20, X2 :::: 16, x3 :::: 18, x4 :::: 14, Xs :::: 14, x6 :::: 15, x 7 :::: 13, Xs :::: 10,
Yl :::: 72, Y2 :::: lOS, Y3 :::: 110, Y4 :::: 125, Ys :::: 136, Y6 :::: 142, Y7 :::: 174, Ys :::: 192,
- -
X:::: 15 (promedio de Xl ,,,., X s ), y = 132 (promedio de Yl ,.", Ys ),
sx = 2,9 (desviación estándar de Xl'"'' Xs ), sy :::: 36 (desviación estándar de
Yl'"'' Ys ).
A continuación listamos los errores que se cometen al representar los datos

Xl"'" Xs por X e Yl'"'' Ys por 51 . También se listan los errores cuadráticos y el
producto de los errores.
124 _
dato
20 72 5 25 -60 3.600 -300

16 105 1 1 -27 729 -27
18 110 3 9 -22 484 -66
14 125 -1 1 -7 49 7
14 136 -1 1 4 16 -4
15 142 o o 10 100 o
13 174 -2 4 42 1.764 -84
10 192 -5 25 60 3.600 -300
El coeficiente de correlación, que anotaremos con la letra r, se define como el número

real:
suma del producto de los errores
-774
o sea, para el caso de las manzanas, tenemos que r = -;==== , esto es,
r =- 0/9368.
El coeficiente de correlación r, también podemos calcularlo de la siguiente forma.
Estandarizamos las Xi , es decir, a cada X¡ le restamos el promedio y luego la dividimos

por la desviación estándar. Análogamente, para los y¡ . La tabla siguiente muestra las
estandarizaciones de los datos y el producto de estos datos estandarizados.
-1,6667 -2,8736
-0,7500 -0,2586
-0,6111 -0,6322
-0,1944 0,0670
0,1111 0,0383
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 125
dato
El coeficiente de correlación, entonces, corresponde al promedio del producto de los
datos estandarizados. O sea, r =- 7,4138 . En consecuencia, r =- 0,9267. La

8
diferencia con elvalor r encontrado antes, se debe sóloaconsecuencia de laaproximación
decimal de los números involucrados.
Teóricamente, la suma en la columna 4 (al igual que en la columna 2) debe ser O(suma
de los errores es igual a cero). El hecho que resulte diferente de cero nuevamente es por
la aproximación decimal de las cantidades que se están sumando.
En general, para los datos Xl /·../ x, e Y1/"'/ Yn , el coeficiente de correlación r se define

como el número real:
r = (~- X}~1 - jI)+~2 - X)'~2 - y)+ ... +(\ - x)·k - ji)

~ [~l - X)2 +... + k - x)l [~l _jI)\ ... + ~n-Y )2] ,
o lo que es equivalente,
- - -
.Y_
2 --Y - X
+ ... + x .Yn_- -
x;-- - Y
r = Sx
----"-------'----------'-- Sx
n
La razón de la equivalencia anterior se debe a que, para cada ¡E {1,2 'oo., n] ,
(Xi X}(Yi - Y)
[(Xl -xf +"'+(Xn-xYl[(Yl -yf +... +(Yn -yY]
1 (Xi - x)
n [(Xl- xY+... +(x -xf ]
n
n n
= lXi-X.
n s, Sy
Además, se puede verificar que el coeficiente r, varía entre los números -1 y 1, es

decir,-l s r s l.
126 _
dato
Criterios o "guías" para interpretar r
--g-'-~-~idd .
H
Positiva fuert Gráfico A
0,5 < r s 0,8 Positiva media _~~~~-1_~~~~~~~~~~!19~~~~_~
Gráfico B
-O~r:s;0,5 I Positiva débil Gráfico e
r= o Nula ! Gráfico D
-0,5 < r < O Negativa débil Gráfico E
-0,8 < r :s; -0,5 Negativa media Gráfico F
-1 < r s -0,8 Negativa fuerte Gráfico G
y y y
• •
•• ••
•
•.+ ••
•
e- • •
• ..
+
x x x
Gráfico A Gráfico B Gráfico C
y y
x x x
Gráfico D Gráfico E Gráfico F
x
Gráfico G
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 127
dato
Observación
a) Al estandarizar un dato, lo que hacemos es centrarlo a cero (al restar el promedio)
y luego dejarlo libre de unidades (al dividir por la desviación estándar).
b) El numerador de la última expresión para r, puede verse como el producto interno

entre los vectores u y v, con:
En este sentido, el coeficiente r mide el grado de asociación entre los datos

Xl"'" Xn e Yl"'" Yn ' pues el producto interno entre u y v da cuenta del ángulo
que estos vectores están formando.
c) El hecho que r sea nulo, no significa que no exista relación (funcional) entre los
datos Xi con y¡ , sólo indica que no existe relación lineal (podría, por ejemplo, haber
relación cuadrática o de otro tipo).
d) Es conveniente, como primera medida, graficar el diagrama de dispersión, pues este

nos permite observar si existe alguna relación del tipo lineal entre los datos. Si la nube
de puntos en el diagrama de dispersión no representa, al menos aproximadamente,
una línea recta, entonces calcular r no tendría mucho sentido.
e) En todo caso, hay que ser bastante cauteloso al interpretar el coeficiente de

correlación como medida de la intensidad de la relación lineal entre grupos de
datos. Por ejemplo, los siguientes datos presentan la tasa de pulsaciones en reposo
(en pulsaciones por minuto) y los años de escolaridad del Oindividuos. Enel gráfico
siguiente se presenta un diagrama de dispersión de estos datos. El coeficiente de
correlación de estos datos es r = -0,7638. Esta correlación negativa indica que, en
este conjunto de datos, una tasa de pulsaciones alta está fuertemente asociada con
pocos años de escolaridad; y una tasa de pulsaciones baja, con muchos años de
escolaridad.
128 _
dato
90
85
•
V1
(J) 80
e
o
'o
~
fU
::J
75 •
o-
(J)
-o
• •
ro
V1 70 -- •
~
•
65 ---
•
60 1---
55
10 11 12 13 14 15 16 17 18 19 20
Años de escolaridad
Los resultados de este ejemplo indican una correlación negativa media entre los años
de escolaridad de un individuo y su tasa de pulsaciones en reposo. Sin embargo¡ esto
no implica que años de escolaridad adicionales reduzcan directamente la tasa de
pulsaciones de una persona. Esto es¡ aunque más años de escolaridad tienden a estar
asociados con menor tasa de pulsaciones en descanso¡ ello no significa que más años de
escolaridad sean una causa directa de menores pulsaciones. A menudo¡ la explicación
de tales asociaciones está en un factor inesperado¡ relacionado con ambas variables en
consideración. En este ejemplo, puede ser que la persona que ha estado más tiempo
en la escuela esté mejor informada de hallazgos recientes en el área de la salud¡ y así
este más consciente de la importancia del ejercicio y de la buena nutrición; o quizá
no sean los conocimientos los que hagan la diferencial sino más bien el hecho de que
las personas que han tenido mas educación obtienen trabajos que les permiten tener
más tiempo para el ejercicio y más dinero para gastar en una buena nutrición. La fuerte
correlación negativa entre años de escolaridad y pulsaciones resulta probablemente de
una combinación de estos y otros factores.
En consecuencia, este ejemplo nos muestra que correlación no implica

causalidad, es decir, correlación mide asociación, no causalidad.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 129
dato
Recta de regresión
Si hay 17manzanas en la malla de 2 kg, sin pesar las manzanas, ¿cómo estimarla mediana
de los pesos?
Como r = -0,9368, entonces es "razonable" asumirque hay una relación lineal(modelo)

entre el número de manzanas en la malla de 2 kg Yla mediana de los pesos de éstas.
Esto es,
Mediana de los pesos

de las manzanas en
a . Número de manzanas b
la malla de 2 kg
en la malla de 2 kg + ,
donde a y b son constantes.
Así, si en la malla de 2 kg hay 17 manzanas, entonces:

de las 17 manzanas a'17+b,
en la malla de 2 kg
o si en la malla de 2 kg hay 12 manzanas, entonces

de las 12 manzanas a'12+b,
en la malla de 2 kg
También, si la mediana de los pesos de las manzanas de una mallade 2 kg es 160 gramos,
entonces
160 a . Número de manzanas +b

en la malla de 2 kg
En consecuencia, para estimar la mediana de los pesos de las manzanas en la malla de

2 kg, conociendo el número de manzanas o bien, para estimar el número de manzanas
en la malla conociendo la mediana de sus pesos, basta conocer las constantes a y b.
130 _
dato
Porejemplo, si a = -7 Y b = 300, entonces
Mediana de los pesos de las 17 = (-7) . 17 + 300,

manzanas en la malla de 2 kg
Mediana de los pesos de las 12 = (-7) . 12 + 300.

o sea, sia= -7y b = 300, el modelo estima que la mediana de los pesos de las 17 manzanas
que hay en la malla de 2 kg es 181 gramos. En el caso en que la malla de 2 kg tenga 12
manzanas, el modelo estima que la mediana de los pesos de esas 12 manzanas sería
de 216 gramos.
Pero, el estudiante peso 8 mallas de 2 kg Yobtuvo, por ejemplo, que una malla con 20
manzanas tenía 72 gramos, como mediana de los pesos de esas 20 manzanas.
¿Qué nos dice el modelo cuando la malla de 2 kg tiene 20 manzanas? O sea, ¿en
cuánto estima el modelo la mediana de los pesos de esas 20 manzanas que contenía
la malla?
Mediana de los pesos de las 20 = (-7) 20 + 300.

Entonces el modelo estima que en la malla de 2 kg que tenía 20 manzanas la mediana

de sus pesos sería 160gramos.
Claramente hay un error en la estimación, ya que el alumno al examinar la malla de 2 kg

con las 20 manzanas, obtuvo 72gramos como medianade lospesos de las 20 manzanas.
El error de estimación es igual a:
Lo obtenido por el alumno menos lo estimado por el modelo = 72 gr - 160 gr.
O sea, el error de estimación para esta malla fue de - 88 gr.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 131
dato
A continuación listamos los errores de estimación para los 8 mallas que pesó el
alumno.
20 72 160 -88 7.744

16 105 188 -83 6.889
18 110 174 -64 4.096
14 125 202 -77 5.929
14 136 202 -66 4.356
15 142 195 -53 2.809
13 174 209 -35 1.225
10 192 230
Total
El gráfico siguiente representa la nube de puntos asociado a las mallas examinadas por
el estudiante y el modelo (recta) para el caso en que a = -7 Yb = 300.
Mediana de
lospesos
200
y=-7x+300
150 - - - - - - - - - - - - - - -
•
•
100 - - - - - -
SO + - - - - - - - - - , - - - - - - - - - - - , - - - - - - - , - - - - - - - - - 1
5 10 15 20 25
N°de manzanas
Del gráfico observamos que el modelo (recta de ecuación y = -7x + 300) se "ajusta" muy
"poco"a los datos reales (valores obtenidos por el estudiante).
Por ello cambiaremos el modelo, es decir, cambiaremos los valores de ay b.Consideremos

ahora a = -9 Yb = 270.
132 _
dato
A continuación listamos loserrores de estimación para las 8 mallas que pesóel estudiante
y mostramos el gráfico con la nube de puntos y el modelo (recta).
20 72 90 18 324
16 105 126 -21 441
18 110 108 2 4
14 125 144 -19 361
14 136 144 -8 64
15 142 135 7 49
13 174 153 21 441
10 192 180 12 144
Total 1.828
Mediana de
los pesos
220 . , - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ,
200
lS0
160
140
120
100 - - -
.. -
y=-9x+270
SO
60 - - --
40
5 10 15 20 25
N° de manzanas
Claramente este nuevo modelo,estoes, considerandoa = -9Yb =270 se "ajusta" bastante

mejor a los datos reales.
¿Existirá una forma de determinar losvalores de a y b de modo de conseguir el "mejor"

modelo, esto es, de conseguir la recta que "mejor" se ajuste a los datos?
¿Cómo medir el significado de "mejor"?
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 133
dato
Para medir el significado de "mejor" se usa como medida la suma de los errores de
estimación cuadráticos.
Así, para el modelo con a =-1OYb = 300, la suma de los errores de estimación cuadráticos
es 34.492.
En cambio, para el modelo con a = -9 Y b = 270, la suma de los errores de estimación

cuadráticos es 1.828.
Por este último motivo es que el segundo modelo es bastante mejor que el primero.
Finalmente, los valores de a y b que producen la menor suma de errores cuadráticos

son:
desviación estándar de los y¡

a = coeficiente de correlación
desviación estándar de los x,
b = promedio de los y¡ - a· promedio de los Xi
Esto es,
36
a =- O, 9368·-
2,9
=- 11 " 63
b = 132 - (- 11,63) ·15 =306,45.
La verificación de este resultado escapa a los objetivos de éste curso.
Considerando ahora estos últimos valores de a y b, listamos los errores de estimación

para las 8 mallas que pesó el estudiante y mostramos el gráfico con la nube de puntos
y el modelo (recta).
La recta y =- 11, 63x +306, 45 se conoce con el nombre de recta de regresión

asociada a los puntos (xlYl) 'oo., (xs' Ys) .
134 _
dato
20 72 74 -2 4
16 105 120 -15 225
18 110 97 13 169
14 125 144 -19 361
14 136 144 -8 64
15 142 132 10 100
13 174 155 19 361
10 192 190 2 4
1.288
Mediana de
los pesos
250
200
150
y = -11,63x + 306,45
100 ---------
50 + - - - - - - - - , - - - - - - - - - - , - - - - - - - - - - , - - - - - - - - - - - 1
5 10 15 20 25
N° de manzanas
La suma de los errores de estimación cuadráticos para estos valores de a y b es 1.288.

Cualquier otro par de valores para a y b arrojarán una suma de errores de estimación
cuadráticos mayor que 1.288.
Ejemplo. Los modelos de automóviles se clasifican según lacapacidad de sus motores

medida en centímetros cúbicos (ce).
Se prueban siete automóviles nuevos, midiendo la distancia recorrida (en metros),
partiendo del reposo y durante los 10primeros segundos. La tabla entrega los resultados
obtenidos.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 135
dato
a) Usando una escala de 1 cm que represente 400 cc en el eje horizontal (x) y 1 cm que
represente 50 m en el eje vertical (y), dibujemos el diagrama de dispersión asociado
a la tabla anterior.
b) Calculemos el coeficiente de correlación entre la capacidad del motor y la distancia
recorrida en los primeros 10 segundos.
c) Obtengamos la ecuación de la recta de regresión asociada a los datos de la tabla.
d) Supongamos que la regresión ajusta "bien" la relación real entre la capacidad del
motor y la distancia recorrida durante los primeros 10 segundos.
d.) Estimemos la distancia que recorrerá un automóvil de 1.800 cc de capacidad

durante los primeros 10 segundos.
d 2) Estimemos la capacidad de motor de un automóvil que recorrerá una distancia

de 125 m en los primeros 10 segundos.
Solución:
a) según la escala predeterminada, los pares ordenados que se deben qraficar son:
(2, 1.64); (2.5,2.32); (3, 2.8); (3.75,3.52); (5,3.8); (6,4.56); (7.5 ,5.6)
y ,, ,
.
, ,
,
,,,
, , ,
6 ------~- --I-------I-------r
, , ,
,, ,,, ,, ,, :,
,, , , ,, , ,
,
5 ----r---
, - , ----- r
"" .- -1- - - - - - -1- .. - - -
,,,
T -----~-----
, , ,
,,, ,,, ,
,
t, ,
,.. - _..
4 ,, ,, ,, , ,, ,
----j---- ----1-------1----
, ,,
,
,
:
,
.: ,,,
, ,
------~-- ---
.
3 ---.-1------ ------1--
•
---- j..-- --
, , ,,
• ¡ ,,
2 -- --~- ----~--- I
.. _1 _ _
,, ,,
, ' ,,
,, ,
,, ,,, ,, ,, ,
,
_____ L _ _ ••.l _ _ I
, L
, ,
,, , ,
l ...
,,,
__
,, ,,
,
0+---+---+---1---1---1----+----+--__-
o 2 3 4 5 6 7 8
x
b) X =4,25 ,en la escala real de x corresponde a 1.700,
Sx =1,86 ,en la escala real de x corresponde a 744,
y = 3,46 ,en la escala real de y corresponde a 173,1,
Sy = 1, 25 , en la escala real de y corresponde a 62,S.
136 _
dato
Así, el coeficiente de correlación será igual a:
2 - 4,25 . 1,64 - 3,46 +--'------''---. 2,32 - 3,46 +... +-'-__'-- 5,6 - 3,46
r = 1,86 1,25 1,86 1,25 1,86 1,25
7
De donde r = 0,9854. Es decir, existe una "fuerte" relación lineal entre la capacidad del
motor y la distancia recorrida en los primeros 10 segundos.
c) La recta de regresión asociada a los datos del problema es y = ax + b, con
a = O9854 . 1,25 = O662

, 1,86"
b = 3,46 - 0,662·4,25 = 0,647.
Es decir, la ecuación de la recta de regresión es y = 0,662x + 0,647.
d 1) Si el motor del automóvil tiene 1.800 cc de capacidad (en la escala x corresponde

a x = 4,5), entonces la ecuación de la recta de regresión estima que la distancia
que recorrerá este automóvil de 1800 cc de capacidad, durante los primeros 10
segundos, será igual ay = 0,662 ·4,5 + 0,647 = 3,626 (lo que corresponde en laescala
ya 181,3m).
d2) Si el automóvil recorrerá una distancia de 125m(en laescala y corresponde ay = 2,5)

en los primeros 10segundos, entonces la ecuación de la recta de regresión estima
que lacapacidad del motor de esteautomóvil será igual a 2,799 (lo que corresponde
en la esca la x a 1.119,6cc).
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 137
dato
PROBABILIDADES Y El TRIANGUlO DE PASCAL

Acerca del Triángulo de Pascal
Imagine la siguiente situación. Un curso tiene 25 alumnos, de los cuales 10son mujeres
y 15 son hombres. Se realiza un experimento que consiste en elegir (al azar) 2 alumnos,
para representar al curso en un acto del Colegio. Para efectuar la elección, se numeran
25 pelotitas desde el 1 hasta el 25, y se echan a una bolsa no transparente.
Se escogen dos pelotitas desde la bolsa (pueden sacarse las dos al mismo tiempo o sacar
una primero, y luego la segunda, sin devolver la primera). Esta última modalidad es la
que adoptamos. El número escogido, corresponde al alumno que lleva ese número en
la lista del curso.
Diremos que ocurrió M si el número escogido corresponde a una alumna. En caso

contrario, es decir, si el número escogido correspondea un alumno, diremos que ocurrió
un H.
Lista del Curso
Según la lista de curso, las alumnas corresponden a los números 1,4,7,8, 11, 13, 16,20,
22,25 Ylosalumnos a los números 2,3, 5,6,9,10, 12, 14, 15, 17, 18, 19,21,23 Y24.
138 _
dato
Así, si en la primera pelotita sale el 13 y en la segunda el6 significa que se ha escogido
a los alumnos Andrea y Claudia. En cambio, si las pelotitas escogidas fuesen la 23 y la
15, los alumnos escogidos serían Gonzalo y Víctor.
Notar que en el primer caso se obtuvo un hombre y una mujer, mientras en el segundo
caso fueron dos hombres
Si sólo nos interesa saber si el alumno escogido fue hombre o mujer, entonces los
ejemplos anteriores podríamos escribirlos en la forma siguiente:
1° ejemplo 2° ejemplo
..... Resultado de la 2° pelotita escogida
..... Resultado de la 1° pelotita escogida
Este diagrama deforma de árbol nosservirá para escribir todas las posibles combinaciones
hombre-mujer que podrían ocurrir cuando se escogen 2 alumnos del curso.
El árbol (binario) para representartodas las combinaciones posibles de hombre - mujer

es el siguiente.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 139
dato azar.el
Observar que este árbol tiene en total 4 ramas, que verifican lo siguiente:
a) En una rama aparece OM Y 2 H (la rama del árbol que está más a la derecha).
b) En dos ramas aparecen 1 M Y 1 H.
c) En una rama aparecen 2 M Y OH.
El número de ramas que muestran lasdistintas cantidades de M y H la podemos escribir

horizontalmente como la secuencia
1 2 1
Caso a) Caso b) Caso e)
Supongamos ahora que en lugar de escoger dos alumnos para representar al curso
en el acto del colegio, es necesario escoger 3. ¿Cuál sería el árbol para representar las
diferentes combinaciones de M y H que podrían darse?
Nuevamente, para escoger a los 3 representantes, introducimos en la bolsa 25 pelotitas

y luego escogemos al azar tres de estas (sacamos la primera pelotita, luego la segunda,
sin devolver la primera, después la tercera, sin devolver las anteriores).
Por ejemplo, si en la primera pelotita sale el 8, en la segunda el 21 yen la tercera el

5, signiflca que se ha escogido a los alumnos Rosario, Julio y Erwin. En cambio, si las
pelotitas escogidas fuesen la 24, la 6 y la 15,los alumnos escogidos serían Miguel, Claudio
y Víctor.
Nuevamente, si sólo nos interesa saber si el alumno escogido fue hombre o mujer,
entonces los ejemplos anteriores podemos escribirlos en la siguiente forma:
10 ejemplo 20 ejemplo
<IIl Resultado de la 30 pelotita extraída
<IIl Resultado de la 2° pelotita extraída
<IIl Resultado de la 1° pelotita extraída
140 _
dato
Además, el árbol (binario) para representar todas las combinaciones posibles hombre-
mujer, que podrían darse cuando se escogen tres alumnos es el siguiente.
Notar que éste árbol tiene 8 ramas, que cumplen las siguientes condiciones:
a) En una rama aparecen OM Y 3 H.

b) En tres ramas aparecen 1 M Y 2 H.
c) En tres ramas aparecen 2 M Y 1 H.
d) En una rama aparecen 3 M Y OH.
El número de ramas que cumplen las distintas posibilidades de cantidades de M y H la

podemos escribir como la secuencia
1 3 3 1
Caso a) Caso b) Caso e) Caso d)
Supongamos ahora que en lugar de escoger 3 alumnos para representar al curso en el

acto del colegio, es necesario escoger 4. ¿Cuál sería el árbol para representar todas las
combinaciones posibles hombre-mujer que podrían darse en ahora?
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _- - - - - - - - 1 4 1
dato azar.el
El siguiente esquema representa el árbol de posibilidades en éste caso.
Podemos verificar que este árbol tiene 16 ramas que cumplen las siguientes
características:
i. Enuna rama aparecen OMY4 H.

ii. En cuatro ramas aparecen 1 M Y3 H.
iii. En seis ramas aparecen 2 M Y2 H.
iv. En cuatro ramas aparecen 3 MY1 H.
v. En una rama aparecen 4 MYOH.
Al igual que en el árbol anterior, el número de ramas de éste árbol que muestran las
distintas cantidades de M y H la escribimos horizontalmente como la secuencia
1 4 6 4 1
Caso i) Caso ll) Caso iii) Caso iv) Caso v)
Resumamos ahora lo que ha ocurrido hasta el momento con las ramas de los árboles
cuando se escogen 2,3 o 4 alumnos para representar al curso.
2 cuando se escogen 2 alumnos
3 3 cuando seescogen 3 alumnos
4 6 4 cuando seescogen 4 alumnos
142 _
dato
También! la tabla siguiente muestra el número total de ramas que tiene el árbol en los
casos anteriores.
Si se escogieran 5 alumnos del curso, ¿cuántas ramas tendría el árbol que describe todas
las posibles combinaciones hombre - mujer?
Observando la tabla anterior se puede conjeturar que el número de ramas que tiene el
árbol cuando se escogen 5 alumnos es 25 = 32 (lo cuál es verdadero).
En éste árbol de 32 ramas,
¿en cuántas ramas aparecen OM Y5 H ?,

¿en cuántas ramas aparecen 1 M Y4 H ?,
¿en cuántas ramas aparecen 2 M Y3 H ?,
¿en cuántas ramas aparecen 3 M Y2 H ?!
¿en cuántas ramas aparecen 4 M Y 1 H ?,
¿en cuántas ramas aparecen 5 M YOH?
Los valores que obtengamos como respuesta a éstas interrogantes, las escribiremos, al
igual que en los casos anteriores! horizontalmente como la secuencia:
Así, ahora obtendremos el diagrama:
3 3 cuandose escogen 3 alumnos
4 6 4 cuandose escogen 4 alumnos
cuandose escogen 5 alumnos
Observemos primeramente que en el primer y último casillero va un 1, pues hay sólo

una rama con OM Y5 H.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 143
dato
y también sólo una rama con 5 M Y OH.
Para completar el resto de los casilleros, notemos como se puede ir construyendo una
fila en función de la fila anterior en el diagrama anterior.
144 _
dato azar.el
Así, siguiendo la misma lógica de construcción, el diagrama que obtenemos es:
3 3
4 6 4
5 10 10 5
De esta forma concluimos que en el árbol con 32 ramas se tiene que:
En una rama aparecen O M Y5 H.

En cinco ramas aparece 1 M Y4 H.
En diez ramas aparecen 2 M Y3 H.
En diez ramas aparecen 3 M Y2 H.
En cinco ramas aparecen 4 M Y 1 H.
En una rama aparecen 5 M YOH.
Porúltimo, si se escogiera sólo un alumno del curso, ¿cuántas ramas tendría el árbol que
describe todas las combinaciones posibles de hombre-mujer?
Claramente se observa que sólo hay 2 ramas.
Notar que 21 =2.
Además hay una rama con OM Y 1 H Y una rama con 1 M YOH.
Así, el diagrama anterior puede ser completado en la siguiente forma.
3 3 cuando se escogen 3 alumnos
4 6 4 cuando se escogen 4 alumnos
5 10 10 5 cuando se escogen 5 alumnos
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 145
dato azar.el
Al diagrama anterior con un uno en la cúspide y cuyas líneas se construyen con el
esquema antes descrito se le conoce como Triángulo de Pascal.
3 3
4 6 4
5 10 10 5
Para identificar cada número con el que se forma el Triángulo de Pascal, usamos la
siguiente escritura.
Númerode alumnos escogidos
Númerode veces que aparece M en la rama
Por lo tanto, (~) ~ 6. Esto es, cuando se escogen 4 alumnos, hay 6 ramas donde
aparecen 2 M (y por lo tanto 2 H).
También,
~ Número de alumnos escogidos
(~)~
Número de veces que aparece M en la rama
146 _
dato azar.el
Otro ejemplo sería
m~ Número de veces que aparece M en la rama
Así, (:) ~ 10. Esto es, cuando se escogen 5 alumnos, hay 10 ramas donde aparecen
3 M (y por lo tanto 2 H).
Entonces, con esta nueva escritura, el Triángulo de Pascal puede escribirse como:
Números Factoriales
Se define O! como el valor 1, es decir 0!=1. Además, para cada n entero positivo, n! se
define recursivamente como el número natural n!=(n-1)! n.
Así por ejemplo,
1! = O! '1=1, 2! =1!· 2 = 2, 3! = 2! ·3 =2 ·3 = 6 4! = 3! ·4 = 6 ·4= 24,
8! 15!= 12!·13·14·15 =13.14.15=2.730

(3-2)!:;t:3!-2!, -:;t:2
4! ' 12! 12!
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 147
dato
Combinatoria
Al calcular los factoriales respectivos, se obtienen los siguientes resultados:
1! 1!
=1 =1
O!· (1 - O)! O! . (1 - 1)!
2! 2! 2!
=1 =2 =1
O! . (2 - O)! 1!'(2-1)! 2! . (2 - 2)!
3! =1 3! =3 3! 3!
=3 =1
O! . (3 - O)! 1! . (3 - 1)! 2! . (3 - 2)! 3! . (3 - 3)!
4! 4! 4! 4! 4!
=1 =4 =6 =4 =1
0!·(4-0)! 1!·(4-1)! 2!·(4 - 2)! 3! . (4 - 3)! 4!·(4 - 4)!
Ahora, observando elTriángulo de Pascal, pero con la escritura anterior, vemos que, por
ejemplo,
3J 3! 4J 4! 5J S!
( 1 = 1! . (3 - 1)! I (O = O! . (4 - O)! I (4 = 4! . (5 - 4)! I
ASI,, pod i'

emos conc .
uir por ejemp Io que (6J
2 = 2! . (66! _ 2)! .
Pero,
6! 30
= 15,
2! '(6 - 2)! 2
o también,
6! 1·2·3·4·5'6
6J 6! =-= = 6,
( 5 - S!· (6 - 5)! S! . 1! 1·2·3·4·5·1
148 _
dato azar.el
Volvamos al problema inicial.
¿Si escogiéramos 8 alumnos para representaral cursoen el acto del colegio, en cuantas
ramas del árbol aparecerán 3 M (y por lo tanto 5 H)?
Con la escritura anterior, la pregunta equivale a calcular el valor de
(:)~
Número de veces que aparece M en la rama
Según los cálculos realizados recientemente, tendríamos que
(8) 3
8!
= 3!· (8 - 3)! .
Pero,
8! 8! 1 ·2·3·4·5·6·7·8
---=
3! . (8 - 3)! 3!· S! = 1· 2 . 3 . 1 . 2 . 3 . 4 . 5 = 56,
Por lo tanto, hay 56 ramas del árbol en que aparecen 3 M Y5 H.
Definición. Para r natural y O ~ k ~ r, se define el número natural (~) como la

expresión
r) r!
(k = k! . (r - k)! .
De la definición, podemos observa que, para todo r natural,
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 149
dato
Además, larelación a partir de lacuál se puede construir unafila en elTriángulode Pascal,
a partir de la fila anterior, se traduce en que
Estos resultados son muy útiles a la hora de contar eventos y calcular las probabilidades
de dicho evento usando la fórmula de Laplace vista en la unidad 1.
15o _
dato
[1] Batanero et al. (1996). Azar y Probabilidad, Editorial Síntesis, 2da Edición, Madrid,
España.
[2] Bussab, W. y Morettin, P. (1991). Estadística Básica, Atual Editora, 4ta Edición, Sao
Paulo, Brasil.
[3] Ministerio de Educación (2003). Módulo de Matemática, Análisis Estadístico,

Componente Fortalecimientode la Profesión Docente, Inscripción No 136.277, Santiago,
Chile.
[4] Saavedra, E. (2000). Descubriendo Distribuciones de Probabilidad, Inscripción N°

122.794, Santiago, Chile.
[5] Saavedra, E. (2006). Contenidos Básicos de Estadística y Probabilidad, Editorial

Universidad de Santiago, Santiago, Chile.
[6] Soto, J. (2000). Introducción al Cálculo de Probabilidades, Programa MECE-Media,

Santiago, Chile.
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 151

Datos y Azar Completo

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Datos y Azar Completo

Cargado por

Copyright:

Formatos disponibles

dato zar.

Hoy en día, en lenguaje coloquial se acostumbra a llamar "estadísticas" a ciertas

- La palabra "estadística" procede del latín statisticum collegium ("consejo de Estado")

Desde loscomienzos de la civilización hanexistidoformas sencillas deestadística, puesya

- La estadística estudia el comportamiento de los fenómenos llamados de colectivo.

Dentro de los diferentes hechos que pueden ser observados en la naturaleza, o de

La importancia que la estadística ha alcanzado en nuestros días, tanto como cultura

Exactamente este mismo principio opera en estadística. Usualmente, en estadística se

Definición. En estadística, una población se define como una colección de personas,

a) Población: Establecimientos educacionales de la región metropolitana que parti-

b) Población: Establecimientos educacionales de Chile que participaron en el SIMCE

c) Población: Días del año 2008

e) Población: Ballenas que hay en los océanos del planeta tierra.

f) Población: Polígonos (figuras geométricas).

h) Población: Ratones portadores del virus Hanta en Chile.

i) Población: Los números naturales.

j) Población: Los vehículos motorizados que circulan por el país.

1) Población: Las personas con nacionalidad chilena.

m) Población: Los estudiantes que rindieron la PSU el año 2008.

iii) El proceso para identificar la población es destructivo. Por ejemplo, si la población

En resumen, cuando se tienen poblaciones infinitas, o poblaciones finitas que son

¿Qué se puede esperar de una muestra?

Supongamos que un establecimiento educacional quiere saber cuál es el número de

En general, una muestra proporciona más información de características globales

Por ejemplo,si lapoblación son los alumnosde su cursoyalescoger 5 alumnos en laúltima

El tamaño de la muestra y la forma de seleccionarla

Ejemplo. La Universidad de Santiago de Chile a raíz de la"toma" de la Universidad en

Ejemplo. En su colegio trabajan 20 profesores, de los cuales 5 son mujeres (25%) y 15

Malas elecciones de una muestra corren el riego de ser "sesgadas".

Ejemplo. Si se estuviese investigandolos rasgos físicos de loschilenos y seescogiese una

El método anterior es más o menos simple cuando la población es relativamente

A continuación se indica la manera de escoger un número al azar desde los números

Primero se coloca en la barra superior la instrucción =ALEATORIO() y luego introducir.

- Sé rotulan a los elementos de la población con los números 1,2, ...,N.

- Se escoge un número al azar desde los números 1,2, ... ,N.

- Se repite este procedimiento n veces. En caso de obtener un número que ya ha

Si el tamaño de la población es "grande': la solución que hemos dado anteriormente

En el año 2003, 159.000 estudiantes rindieron la PSU. De esta población de tamaño

Finalmente, los 1300 elementos escogidos de la población serán aquellos identificados

36, 36 + 122, 36 + 2 . 122, 36 + 3 . 122, ... , 36 + 1298 . 122, 36 + 1299 . 122

Como vimos anteriormente, el estudio de una población o muestra significa (en

Obtener una visión panorámica de la distribución de los datos obtenidos de la

Grupo A 5.5 4.5 5.2 4.8

Grupo B 2.2 6.8 4.0 7.0

Clasificación de las Variables

Las variables se presentan en dos tipos diferentes; a saber, cualitativas y cuantitativas,

Establecer diferencias entre tipos de variables, significa en el fondo, establecer diferencias

estos consisten en etiquetas simples o categorías tales como femenino/masculino;

y las categorías o etiquetas no tienen un orden inherente; esto es, no importa si

La tabla siguiente resume la información recogida en la encuesta.

Culturo Generol 10.708

estos constan de categorías tales como satisfecho/insatisfecho, nivel escolar su-

las categorías tienen un orden naturalo inherente, como en el caso de losejemplos

En muchos casos, lasescalas de clasificación requieren la completación de un cuestionario,

Esfuerzo respiratorio Ausente Lento, irregular Bueno, llora

Tono muscular Laxo de Cierta flexión Movimiento activo

En resumen, variables ordinales pueden tomar tanto valores no numéricos como

• estos consisten en valores específicamente definidos, tales como 15°C, 25°C,

• Y si x; z; x+h; z+h son datos, entonces z - x = (z+h) - (x+h).

Variables cuantitativas tienen unidades de medida lo que no ocurría con variables

En este caso la diferencia de área entre el primer y el segundo triángulo es exactamente

Finalmente, las variables cuantitativas siempre tienen asociadas unidades de medida.

Como vimos anteriormente, lasvariables cualitativas las podemos subdividir en variables

Diremos que una variable cuantitativa es discreta si el número de posibles valores