Está en la página 1de 43

UNIVERSIDAD SALESIANA DE BOLIVIA

CONTADURÍA PÚBLICA

ESTADÍSTICA I
(DOSSIER)
LIC. EMMA MARTHA MANCILLA FLORES

La Paz-Bolivia

Febrero, 2012
Índice general

lla
ci
1. El papel de la Estadı́stica. 7

an
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

M
1.2. Algunas definiciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.3. Conceptos preliminares. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10


c.
1.3.1. Población. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
Li
1.3.2. Muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
I-

1.3.3. Unidad de observación. . . . . . . . . . . . . . . . . . . . . . . . . . 13


a

1.3.4. Variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
tic

1.3.5. Datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
ís

2. Organización y resumen de datos(univariante) 17


ad

2.1. Clasificación de Variables. . . . . . . . . . . . . . . . . . . . . . . . . . . . 17


t

2.1.1. Variables Cualitativas. . . . . . . . . . . . . . . . . . . . . . . . . . 18


Es

2.1.2. Clasificación de variables cualitativas. . . . . . . . . . . . . . . . . . 19

2.1.3. Variables cuantitativas. . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.2. Tabla de distribución de frecuencias y Gráficos. . . . . . . . . . . . . . . . 20

3
4 ÍNDICE GENERAL

2.2.1. Frecuencias relativas . . . . . . . . . . . . . . . . . . . . . . . . . . 20

2.2.2. Frecuencias acumuladas . . . . . . . . . . . . . . . . . . . . . . . . 22

2.2.3. Frecuencia absoluta acumulada . . . . . . . . . . . . . . . . . . . . 22

2.2.4. Frecuencia relativa acumulada . . . . . . . . . . . . . . . . . . . . . 22

2.3. Construcción de los intervalos de clases . . . . . . . . . . . . . . . . . . . . 24

2.4. Técnicas para la confección de gráficos estadı́sticos. . . . . . . . . . . . . . 28

lla
2.4.1. Gráfico de frecuencias de barras . . . . . . . . . . . . . . . . . . . . 29

ci
2.4.2. Polı́gono de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . 29

an
3. Análisis Descriptivo Univariante 31

M
3.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
c.
3.2. Medidas de Posición o tendencia Central. . . . . . . . . . . . . . . . . . . . 32
Li
3.2.1. Media Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
I-

3.2.2. La Mediana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

3.2.3. La Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
a
tic

3.3. Medidas de Dispersión. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42


ís

3.3.1. Desviación estándar. . . . . . . . . . . . . . . . . . . . . . . . . . . 45


ad

3.3.2. Coeficiente de variación. . . . . . . . . . . . . . . . . . . . . . . . . 46

3.4. Medidas de Forma. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46


t
Es

3.4.1. Curtosis o Apuntamiento. . . . . . . . . . . . . . . . . . . . . . . . 47

4. Distribuciones bivariantes 49

4.1. Distribuciones Marginales . . . . . . . . . . . . . . . . . . . . . . . . . . . 55


ÍNDICE GENERAL 5

4.1.1. Distribución marginal de X . . . . . . . . . . . . . . . . . . . . . . 56

4.1.2. Distribución marginal de Y . . . . . . . . . . . . . . . . . . . . . . 56

4.2. Medidas descriptivas de variables bidimensionales . . . . . . . . . . . . . . 58

4.2.1. Medias y Varianzas Marginales . . . . . . . . . . . . . . . . . . . . 60

4.2.2. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.3. Correlación Lineal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

lla
4.3.1. Diagrama de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . 64

ci
4.3.2. Coeficiente de correlación lineal. . . . . . . . . . . . . . . . . . . . . 65

an
4.4. Regresión lineal simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

M
5. Principios de probabilidad 71
c.
5.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Li
5.2. Aleatoriedad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
I-

5.3. Álgebra de eventos y probabilidad. . . . . . . . . . . . . . . . . . . . . . . 72

5.4. Concepto de probabilidad. . . . . . . . . . . . . . . . . . . . . . . . . . . . 75


a
tic

5.5. Probabilidad condicional. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

5.6. Regla de multiplicación. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79


ís

5.7. Eventos independientes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80


ad

A. Glosario 83
t
Es
6 ÍNDICE GENERAL

Resumen

El presente trabajo es un resumen del desarrollo del curso normal de Estadı́stica I de la

Carrera de Contadurı́a Pública ,tomando en cuenta el objetivo principal de la materia:

Desarrollar en el estudiante la capacidad de analizar e interpretar datos e informa-

lla
ción estadı́stica que permita respaldar la toma de decisiones del futuro Contador.

ci
an
Por ello , que el presente trabajo servirá como instrumento de referencia para los

estudiantes, que cursan la materia; realizando un resumen de conceptos, definiciones,

M
propiedades, relaciones de suma importancia, adicionando ejercicios resueltos y propues-
c.
tos. Por lo cual se encuentra actualmente en una revisión para cubrir el programa sugerido
Li
para la Gestión 2011.
I-

La única originalidad que puede pretender el autor reside


a

en la manera en que disponga en un conjunto los elementos ya


tic

conocidos y en el uso en que haga de ese conjunto en sus


ís

razonamientos.
ad

Adam Schaff
t
Es
Capı́tulo 1

lla
ci
El papel de la Estadı́stica.

an
M
1.1. Introducción c.
Li
Muchas de las decisiones que usted, su médico o los ministros de gobierno toman a
I-

diario se basan en estadı́sticas. El candidato a la elección presidencial cambia su campaña

en vista de los resultados de una encuesta de opinión. El médico le prescribe un tratamiento


a

porque las estadı́sticas le informan que el tratamiento cura su enfermedad en 70 % de los


tic

casos. Una muestra de sangre es suficiente para decir miles de cosas sobre la totalidad de la
ís

sangre de su cuerpo. ¿Las estadı́sticas obtenidas a partir de una gota de sangre, algunos
ad

telespectadores o electores permiten tomar siempre decisiones acertadas? La respuesta


t
Es

puede influir decisiones relativas a su vida. No se puede ignorar el uso generalizado de la

Estadı́stica en todos las actividades de nuestra sociedad.

Actualmente el gobierno de cada paı́s recolecta sistemáticamente datos relativos a su

población, su economı́a, su recursos naturales y su condición polı́tica y social para tomar

7
8 CAPÍTULO 1. EL PAPEL DE LA ESTADÍSTICA.

decisiones. En las actividades industriales o comerciales las estadı́sticas son parte de la

organización ası́ como en los sectores agrı́cola y forestal, donde se requiere predicciones de

la producción. En la investigación cientı́fica (medicina, fı́sica, biologı́a, ciencias sociales,

etc.) el rol de la Estadı́stica es primordial.

Ası́ en la vida diaria se está rodeado de estadı́sticas (en plural), en el sentido de

datos numéricos. La Estadı́stica (en singular) como una disciplina académica se la podrı́a,

lla
en principio, definir como la ciencia que provee los métodos para analizar e interpretar

ci
datos numéricos y por lo tanto tener conocimiento de sus herramientas serı́a de utilidad en

an
muchos campos. Al iniciar el desarrollo de algunos temas de Estadı́stica parece conveniente

M
dar una definición un poco más precisa de lo que se entiende por esta disciplina, que ayude
c.
a comprender su utilidad. Algunas de las preguntas que se contestarán en el desarrollo de
Li
esta unidad son:
I-

¿Qué es la estadı́stica?,
a

¿Cómo funciona?
tic

¿Cómo ayuda a resolver ciertos problemas de la vida práctica?.


ís
ad

1.2. Algunas definiciones.


t
Es

De esta manera, se tienen diversas definiciones de Estadı́stica, a continuación se

mencionarán algunas de ellas:

Definición. 1.1. “La estadı́stica es una ciencia que comprende la recopilación,


LIC. EMMA MARTHA MANCILLA FLORES 9

tabulación, análisis e interpretación de los datos cuantitativos y cualitativos ”.

Kennedy-Neville.

“La estadı́stica constituye una disciplina con ilimitadas posibilidades de aplicación

en diversos campos de la actividad humana ”. H.B.Christensen.

“Estadı́stica es un grupo de técnicas o metodologı́a que se desarrollaron para la re-

lla
copilación, presentación y análisis de los datos y para el uso de tales datos ”.”Neter-

ci
Waserman.

an
“La Estadı́stica es la ciencia que se ocupa de la recopilación, tabulación, análisis,

M
interpretación y presentación de datos cuantitativos ”. D.H.Besterfield.
c.
“La Estadı́stica es un campo de ensayo en el que se recogen y analizan los datos
Li
con el propósito de sacar conclusiones . . . . . . proporciona instrumentos para la toma
I-

de decisiones cuando prevalecen condiciones de incertidumbre ”. William Guenther.


a

“El arte y la ciencia de la estadı́stica incluyen procedimientos para identificar una


tic

población, seleccionar una muestra, reconocer los elementos o bien las unidades de
ís

observación de ella y decidir qué mediciones pueden hacerse y los tratamientos (si
ad

existen) aplicables, llevando a cabo y registrando las mediciones y las interpreta-


t

ciones correctas de los datos resultantes, de tal forma que sea posible ilustrar una
Es

decisión basada en ellos ”. H.B.Christensen.

“La Estadı́stica es un conjunto de datos cuantitativos sobre un tema o grupo de-

terminados, en especial cuando los datos se reúnen y agrupan de manera sistemática


LIC. EMMA MARTHA MANCILLA FLORES 11

tomar decisiones y predecir fenómenos que puedan expresarse en forma cuantitativa,

de acuerdo a ciertos objetivos preestablecidos.

Es decir, es la puesta en marcha del método cientı́fico desde la obtención de la infor-

mación (datos) hasta las conclusiones, siempre con relación a los objetivos. Los métodos

estadı́sticos a usar en un determinado estudio dependerán de las condiciones y carac-

lla
terı́sticas propias de dicho estudio. De aquı́ que, antes de presentar algunos métodos de

resumen de datos, sea conveniente definir algunos conceptos previos:

ci
an
1.3.1. Población.

M
La palabra población se usa en el lenguaje cotidiano para significar todas las personas
c.
que viven en una determinada región geográfica, frecuentemente en un paı́s. En estadı́stica
Li
el término población se usa con distintos significados y con sentidos más amplios.
I-

Definición. 1.2. El término población se asocia a los individuos u objetos (personas,

animales, cosas) de interés para el estudio y otra se asocia a los valores de la o las
a
tic

caracterı́sticas que se estudian en dichos individuos.


ís

Si se usa población bajo estudio para referirse a los individuos u objetos, entonces:
ad

Una población es un conjunto de individuos u objetos en los cuales el investigador


t

está interesado.
Es

Ejemplo. 3. Si el interés de un dueño de una ferreterı́a de una ciudad, es conocer

las caracterı́sticas de la demanda de los consumidores para cada artı́culo, la población

es todos los posibles compradores de esa ferreterı́a de dicha ciudad.


12 CAPÍTULO 1. EL PAPEL DE LA ESTADÍSTICA.

Si el interés es evaluar diferentes tratamiento de la diabetes, la población es todos

los diabéticos.

Una población, en general, se define a través de criterios de inclusión y exclusión (edad,

sexo, capital de una empresa, perı́odo de tiempo, etc.) , mediante un lugar fı́sico donde

los individuos habitan o concurren por algún motivo (escuela, servicio de salud, fabrica,

lla
etc.).

ci
Ejemplo. 4. Si el interés es conocer la producción diaria de una fábrica de tornillos, la

an
población es todos los posibles valores de producción diaria en aquella fábrica en un dado

M
perı́odo de tiempo.

c.
Cuando los integrantes de una población pueden ser listados, es decir, se puede con-
Li
feccionar una lista de los individuos u objetos que componen la población, aunque ella
I-

sea muy grande, entonces se dice que se tiene una población finita.
a

Ejemplo. 5. Todos los niños una ciudad entre 10 y 14 años, aunque en la práctica esto
tic

es a veces difı́cil de conseguir.


ís

Existen otras situaciones donde los integrantes de la población no pueden ser listado,
ad

por ejemplo, si se trata de comparar dos polı́ticas de venta de un producto, es claro, que lo
t
Es

que se pretende es que las polı́ticas de venta se puedan aplicar a futuros productos (todos

los productos producidos en el presente y en el futuro) y en consecuencia serı́a imposible

en el momento del estudio hacer una lista de ellos, en tales casos se dirá que nuestra

población es una población hipotética.


LIC. EMMA MARTHA MANCILLA FLORES 13

Cuando el objetivo es estudiar las caracterı́sticas o el comportamiento de poblaciones

finitas, ellas deben estar claramente definidas a través de los criterios de inclusión y

exclusión.

Pero cuando el estudio intenta sacar conclusiones hacia una población hipotética lo que

se debe describir son las caracterı́sticas del grupo sobre los cuales se quiere trabajar.

lla
1.3.2. Muestra.

ci
Si las poblaciones a estudiar contienen un número de individuos que hace imposible

an
analizarlos en su totalidad, entonces, en lugar de observar a todos los elementos de esa

M
población, se podrı́a seleccionar un subconjunto (una parte) de ella y usar la información
c.
de este subconjunto para conocer algo sobre la población. Ası́:
Li
Definición. 1.3. Una muestra se puede definir como un subconjunto o parte represen-
I-

tativa de la población seleccionada.


a

1.3.3. Unidad de observación.


tic

Es la :
ís
ad

unidad mı́nima de observación o individuos que componen la población.


t

Ejemplo. 6. Si el objetivo de la investigación es ver si una máquina embotelladora,


Es

llena adecuadamente las botellas de 1, 5 lt., la unidad de observación será la botella

de 1, 5lt.
14 CAPÍTULO 1. EL PAPEL DE LA ESTADÍSTICA.

1.3.4. Variable.

Es una:

caracterı́stica que puede tomar diferentes valores (no necesariamente numéricos) en

las distintas unidades de observación.

lla
Ejemplo. 7. Edad, sexo, ingresos mensuales, tipos de viviendas, etc.

ci
1.3.5. Datos.

an
Usando el concepto de variable, una definición formal de dato serı́a:

M
Se denomina datos a los valores observados o medidos de una variable y constituyen
c.
la información disponible.
Li
I-

Existen diferentes métodos estadı́sticos que se aplican en cada una de estas etapas. Lo que

se refiere a resumen de la información es lo que se conoce como estadı́stica descriptiva,


a

finalmente el análisis de la información y los alcances de las conclusiones que de allı́ se


tic

derivan, caen en el campo de la inferencia estadı́stica. Un aspecto importante de la es-


ís

tadı́stica inferencial es el proceso de usar los datos de la muestra para sacar conclusiones
ad

respecto a las caracterı́sticas de interés de la población, otro es el relacionado a la variabil-


t
Es

idad de las observaciones. Este punto es crucial ya que si uno no esta convencido de que

los datos son variables por si solos, o sea que dos cosas o personas no son exactamente

iguales, no tiene sentido hablar de estadı́stica. Ejemplo: Se quiere conocer la estatura

promedio de un curso y suponemos que todos son exactamente iguales, con solo tomar
LIC. EMMA MARTHA MANCILLA FLORES 15

uno de ellos se tiene la información de todos los alumnos, y por consiguiente es suficiente

para saber el resultado. En este caso la estadı́stica no interviene para nada. El papel de

la estadı́stica toma parte cuando se reconoce la existencia de variabilidad entre los datos.

emmf
c

lla
ci
an
M
c.
Li
I-
a
tic
ís
t ad
Es
Capı́tulo 2

lla
ci
Organización y resumen de

an
M
datos(univariante)
c.
Li
La Estadı́stica Descriptiva formula reglas y procedimientos para la presentación de
I-

una masa de datos en una forma más útil y significativa. Establece normas para la rep-
a

resentación de los datos. Siendo una base importante para el análisis en casi todas las
tic

disciplinas académicas.
ís
t ad
Es

2.1. Clasificación de Variables.

Dependiendo de la caracterı́stica en estudio, distinguimos dos grandes grupos de vari-

ables: Variables categóricas o cualitativas y variables cuantitativas.

17
LIC. EMMA MARTHA MANCILLA FLORES 27

intervalos adyacentes, adoptaremos la siguiente convención entregada en la figura

2.5,

lla
ci
Figura 2.5: Tres intervalos de amplitud constante.

an
M
Esto es, salvo el primer intervalo que es cerrado en ambos extremos, en los otro

intervalos será abierto por la izquierda y cerrado por la derecha. Abierto por la
c.
izquierda significa que el intervalo no incluye a ese extremo izquierdo; y cerrado por
Li
la derecha significa que incluye al extremo derecho de ducho intervalo.
I-

Los últimos dos intervalos serán de la forma indicada en la figura 2.6.


a
tic
ís
t ad
Es

Figura 2.6: Determinación de los lı́mites reales, de cada intervalo.


28 CAPÍTULO 2. ORGANIZACIÓN Y RESUMEN DE DATOS(UNIVARIANTE)

2.4. Técnicas para la confección de gráficos es-

tadı́sticos.

Un gráfico estadı́stico es una representación pictórica que permite dar un resumen

visual de la información, y se utiliza para detectar tendencias, agrupación de datos

lla
en torno a un valor central, variaciones cı́clicas, estacionales y otras caracterı́sticas.

ci
an
Existe una gran variedad de gráficos estadı́sticos. En esta sección se va a estudiar el

más sencillo de todos, el gráfico de frecuencias, en el entendido que otro tipo de gráfi-

M
co su construcción será análoga. Supongamos que tenemos la tabla de frecuencias,

como se indica en la figura 2.7


c.
Li
I-
a
tic
ís
t ad
Es

Figura 2.7: Tabla de distribución de frecuencias


Capı́tulo 3

lla
ci
an
Análisis Descriptivo Univariante

M
c.
Li
3.1. Introducción.
I-

El Promedio y variabilidad son elementos fundamentales en la dinámica poblacional.


a
tic

Por ello, para interpretar el comportamiento de un conjunto de datos, se suelen

utilizar ciertos valores que estiman algunas de sus caracterı́sticas. A tales valores se
ís
ad

les llama Medidas Estadı́sticas. Básicamente se clasifican en :


t
Es

• Medidas de Posición;

• Medidas de Dispersion, y

• Medidas de Forma.

31
32 CAPÍTULO 3. ANÁLISIS DESCRIPTIVO UNIVARIANTE

3.2. Medidas de Posición o tendencia Central.

Estos valores tienden a ocupar posiciones centrales o intermedias entre el mayor y

el menor valor del conjunto de datos; razón por la que reciben este nombre. Las más

usadas son:

lla
• La Media Aritmética (denotada por X);

ci
• La Mediana (Me ), y

an
• La Moda (Mo ).

M
Medidas de las cuales a continuación se proporcionarán, su definición,caracterı́sticas,
c.
en los casos de tener datos simples y datos agrupados; sus ventajas y desventajas.
Li
I-

3.2.1. Media Aritmética


a

La medición la vamos a denotar por la variable aleatoria X; ahora bien:


tic

Definición. 3.1. Si se selecciona una determinada muestra de esa población y se


ís

efectúa las mediciones para la caracterı́stica X, n mediciones y estas son x1 , x2, . . . , xn ,


ad

entonces se define la media de estas observaciones (o promedio) como:


t
Es

x1 + x 2 + x3 + . . . + xn
x̄ = (3.1)
n

Por otra parte, si suponemos que de estas n observaciones en realidad hay solamente

k que son distintas entre ellas, de modo que entonces podemos tener la tabla3.1:
LIC. EMMA MARTHA MANCILLA FLORES 41

De modo que :

 
Δ1
Mo = Li−1 + ci (3.6)
Δ1 + Δ2

Donde:

1. Li−1 lı́mite real inferior de la clase modal.

lla
2. Δ1 = ni − ni−1 .

ci
3. Δ2 = ni − ni+1 .

an
4. ci representa la amplitud de la clase modal.

M
c.
Ejemplo. 15. En la distribución de frecuencias siguiente calcular la Moda
Li
intervalo ni
I-

40 – 46 4
a

46 – 52 5
tic

52 – 58 7
ís

58 – 64 6
ad

64 – 70 3

Total 25
t
Es

buscamos cual es el intervalo que tiene la mayor frecuencia que es igual n3 = 7 y

corresponde a la clase 52 − −58, tenemos los siguientes datos: Li−1 f = 52, ci = 6,

Δ1 = 7 − 5 = 2 y Delta2 = 7 − 6 = 1 reemplazando ,tenemos:


42 CAPÍTULO 3. ANÁLISIS DESCRIPTIVO UNIVARIANTE

 
Δ1
Mo = Li−1
+ ci
Δ1 + Δ2
 
2
= 52 + ·6
2+1
= 55,9

lla
Ventajas y Desventajas

ci
an
1. Cuando se necesita una estimación rápida, de la tendencia central.

M
2. Cuando se desea conocer el punto de máxima frecuencia en una distribución .
c.
3. En general la moda es la menos usada de las tres medidas.
Li
I-

3.3. Medidas de Dispersión.


a

Hasta ahora se ha estudiado en las observaciones los estadı́sticos de tendencia central


tic

(media, mediana y moda). Sin embargo se debe tener una noción en cuanto a la
ís

relación existente entre estas observaciones, una medida de cuan alejada está una
ad

determinada observación del resto, o de una medida de disgregación que tienen estas
t
Es

observaciones. En rigor la primera medida de dispersión que ya se ha estudiado

es el rango de las observaciones. Pero es claro que esta medida presenta varios

inconvenientes. En primer lugar solo considera dos observaciones, la más pequeña y

la mayor, de modo que no puede ser muy fiable toda vez que uno de estos valores
LIC. EMMA MARTHA MANCILLA FLORES 43

extremos se aleje demasiado y el resto se encuentre muy agrupado. En segundo lugar,

podemos aumentar el número de observaciones, esto significa tener más precisión

en el fenómeno en estudio, y es posible que las nuevas observaciones se agrupen,

por ejemplo en torno a la media, y el rango no disminuirá. Finalmente, basta que

una observación nueva sea mayor o menor que el resto de las anteriores para que el

rango aumente.

lla
De manera es más conveniente otras medidas de dispersión. Tales como:

ci
an
• La Desviación Estándar, SX ,

M
• El Coeficiente de Variación CVX .

c.
Pero antes se debe mencionar a la Varianza.
Li
2
Definición. 3.4. La cantidad SX se llama varianza (muestral) y tiene un valor
I-

fundamental en el análisis estadı́stico, se interpreta como el promedio de las desvia-

ciones cuadráticas respecto de la media:


a

n
tic

2 i=1 (xi − x̄)2


SX =
n
ís

Si las observaciones están distribuidas en intervalos de clase, entonces:


ad

k
2 i=1 (xi − x̄)2 ni
t

SX =
Es

Propiedades de la Varianza.

Dentro las más importantes, se puede mencionar:


LIC. EMMA MARTHA MANCILLA FLORES 47

más larga, se dice sesgada a la derecha o de sesgo positivo. Si la curva tiene a

izquierda una cola más larga, se dice sesgada a la izquierda o de sesgo negativo.

Para poder tomar una decisión, se puede emplear:

Coeficientes de Pearson.

(x − M o
Cas = SX
)

lla
o

ci
3(X − M e
Cas = SX

an
)

Coeficiente en función a momentos.

M
Los resultados de cualquiera de los coeficientes de asimetrı́a Ca s, se pueden

interpretar como:
c.
Li




⎪ < 0, Asimetrı́a negativa


I-

Ca s(X) = = 0, Normal o simétrica







⎩ > 0,
a

Asimetrı́apositiva.
tic

• La Curtosis.
ís
ad

3.4.1. Curtosis o Apuntamiento.


t
Es

Se entiende por curtosis, la medida de deformación vertical de una distribución de

frecuencias, es decir la medida de apuntamiento o achatamiento de una distribución.

El grado de medir la curtosis o apuntamiento se da a través del coeficiente de

curtosis.
48 CAPÍTULO 3. ANÁLISIS DESCRIPTIVO UNIVARIANTE

Coeficiente de Curtosis

Mide el apuntamiento de la distribución de frecuencias la cual pueden ser Platicur-

ticas o planas, Mesocurticas o normal, y Leptocurlicas o alargadas.



(xi − x)4
K= n
4
SX

lla
se interpretan como: ⎧

ci

⎪ < 3, Platicurtica

an
K= = 3, Mesocurtica





⎩ > 3, Leptocurtica.

M
c.
Li
I-
a
tic
ís
t ad
Es
Capı́tulo 4

lla
ci
an
Distribuciones bivariantes

M
c.
Las distribuciones bidimensionales o bivariantes son aquellas en las que se
Li
estudian al mismo tiempo dos variables (X, Y ) de cada elemento de la población o
I-

muestra.
a

Ejemplo. 17. Podemos mencionar:


tic
ís

• Peso y altura de un grupo de estudiantes.


ad

• Superficie y precio de las viviendas de una ciudad.


t
Es

• Potencia y velocidad de una gama de coches deportivos.

Para representar los datos obtenidos se utiliza una tabla (4.3)de doble entrada :

49
50 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES

Y y1 y2 ... ym−1 ym

x1 n11 n12 ... n1(m−1) n1m

x2 n21 n22 ... n2(m−1) n2m


.. .. .. .. ..
. . . ... . .

lla
x(k−1) n(k−1)1 n(k−1)2 ... n(k−1)(m−1) n(k−1)m

ci
xk nk1 nk2 ... nk(m−1) nkm

an
Cuadro 4.1: Tabla de doble entrada.

M
1. La frecuencia relativa del par , (xi , yi ) la denotamos por fij :

c. nij
fij =
n
Li
I-

y
a


k
m
tic

fij = 1
i=1 j=1
ís
ad

2. La suma de frecuencias absolutas es igual a n:


t


k
m
Es

nij = n
i=1 j=1

Las xi representan una de las variables y las yj la otra variable. En cada intersección
56 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES

• (ii) Las frecuencias relativas marginales:


m
fi• = fij
j=1


k
f•j = fij
i=1


k
m
fi• = f•j = 1

lla
i=1 j=1

Al analizar una distribución bidimensional, uno puede centrar su estudio en el com-

ci
an
portamiento de una de las variables, con independencia de como se comporta la

otra. Estarı́amos ası́ en el análisis de una distribución marginal.

M
De cada distribución bidimensional se pueden deducir dos distribuciones marginales:
c.
Li
1. Una correspondiente a la variable X.
I-

2. Otra correspondiente a la variable Y .


a

Las cuales serán descritas a continuación:


tic
ís

4.1.1. Distribución marginal de X


ad

4.1.2. Distribución marginal de Y


t
Es

Ejemplo. 19. A partir del ejemplo anterior en el que se vió la serie con los pesos

y estaturas de un grupo de estudiantes de una clase , ahora se va a estudiar sus

distribuciones marginales, logradas a partir de la tabla (4.2).


LIC. EMMA MARTHA MANCILLA FLORES 57

xi ni·

(Variable) (Frec.Marginal)

x1 n1·

x2 n2·

x3 n3·
.. ..

lla
. .

ci
xk nk·

an
Cuadro 4.4: Distribución marginal de la variable Y .

M
Las variables marginales se comportan como variables unidimensionales, por lo que

pueden ser representadas en tablas de distribución de frecuencias.


c.
Li
I-
a
tic
ís
t ad
Es
LIC. EMMA MARTHA MANCILLA FLORES 59

lla
Peso (Kg.) 31 32 33 34 35 ni•

Estatura(m.)

ci
an
1.21 1 2 3

1.22 1 1 1 3

M
1.24 2 1 3

1.25
c.
1 1 1 3
Li
1.27 2 1 2 1 6
I-

1.28 1 1 1 3

1.29 3 1 1 1 6
a

1.30 2 1 3
tic

n•j 6 6 6 7 5 30
ís

Cuadro 4.6: Tabla de distribución conjunta del Peso y Estatura de los estudiantes.
t ad
Es
60 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES

Estatura (m.) No.estudiantes(ni• ) fi•

1.21 3 0.10

1.22 3 0.10

1.24 3 0.10

1.25 3 0.10

lla
1.27 6 0.20

ci
1.28 3 0.10

an
1.29 6 0.20

1.30 3 0.10

M
30 1
c.
Cuadro 4.7: Distribución marginal de la estatura (cm.)
Li
4.2.1. Medias y Varianzas Marginales
I-

Al considerar las tablas (4.4) y (4.5), en las cuales se muestra la distribución de


a
tic

cada variable por separado, se puede aplicar las mismas expresiones utilizadas en

distribuciones unidimensionales.:
ís
ad

Medias Marginales.
t

Se tienen:
Es

• Para la variable X:

k
i=1 xi ni·
x̄ = (4.1)
n
64 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES

Propiedad. 4.3. Para facilitar el cálculo de la covarianza dada en las ecuaciones

(4.5); se puede emplear:


n
i=1 (xi yi )
Cov(x, y) = − x̄ȳ; (Datos simples) (4.7)
n

k m
i=1 j=1 (xi yj ) nij
Cov(x, y) = − x̄ȳ; (Datos agrupados) (4.8)
n

lla
Propiedad. 4.4.

ci
Cov(ax + b , cy + d) = acCov(x , y); para a, b, c, d ∈ R.

an
M
4.3. Correlación Lineal.
c.
En una distribución bidimensional puede ocurrir que las dos variables guarden algún
Li
tipo de relación entre si, la cual se trata de determinar, en base a algunos instru-
I-

mentos que se mencionará a continuación.


a
tic

4.3.1. Diagrama de dispersión


ís

Al querer investigar acerca de la relación existente entre dos variables, se comen-


ad

zará analizando la forma aproximada de la relación, para lo cual se realizará la


t

representación de los datos observados en el sistema cartesiano. Esta gráfica es de-


Es

nominada Diagrama de dispersión.

De esta manera se puede observar los siguientes comportamientos conjunto, dados

en la figura(4.1).
LIC. EMMA MARTHA MANCILLA FLORES 65

lla
ci
an
M
Figura 4.1: Algunos comportamientos de forma conjunta.

4.3.2.
c.
Coeficiente de correlación lineal.
Li
Mide el grado de intensidad de esta posible relación entre las variables. Este coefi-
I-

ciente se aplica cuando la relación que puede existir entre las variables es lineal ,es
a

decir, si representamos en un gráfico los pares de valores de las dos variables la nube
tic

de puntos se aproximarı́a a una recta, como se puede apreciar en la figura (4.2).


ís

No obstante, puede que exista una relación que no sea lineal, sino exponencial,
ad

parabólica u otra. En estos casos, el coeficiente de correlación lineal medirı́a mal la


t
Es

intensidad de la relación entre las variables, por lo que convendrı́a utilizar otro tipo

de coeficiente más apropiado. Para ver, por tanto, si se puede utilizar el coeficiente

de correlación lineal, lo mejor es representar los pares de valores en un gráfico y ver

que forma describen.


68 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES

lla
ci
an
Figura 4.3: Diagrama de dispersión, de las variables X e Y .

M
Donde y serı́a la variable dependiente, es decir, aquella que viene definida a partir
c.
de la otra variable x variable independiente) Para definir la recta se debe determinar
Li
los valores de los parámetros a y b:
I-

El parámetro a ; es el valor que toma la variable dependiente y, cuando la variable


a
tic

independiente x vale 0, siendo el punto donde la recta cruza el eje vertical.


ís

El parámetro b ; determina la pendiente de la recta,es decir, el grado de incli-


ad

nación.
t
Es

La regresión lineal nos permite calcular el valor de estos dos parámetros, definiendo

la recta que mejor se ajusta a esta nube de puntos (Método de mı́nimos cuadrados).

De esta manera, se tiene:


LIC. EMMA MARTHA MANCILLA FLORES 69

• El parámetro b viene determinado por la siguiente expresión:

Cov(x, y) 2
b̂ = 2
; SX >0 (4.11)
SX

Es la covarianza de las dos variables, dividida por la varianza de la variable

X.

lla
• El parámetro a viene determinado por:

ci
â = ȳ − b̂ x̄ (4.12)

an
Luego la ecuación(4.10), se puede expresar como:

M
Cov(x, y)
y = ȳ + c.
2
(x − x̄)
SX
Li
llamada también recta de mı́nimos cuadrados de y en x.
I-

Nota. 5. Se puede mencionar algunas otras funciones utilizadas para determinar


a

la función adecuada a los datos que se analizan ,estas pueden ser:


tic

1. Lı́nea recta :Y = a + bX
ís

2. Parábola: Y = a + bX + cX 2
ad

3. Curva potencial: Y = bX a
t
Es

4. Curva exponencial:Y = abX

a
5. Hipérbola : Y = X

1
6. Curva logı́stica : Y
= a + bcX
Capı́tulo 5

lla
ci
Principios de probabilidad

an
M
5.1. Introducción.
c.
Li
El interés por los conceptos de la teorı́a de probabilidad y por el cálculo de
I-

probabilidades se remonta al siglo XV II, cuando, en 1654, los matemáticos franceses


a

Blas Pascal (1623 − 1662) y Pierre Fermat (1601 − 1665) formularon la teorı́a de la
tic

probabilidad a través de intercambio de numerosas cartas. Esta importante corres−


ís

pondencia fue promovida por las preguntas que hacı́a a Pascal el filósofo francés y
ad

conocido jugador Antoine Gombaud Chevalier de Méré.


t
Es

71
LIC. EMMA MARTHA MANCILLA FLORES 73

Definición. 5.2. El espacio muestral, es el conjunto de todos los posibles resultados

asociados a un experimento aleatorio dado. Generalmente se lo denota por Ω y a

cada posible resultado ω del experimento se denomina punto muestral.

Ejemplo. 20. El experimento consiste en lanzar dos monedas sobre una mesa y

anotar los resultados de las caras superiores.

lla
Podemos primeramente simbolizar los posibles resultados:

ci
C : El resultado al lanzar la moneda es cara.

an
S : El resultado al lanzar la moneda es sello.

M
Ası́, el espacio muestral se puede apreciar gráficamente en la figura (5.1):
c.
Li
I-
a
tic
ís
ad

Figura 5.1: Diagrama de árbol


t
Es

O también se puede describir como un conjunto:

Ω = {CC, CS, SC, SS} ♦


78 Lic. Emma Mancilla

probabilidades:

3
P (obtener un número par) = P (A) =
6
3
P (obtener un número impar) = P (B) =
6
2
P (obtener un múltiplo de 3) = P (C) = ♦
6

Definición. 5.6. (Definición axiomática de probabilidad.) Sea un experimento aleato-

lla
rio ε y Ω el espacio muestral correspondiente. A cada evento A se le asocia un

ci
número real llamado probabilidad de que ocurra el evento A, designado por P (A),

an
que satisface las siguientes propiedades(axiomas):

M
1. 0 ≤ P (A) ≤ 1

2. P (Ω) = 1
c.
Li

3. P (A B) = P (A) + P (B), si los eventos A y B son mutuamente excluyentes1 .


I-

Propiedad. 5.1. Como consecuencia de la definición anterior, considerando los


a

eventos A,B y C, se establecen las siguientes propiedades, para facilitar el cálculo


tic

de probabilidades:
ís

1. P (φ) = 0; probabilidad del evento imposible.


ad

2. P (Ac ) = 1 − P (A); probabilidad del complemento.


t



Es

3. P (A B) = P (A) + P (B) − P (A B), siendo los eventos A y B cua-

lesquiera.
1
Se dice que los eventos A y B son mutuamente excluyentes si no pueden ocurrir ambos,

A B=φ
LIC. EMMA MARTHA MANCILLA FLORES 79

4. Si A ⊂ B, entonces P (A) ≤ P (B).

5.5. Probabilidad condicional.

Definición. 5.7. Sean A y B dos eventos asociados a un experimento aleatorio. Se

lla
considera que ya ocurrió el evento B y que P (B) > 0. Bajo estas condiciones se

establece la siguiente definición:

ci
Se llama probabilidad condicional de A dado B, y se escribe P (A|B), al cociente que

an
se obtiene dividiendo la probabilidad de la intersección de A y B entre la probabilidad

M
de B:

c.P (A B)
P (A|B) = (5.2)
P (B)
Li
I-

5.6. Regla de multiplicación.


a

De la definición (5.2) se puede obtener:


tic


P (A B)
P (A|B) = =⇒ P (A B) = P (A|B)P (B) (5.3)
ís

P (B)
ad

o

P (A B)
t

P (B|A) = =⇒ P (A B) = P (B|A)P (A) (5.4)


Es

P (A)

La probabilidad de la intersección (realización simultánea) de dos eventos A y B es

igual al producto de la probabilidad condicional de A dado B, por la probabilidad

del evento condicionante B.


LIC. EMMA MARTHA MANCILLA FLORES 81

probabilidad de Ai por la probabilidad condicional (5.2) de B dado Ai ; el denomi-

nador es la suma de productos que se obtienen multiplicando la probabilidad de Ai

por la probabilidad de Ai por la probabilidad condicional de B dado A.

Nota. 9. La exposición del tema, por razones de sencillez, se ha realizado solo con

tres eventos A1 , A2 y A3 , sin embargo, el principio es general y válido para cualquier

lla
número n de eventos Ai .

ci
emmf
c

an
M
c.
Li
I-
a
tic
ís
t ad
Es
Apéndice A

lla
ci
Glosario

an
M
AMPLITUD O RANGO. La diferencia entre el valor máximo y mı́nimo de los
c.
valores de una variable se encuentran comprendidos el 100 % de los valores
Li
muestrales.
I-

CARACTERÍSTICAS. Propiedades de las unidades o elementos que componen


a

las muestras. Se miden mediante variables. Se asume que los individuos pre-
tic

sentan diferentes caracterı́sticas.


ís

COEFICIENTE DE CORRELACIÓN. Estadı́stico que cuantifica la correlación.


ad

Sus valores están comprendidos entre −1 y 1.


t

COEFICIENTES DE REGRESIÓN. En un modelo de regresión lineal son los


Es

valores de a y b que determinan la expresión de la recta de regresión y = a+bx.

COEFICIENTE DE VARIACIÓN. Es una medida de dispersión relativa. No

tiene unidades y se calcula dividiendo la cuasi-desviación tı́pica entre la media

83
84 APÉNDICE A. GLOSARIO

muestral. Se suele expresar en tanto por ciento.

CORRELACIÓN. Expresa la concordancia entre dos variables según el sentido

de la relación de éstas en términos de aumento ó disminución.

COVARIANZA. Expresa la media del producto de las desviaciones de dos vari-

ables en relación a su media.

lla
DESCRIPTIVA. Parte de la estadı́stica que resume la información de la muestra.

ci
La información recogida y resumida en los estadı́sticos se usa para la estimación

an
de parámetros poblacionales.

M
DESVIACIÓN ESTÁNDAR (TÍPICA). Caracterı́stica de una muestra o población

que cuantifica su dispersión o variabilidad. Tiene las mismas unidades que la


c.
variable. La desviación tı́pica es invariante con respecto al origen de la dis-
Li
tribución. Su cuadrado es la varianza.
I-

DIAGRAMA DE PUNTOS. Es un gráfico bidimensional o tridimensional que


a

muestra la variación de los valores muestrales de dos o tres variables.


tic

DIAGRAMAS DE BARRAS. Representación gráfica para las variables discre-


ís

tas o cualitativas.
ad

DISTRIBUCIÓN DE DATOS. En la realización de un experimento, corresponde


t

a la recolección de los datos experimentales para cada individuo y cada variable.


Es

DISTRIBUCIÓN NORMAL O DE GAUSS. Es una distribución teórica de

probabilidad que se usa tanto en la estadı́stica aplicada como en la teórica.

Aparece en la práctica con mucha frecuencia como consecuencia del impor-


LIC. EMMA MARTHA MANCILLA FLORES 85

tante resultado que establece el teorema central del lı́mite. Tiene una forma

de campana y viene caracterizada por únicamente dos valores: La media y la

varianza.

ESCALA. La distribución de datos puede recogerse en distintas escalas: nominal,

dicotómica, discreta o continua.

lla
ESTADÍSTICOS. Son funciones de la muestra. Su valor variará según la muestra,

ci
pero nos permite hacer estimaciones de parámetro poblacionales o construir

an
estadı́sticos experimentales para tomar decisiones.

M
ESTADÍSTICOS DE CENTRALIDAD. Son estadı́sticos que nos resumen la

información acerca del valor donde parece concentrarse la distribución de datos.


c.
ESTADÍSTICOS DE DISPERSIÓN. Son estadı́sticos que nos resumen la in-
Li
formación de la muestra dándonos información acerca de la magnitud del ale-
I-

jamiento de la distribución de datos en relación a un valor central o de concen-


a

tración de los datos.


tic

ESTADÍSTICOS DE FORMA. Son aquellos que nos hablan de la forma de la


ís

distribución de datos en cuanto a su simetrı́a y su apuntamiento.


ad

FRECUENCIAS: ABSOLUTAS, RELATIVAS. Las frecuencias absolutas re-


t
Es

presentan el recuento de los valores de una variable de forma que su suma nos

da el tamaño muestral. Las relativas son las absolutas divididas por el tamaño

muestral. Las frecuencias relativas sumarán 1 ó 100 según se expresen en tanto

por uno o en tanto por ciento.


86 APÉNDICE A. GLOSARIO

HISTOGRAMAS. Es un gráfico en forma de barras de una variable continua que

se ha discretizado en intervalos, de forma que la altura de las barras en cada

intervalo indica la frecuencia relativa en éste.

MEDIANA. Corresponde al percentil 50 %. Es decir, la mediana hace que haya

un 50 % de valores muestrales inferiores a ella y un 50 % de valores muestrales

lla
superiores a ella.

ci
MEDIA. Es una medida de centralidad para una variable cuantitativa. Se obtiene

an
sumando todos los valores muestrales y dividiéndolos por el tamaño muestral.

MODA. Es el valor que más se repite en una variable .

M
OBSERVACIÓN. Sinónimo de caso, registro e individuo.
c.
RANGO. Diferencia entre el valor máximo y mı́nimo de una muestra o población.
Li
Solo es válido en variables cuantitativas.(Amplitud)
I-

RECTA DE REGRESIÓN. Es el modelo que sirve para explicar una variable


a

respuesta en términos de un único factor o variable explicativa.


tic

REGRESIÓN. Técnica estadı́stica que relaciona una variable dependiente (Y )


ís

con la información suministrada por otra variable independiente (X); ambas


ad

variables deben ser cuantitativas. Si asumimos relación lineal, utilizaremos la


t

regresión lineal simple. Entre las restricciones se incluyen: Los residuos deben
Es

ser normales; las observaciones independientes; la dispersión de los residuos

debe mantenerse a lo largo de la recta de regresión.

SIMETRÍA. Es una medida que refleja si los valores muestrales se extienden o no


LIC. EMMA MARTHA MANCILLA FLORES 87

de igual forma a ambos lados de la media.

TAMAÑO MUESTRAL. Número de individuos u observaciones que componen

la muestra.

UNIDAD. Concepto primario relacionado con los componentes elementales de la

muestra estadı́stica. Sinónimo, pero no esencialmente idéntico, de caso, obser-

lla
vación, registro o individuo.

ci
VARIABLE. Caracterı́stica de la unidad que puede tomar diferentes valores. Ge-

an
neralmente asociado a propiedades o caracterı́sticas de las unidades de la mues-

M
tra.

VARIANZA. Caracterı́stica de una muestra o población que cuantifica su dis-


c.
persión o variabilidad. La varianza tiene unidades al cuadrado de la variable.
Li
Su raı́z cuadrada positiva es la desviación tı́pica. La varianza muestral es un
I-

estimador sesgado de la varianza poblacional.


a

emmf
c
tic
ís
t ad
Es

También podría gustarte