Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CONTADURÍA PÚBLICA
ESTADÍSTICA I
(DOSSIER)
LIC. EMMA MARTHA MANCILLA FLORES
La Paz-Bolivia
Febrero, 2012
Índice general
lla
ci
1. El papel de la Estadı́stica. 7
an
1.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
M
1.2. Algunas definiciones. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.4. Variable. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
tic
1.3.5. Datos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
ís
3
4 ÍNDICE GENERAL
lla
2.4.1. Gráfico de frecuencias de barras . . . . . . . . . . . . . . . . . . . . 29
ci
2.4.2. Polı́gono de frecuencia . . . . . . . . . . . . . . . . . . . . . . . . . 29
an
3. Análisis Descriptivo Univariante 31
M
3.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
c.
3.2. Medidas de Posición o tendencia Central. . . . . . . . . . . . . . . . . . . . 32
Li
3.2.1. Media Aritmética . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
I-
3.2.2. La Mediana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2.3. La Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
a
tic
4. Distribuciones bivariantes 49
4.2.2. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
lla
4.3.1. Diagrama de dispersión . . . . . . . . . . . . . . . . . . . . . . . . . 64
ci
4.3.2. Coeficiente de correlación lineal. . . . . . . . . . . . . . . . . . . . . 65
an
4.4. Regresión lineal simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
M
5. Principios de probabilidad 71
c.
5.1. Introducción. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Li
5.2. Aleatoriedad. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
I-
A. Glosario 83
t
Es
6 ÍNDICE GENERAL
Resumen
lla
ción estadı́stica que permita respaldar la toma de decisiones del futuro Contador.
ci
an
Por ello , que el presente trabajo servirá como instrumento de referencia para los
M
propiedades, relaciones de suma importancia, adicionando ejercicios resueltos y propues-
c.
tos. Por lo cual se encuentra actualmente en una revisión para cubrir el programa sugerido
Li
para la Gestión 2011.
I-
razonamientos.
ad
Adam Schaff
t
Es
Capı́tulo 1
lla
ci
El papel de la Estadı́stica.
an
M
1.1. Introducción c.
Li
Muchas de las decisiones que usted, su médico o los ministros de gobierno toman a
I-
casos. Una muestra de sangre es suficiente para decir miles de cosas sobre la totalidad de la
ís
sangre de su cuerpo. ¿Las estadı́sticas obtenidas a partir de una gota de sangre, algunos
ad
7
8 CAPÍTULO 1. EL PAPEL DE LA ESTADÍSTICA.
organización ası́ como en los sectores agrı́cola y forestal, donde se requiere predicciones de
datos numéricos. La Estadı́stica (en singular) como una disciplina académica se la podrı́a,
lla
en principio, definir como la ciencia que provee los métodos para analizar e interpretar
ci
datos numéricos y por lo tanto tener conocimiento de sus herramientas serı́a de utilidad en
an
muchos campos. Al iniciar el desarrollo de algunos temas de Estadı́stica parece conveniente
M
dar una definición un poco más precisa de lo que se entiende por esta disciplina, que ayude
c.
a comprender su utilidad. Algunas de las preguntas que se contestarán en el desarrollo de
Li
esta unidad son:
I-
¿Qué es la estadı́stica?,
a
¿Cómo funciona?
tic
Kennedy-Neville.
lla
copilación, presentación y análisis de los datos y para el uso de tales datos ”.”Neter-
ci
Waserman.
an
“La Estadı́stica es la ciencia que se ocupa de la recopilación, tabulación, análisis,
M
interpretación y presentación de datos cuantitativos ”. D.H.Besterfield.
c.
“La Estadı́stica es un campo de ensayo en el que se recogen y analizan los datos
Li
con el propósito de sacar conclusiones . . . . . . proporciona instrumentos para la toma
I-
población, seleccionar una muestra, reconocer los elementos o bien las unidades de
ís
observación de ella y decidir qué mediciones pueden hacerse y los tratamientos (si
ad
ciones correctas de los datos resultantes, de tal forma que sea posible ilustrar una
Es
mación (datos) hasta las conclusiones, siempre con relación a los objetivos. Los métodos
lla
terı́sticas propias de dicho estudio. De aquı́ que, antes de presentar algunos métodos de
ci
an
1.3.1. Población.
M
La palabra población se usa en el lenguaje cotidiano para significar todas las personas
c.
que viven en una determinada región geográfica, frecuentemente en un paı́s. En estadı́stica
Li
el término población se usa con distintos significados y con sentidos más amplios.
I-
animales, cosas) de interés para el estudio y otra se asocia a los valores de la o las
a
tic
Si se usa población bajo estudio para referirse a los individuos u objetos, entonces:
ad
está interesado.
Es
los diabéticos.
sexo, capital de una empresa, perı́odo de tiempo, etc.) , mediante un lugar fı́sico donde
los individuos habitan o concurren por algún motivo (escuela, servicio de salud, fabrica,
lla
etc.).
ci
Ejemplo. 4. Si el interés es conocer la producción diaria de una fábrica de tornillos, la
an
población es todos los posibles valores de producción diaria en aquella fábrica en un dado
M
perı́odo de tiempo.
c.
Cuando los integrantes de una población pueden ser listados, es decir, se puede con-
Li
feccionar una lista de los individuos u objetos que componen la población, aunque ella
I-
sea muy grande, entonces se dice que se tiene una población finita.
a
Ejemplo. 5. Todos los niños una ciudad entre 10 y 14 años, aunque en la práctica esto
tic
Existen otras situaciones donde los integrantes de la población no pueden ser listado,
ad
por ejemplo, si se trata de comparar dos polı́ticas de venta de un producto, es claro, que lo
t
Es
que se pretende es que las polı́ticas de venta se puedan aplicar a futuros productos (todos
en el momento del estudio hacer una lista de ellos, en tales casos se dirá que nuestra
finitas, ellas deben estar claramente definidas a través de los criterios de inclusión y
exclusión.
Pero cuando el estudio intenta sacar conclusiones hacia una población hipotética lo que
se debe describir son las caracterı́sticas del grupo sobre los cuales se quiere trabajar.
lla
1.3.2. Muestra.
ci
Si las poblaciones a estudiar contienen un número de individuos que hace imposible
an
analizarlos en su totalidad, entonces, en lugar de observar a todos los elementos de esa
M
población, se podrı́a seleccionar un subconjunto (una parte) de ella y usar la información
c.
de este subconjunto para conocer algo sobre la población. Ası́:
Li
Definición. 1.3. Una muestra se puede definir como un subconjunto o parte represen-
I-
Es la :
ís
ad
de 1, 5lt.
14 CAPÍTULO 1. EL PAPEL DE LA ESTADÍSTICA.
1.3.4. Variable.
Es una:
lla
Ejemplo. 7. Edad, sexo, ingresos mensuales, tipos de viviendas, etc.
ci
1.3.5. Datos.
an
Usando el concepto de variable, una definición formal de dato serı́a:
M
Se denomina datos a los valores observados o medidos de una variable y constituyen
c.
la información disponible.
Li
I-
Existen diferentes métodos estadı́sticos que se aplican en cada una de estas etapas. Lo que
tadı́stica inferencial es el proceso de usar los datos de la muestra para sacar conclusiones
ad
idad de las observaciones. Este punto es crucial ya que si uno no esta convencido de que
los datos son variables por si solos, o sea que dos cosas o personas no son exactamente
promedio de un curso y suponemos que todos son exactamente iguales, con solo tomar
LIC. EMMA MARTHA MANCILLA FLORES 15
uno de ellos se tiene la información de todos los alumnos, y por consiguiente es suficiente
para saber el resultado. En este caso la estadı́stica no interviene para nada. El papel de
la estadı́stica toma parte cuando se reconoce la existencia de variabilidad entre los datos.
emmf
c
lla
ci
an
M
c.
Li
I-
a
tic
ís
t ad
Es
Capı́tulo 2
lla
ci
Organización y resumen de
an
M
datos(univariante)
c.
Li
La Estadı́stica Descriptiva formula reglas y procedimientos para la presentación de
I-
una masa de datos en una forma más útil y significativa. Establece normas para la rep-
a
resentación de los datos. Siendo una base importante para el análisis en casi todas las
tic
disciplinas académicas.
ís
t ad
Es
17
LIC. EMMA MARTHA MANCILLA FLORES 27
2.5,
lla
ci
Figura 2.5: Tres intervalos de amplitud constante.
an
M
Esto es, salvo el primer intervalo que es cerrado en ambos extremos, en los otro
intervalos será abierto por la izquierda y cerrado por la derecha. Abierto por la
c.
izquierda significa que el intervalo no incluye a ese extremo izquierdo; y cerrado por
Li
la derecha significa que incluye al extremo derecho de ducho intervalo.
I-
tadı́sticos.
lla
en torno a un valor central, variaciones cı́clicas, estacionales y otras caracterı́sticas.
ci
an
Existe una gran variedad de gráficos estadı́sticos. En esta sección se va a estudiar el
más sencillo de todos, el gráfico de frecuencias, en el entendido que otro tipo de gráfi-
M
co su construcción será análoga. Supongamos que tenemos la tabla de frecuencias,
lla
ci
an
Análisis Descriptivo Univariante
M
c.
Li
3.1. Introducción.
I-
utilizar ciertos valores que estiman algunas de sus caracterı́sticas. A tales valores se
ís
ad
• Medidas de Posición;
• Medidas de Dispersion, y
• Medidas de Forma.
31
32 CAPÍTULO 3. ANÁLISIS DESCRIPTIVO UNIVARIANTE
el menor valor del conjunto de datos; razón por la que reciben este nombre. Las más
usadas son:
lla
• La Media Aritmética (denotada por X);
ci
• La Mediana (Me ), y
an
• La Moda (Mo ).
M
Medidas de las cuales a continuación se proporcionarán, su definición,caracterı́sticas,
c.
en los casos de tener datos simples y datos agrupados; sus ventajas y desventajas.
Li
I-
x1 + x 2 + x3 + . . . + xn
x̄ = (3.1)
n
Por otra parte, si suponemos que de estas n observaciones en realidad hay solamente
k que son distintas entre ellas, de modo que entonces podemos tener la tabla3.1:
LIC. EMMA MARTHA MANCILLA FLORES 41
De modo que :
Δ1
Mo = Li−1 + ci (3.6)
Δ1 + Δ2
Donde:
lla
2. Δ1 = ni − ni−1 .
ci
3. Δ2 = ni − ni+1 .
an
4. ci representa la amplitud de la clase modal.
M
c.
Ejemplo. 15. En la distribución de frecuencias siguiente calcular la Moda
Li
intervalo ni
I-
40 – 46 4
a
46 – 52 5
tic
52 – 58 7
ís
58 – 64 6
ad
64 – 70 3
Total 25
t
Es
Δ1
Mo = Li−1
+ ci
Δ1 + Δ2
2
= 52 + ·6
2+1
= 55,9
lla
Ventajas y Desventajas
ci
an
1. Cuando se necesita una estimación rápida, de la tendencia central.
M
2. Cuando se desea conocer el punto de máxima frecuencia en una distribución .
c.
3. En general la moda es la menos usada de las tres medidas.
Li
I-
(media, mediana y moda). Sin embargo se debe tener una noción en cuanto a la
ís
relación existente entre estas observaciones, una medida de cuan alejada está una
ad
determinada observación del resto, o de una medida de disgregación que tienen estas
t
Es
es el rango de las observaciones. Pero es claro que esta medida presenta varios
la mayor, de modo que no puede ser muy fiable toda vez que uno de estos valores
LIC. EMMA MARTHA MANCILLA FLORES 43
una observación nueva sea mayor o menor que el resto de las anteriores para que el
rango aumente.
lla
De manera es más conveniente otras medidas de dispersión. Tales como:
ci
an
• La Desviación Estándar, SX ,
M
• El Coeficiente de Variación CVX .
c.
Pero antes se debe mencionar a la Varianza.
Li
2
Definición. 3.4. La cantidad SX se llama varianza (muestral) y tiene un valor
I-
n
tic
k
2 i=1 (xi − x̄)2 ni
t
SX =
Es
Propiedades de la Varianza.
izquierda una cola más larga, se dice sesgada a la izquierda o de sesgo negativo.
Coeficientes de Pearson.
(x − M o
Cas = SX
)
lla
o
ci
3(X − M e
Cas = SX
an
)
M
Los resultados de cualquiera de los coeficientes de asimetrı́a Ca s, se pueden
interpretar como:
c.
Li
⎧
⎪
⎪
⎪
⎪ < 0, Asimetrı́a negativa
⎪
⎨
I-
Asimetrı́apositiva.
tic
• La Curtosis.
ís
ad
curtosis.
48 CAPÍTULO 3. ANÁLISIS DESCRIPTIVO UNIVARIANTE
Coeficiente de Curtosis
lla
se interpretan como: ⎧
⎪
⎪
ci
⎪
⎪ < 3, Platicurtica
⎪
⎨
an
K= = 3, Mesocurtica
⎪
⎪
⎪
⎪
⎪
⎩ > 3, Leptocurtica.
M
c.
Li
I-
a
tic
ís
t ad
Es
Capı́tulo 4
lla
ci
an
Distribuciones bivariantes
M
c.
Las distribuciones bidimensionales o bivariantes son aquellas en las que se
Li
estudian al mismo tiempo dos variables (X, Y ) de cada elemento de la población o
I-
muestra.
a
Para representar los datos obtenidos se utiliza una tabla (4.3)de doble entrada :
49
50 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES
Y y1 y2 ... ym−1 ym
lla
x(k−1) n(k−1)1 n(k−1)2 ... n(k−1)(m−1) n(k−1)m
ci
xk nk1 nk2 ... nk(m−1) nkm
an
Cuadro 4.1: Tabla de doble entrada.
M
1. La frecuencia relativa del par , (xi , yi ) la denotamos por fij :
c. nij
fij =
n
Li
I-
y
a
k
m
tic
fij = 1
i=1 j=1
ís
ad
k
m
Es
nij = n
i=1 j=1
Las xi representan una de las variables y las yj la otra variable. En cada intersección
56 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES
m
fi• = fij
j=1
k
f•j = fij
i=1
k
m
fi• = f•j = 1
lla
i=1 j=1
ci
an
portamiento de una de las variables, con independencia de como se comporta la
M
De cada distribución bidimensional se pueden deducir dos distribuciones marginales:
c.
Li
1. Una correspondiente a la variable X.
I-
Ejemplo. 19. A partir del ejemplo anterior en el que se vió la serie con los pesos
xi ni·
(Variable) (Frec.Marginal)
x1 n1·
x2 n2·
x3 n3·
.. ..
lla
. .
ci
xk nk·
an
Cuadro 4.4: Distribución marginal de la variable Y .
M
Las variables marginales se comportan como variables unidimensionales, por lo que
lla
Peso (Kg.) 31 32 33 34 35 ni•
Estatura(m.)
ci
an
1.21 1 2 3
1.22 1 1 1 3
M
1.24 2 1 3
1.25
c.
1 1 1 3
Li
1.27 2 1 2 1 6
I-
1.28 1 1 1 3
1.29 3 1 1 1 6
a
1.30 2 1 3
tic
n•j 6 6 6 7 5 30
ís
Cuadro 4.6: Tabla de distribución conjunta del Peso y Estatura de los estudiantes.
t ad
Es
60 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES
1.21 3 0.10
1.22 3 0.10
1.24 3 0.10
1.25 3 0.10
lla
1.27 6 0.20
ci
1.28 3 0.10
an
1.29 6 0.20
1.30 3 0.10
M
30 1
c.
Cuadro 4.7: Distribución marginal de la estatura (cm.)
Li
4.2.1. Medias y Varianzas Marginales
I-
cada variable por separado, se puede aplicar las mismas expresiones utilizadas en
distribuciones unidimensionales.:
ís
ad
Medias Marginales.
t
Se tienen:
Es
• Para la variable X:
k
i=1 xi ni·
x̄ = (4.1)
n
64 CAPÍTULO 4. DISTRIBUCIONES BIVARIANTES
k m
i=1 j=1 (xi yj ) nij
Cov(x, y) = − x̄ȳ; (Datos agrupados) (4.8)
n
lla
Propiedad. 4.4.
ci
Cov(ax + b , cy + d) = acCov(x , y); para a, b, c, d ∈ R.
an
M
4.3. Correlación Lineal.
c.
En una distribución bidimensional puede ocurrir que las dos variables guarden algún
Li
tipo de relación entre si, la cual se trata de determinar, en base a algunos instru-
I-
en la figura(4.1).
LIC. EMMA MARTHA MANCILLA FLORES 65
lla
ci
an
M
Figura 4.1: Algunos comportamientos de forma conjunta.
4.3.2.
c.
Coeficiente de correlación lineal.
Li
Mide el grado de intensidad de esta posible relación entre las variables. Este coefi-
I-
ciente se aplica cuando la relación que puede existir entre las variables es lineal ,es
a
decir, si representamos en un gráfico los pares de valores de las dos variables la nube
tic
No obstante, puede que exista una relación que no sea lineal, sino exponencial,
ad
intensidad de la relación entre las variables, por lo que convendrı́a utilizar otro tipo
de coeficiente más apropiado. Para ver, por tanto, si se puede utilizar el coeficiente
lla
ci
an
Figura 4.3: Diagrama de dispersión, de las variables X e Y .
M
Donde y serı́a la variable dependiente, es decir, aquella que viene definida a partir
c.
de la otra variable x variable independiente) Para definir la recta se debe determinar
Li
los valores de los parámetros a y b:
I-
nación.
t
Es
La regresión lineal nos permite calcular el valor de estos dos parámetros, definiendo
la recta que mejor se ajusta a esta nube de puntos (Método de mı́nimos cuadrados).
Cov(x, y) 2
b̂ = 2
; SX >0 (4.11)
SX
X.
lla
• El parámetro a viene determinado por:
ci
â = ȳ − b̂ x̄ (4.12)
an
Luego la ecuación(4.10), se puede expresar como:
M
Cov(x, y)
y = ȳ + c.
2
(x − x̄)
SX
Li
llamada también recta de mı́nimos cuadrados de y en x.
I-
1. Lı́nea recta :Y = a + bX
ís
2. Parábola: Y = a + bX + cX 2
ad
3. Curva potencial: Y = bX a
t
Es
a
5. Hipérbola : Y = X
1
6. Curva logı́stica : Y
= a + bcX
Capı́tulo 5
lla
ci
Principios de probabilidad
an
M
5.1. Introducción.
c.
Li
El interés por los conceptos de la teorı́a de probabilidad y por el cálculo de
I-
Blas Pascal (1623 − 1662) y Pierre Fermat (1601 − 1665) formularon la teorı́a de la
tic
pondencia fue promovida por las preguntas que hacı́a a Pascal el filósofo francés y
ad
71
LIC. EMMA MARTHA MANCILLA FLORES 73
Ejemplo. 20. El experimento consiste en lanzar dos monedas sobre una mesa y
lla
Podemos primeramente simbolizar los posibles resultados:
ci
C : El resultado al lanzar la moneda es cara.
an
S : El resultado al lanzar la moneda es sello.
M
Ası́, el espacio muestral se puede apreciar gráficamente en la figura (5.1):
c.
Li
I-
a
tic
ís
ad
probabilidades:
3
P (obtener un número par) = P (A) =
6
3
P (obtener un número impar) = P (B) =
6
2
P (obtener un múltiplo de 3) = P (C) = ♦
6
lla
rio ε y Ω el espacio muestral correspondiente. A cada evento A se le asocia un
ci
número real llamado probabilidad de que ocurra el evento A, designado por P (A),
an
que satisface las siguientes propiedades(axiomas):
M
1. 0 ≤ P (A) ≤ 1
2. P (Ω) = 1
c.
Li
de probabilidades:
ís
Es
lesquiera.
1
Se dice que los eventos A y B son mutuamente excluyentes si no pueden ocurrir ambos,
A B=φ
LIC. EMMA MARTHA MANCILLA FLORES 79
lla
considera que ya ocurrió el evento B y que P (B) > 0. Bajo estas condiciones se
ci
Se llama probabilidad condicional de A dado B, y se escribe P (A|B), al cociente que
an
se obtiene dividiendo la probabilidad de la intersección de A y B entre la probabilidad
M
de B:
c.P (A B)
P (A|B) = (5.2)
P (B)
Li
I-
P (A B)
P (A|B) = =⇒ P (A B) = P (A|B)P (B) (5.3)
ís
P (B)
ad
o
P (A B)
t
P (A)
Nota. 9. La exposición del tema, por razones de sencillez, se ha realizado solo con
lla
número n de eventos Ai .
ci
emmf
c
an
M
c.
Li
I-
a
tic
ís
t ad
Es
Apéndice A
lla
ci
Glosario
an
M
AMPLITUD O RANGO. La diferencia entre el valor máximo y mı́nimo de los
c.
valores de una variable se encuentran comprendidos el 100 % de los valores
Li
muestrales.
I-
las muestras. Se miden mediante variables. Se asume que los individuos pre-
tic
83
84 APÉNDICE A. GLOSARIO
lla
DESCRIPTIVA. Parte de la estadı́stica que resume la información de la muestra.
ci
La información recogida y resumida en los estadı́sticos se usa para la estimación
an
de parámetros poblacionales.
M
DESVIACIÓN ESTÁNDAR (TÍPICA). Caracterı́stica de una muestra o población
tas o cualitativas.
ad
tante resultado que establece el teorema central del lı́mite. Tiene una forma
varianza.
lla
ESTADÍSTICOS. Son funciones de la muestra. Su valor variará según la muestra,
ci
pero nos permite hacer estimaciones de parámetro poblacionales o construir
an
estadı́sticos experimentales para tomar decisiones.
M
ESTADÍSTICOS DE CENTRALIDAD. Son estadı́sticos que nos resumen la
presentan el recuento de los valores de una variable de forma que su suma nos
da el tamaño muestral. Las relativas son las absolutas divididas por el tamaño
lla
superiores a ella.
ci
MEDIA. Es una medida de centralidad para una variable cuantitativa. Se obtiene
an
sumando todos los valores muestrales y dividiéndolos por el tamaño muestral.
M
OBSERVACIÓN. Sinónimo de caso, registro e individuo.
c.
RANGO. Diferencia entre el valor máximo y mı́nimo de una muestra o población.
Li
Solo es válido en variables cuantitativas.(Amplitud)
I-
regresión lineal simple. Entre las restricciones se incluyen: Los residuos deben
Es
la muestra.
lla
vación, registro o individuo.
ci
VARIABLE. Caracterı́stica de la unidad que puede tomar diferentes valores. Ge-
an
neralmente asociado a propiedades o caracterı́sticas de las unidades de la mues-
M
tra.
emmf
c
tic
ís
t ad
Es