Antologia Estadística II Cescijuc

CENTRO DE ESTUDIOS SUPERIORES EN CIENCIAS JURIDICAS Y
CRIMINOLOGICAS
LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS
ESTADÍSTICA II
CUARTO CUATRIMESTRE
ENRIQUE RUIZ MONTOYA

“Las lecturas que se presentan en este compilado son una digitalización de las
fuentes originales y se reproducen solo con propósitos educativos sin
obtener algún lucro conforme a lo establecido en los artículos 151, 1470 y
1480 en la Fracción I y III de la Ley Federal de los Derechos de Autor”.
Ley Federal de Derecho de Autor.
PRESENTACIÓN
Uno de los objetivos es promover, apoyar e impulsar el trabajo creativo de maestros y
estudiantes, principalmente en material didáctico cuya finalidad sea de beneficio para el
proceso de enseñanza aprendizaje.
El programa de fomento para elaboración de antologías complementa la selección y

material diseñado por decentes para su uso en el sistema educativo de su institución,
seleccionando, publicando y divulgando las obras que por su experiencia son el
producto de esfuerzo en mejorar la enseñanza aprendizaje del ejercicio docente.
Este material es de apoyo y consulta didáctica, se pone al alcance de maestros y

alumnos que se forman en nuestra institución. Con el deseo que sea de gran utilidad en
el proceso de enseñanza – aprendizaje.
ESTADÍSTICA II
La estadística ha estado a través del tiempo junto a la capacidad del ser humano de
crear nuevas formas de analizar o calcular diversos objetos, desde que existe la
administración esta ha estado en conjunto con la estadística utilizándola como
herramienta para realizar importantes avances de datos recopilados de experimentos
de uno u otro tipo, esta ha estado desde tiempos milenarios, y se asocia que los
primeros que la utilizaron fueron los egipcios quienes contabilizaban sus productos y
comercio como también para encontrar una relación con la muerte para observar cómo
se comportaba esta.
La estadística es una herramienta básica en negocios y producción. Es usada para

entender la variabilidad de sistemas de medida, control de procesos, así como el control
estadístico de procesos, para compilar datos y para tomar decisiones. En estas
aplicaciones es una herramienta vital, y seguramente la única disponible. La
importancia en la participación de la industria radica en el aumento de la calidad, ya que
las técnicas estadísticas pueden emplearse para describir y comprender la variabilidad,
que es el resultado de cambios en las condiciones bajo las que se hacen las
observaciones.
En la mayoría de los cálculos existe algún tipo de incertidumbre o error humano,

entonces la estadística intenta brindar cálculos e información con mayor exactitud,
además se le agrega una herramienta que ha surgido con una gran eficacia llamada
computadoras que por medio de diversas aplicaciones existentes en la actualidad
puede hacer que cualquier persona pueda hacer su propio procedimiento. Behar,
Klinger & Olaya (2002) expresan: “En ingeniería puede preferirse una solución que no
es la óptima absoluta, pero que se aproxima bastante bien a los requerimientos, si ésta
es mucho más rápida y/o barata que la óptima”.
TEMAS Y SUBTEMAS
TEMA I CARACTERÍSTICAS DE LAS DISTRIBUCIONES
1.1 Transformaciones de variables y métodos abreviados.
1.2 Puntuaciones Stándard.
1.3 Coeficiente de Bearson.
Tema II CORRELACIÓN LINEAL

2.1 Distribuciones Conjuntas.
2.2 Correlación lineal, coeficientes de correlación y determinación.
2.3 Concepto de distribución divariada.
Tema III REGRESIÓN LINEAL.

3.1 Métodos de mínimos cuadrados.
3.2 Métodos abreviados.
3.3 Funciones de regresión.
3.4 Error Standard de estimación.
Tema IV ÍNDICE
4.1 Simples, elaborados y compuestos.
4.2 Cambios de base.
4.3 Cambios de series.
Tema V SERIES DE TIEMPO

5.1 Componentes de tendencia, siglo, estacionalidad e irregularidad.
Uno de los objetivos de la estadística es el conocimiento cuantitativo de una
determinada parcela de la realidad. Para ello, es necesario construir un modelo de esta
realidad particular objeto de estudio, partiendo de la premisa de que lo real es siempre
más complejo y multiforme que cualquier modelo que se pueda construir. De todas
formas, la formulación de modelos aceptados por las instituciones responsables y por
los usuarios, permite obviar la existencia del error o distancia entre la realidad y el
modelo.
Los modelos teóricos a los que se hace referencia se reducen en muchos casos a (o
incluyen en su formulación) funciones de probabilidad. La teoría de la probabilidad tiene
su origen en el estudio de los juegos de azar, que impulsaron los primeros estudios
sobre cálculo de probabilidades en el siglo XVI, aunque no es hasta el siglo XVIII
cuando se aborda la probabilidad desde una perspectiva matemática con la
demostración de la “ley débil de los grandes números” según la cual, al aumentar el
número de pruebas, la frecuencia de un suceso tiende a aproximarse a un número fijo
denominado probabilidad. Este enfoque, denominado enfoque frecuentista, se modela
matemáticamente en el siglo XX cuando el matemático ruso Andrei Nikolaevich
Kolmogorov (1903 - 1987) formula la teoría axiomática de la probabilidad.
Dicha teoría define la probabilidad como una función que asigna a cada posible
resultado de un experimento aleatorio un valor no negativo, de forma que se cumpla la
propiedad aditiva. La definición axiomática establece las reglas que deben cumplir las
probabilidades, aunque no asigna valores concretos.
Uno de los conceptos más importantes de la teoría de probabilidades es el de variable

aleatoria que, intuitivamente, puede definirse como cualquier característica medible que
toma diferentes valores con probabilidades determinadas. Toda variable aleatoria posee
una distribución de probabilidad que describe su comportamiento. Si la variable es
discreta, es decir, si toma valores aislados dentro de un intervalo, su distribución de
probabilidad especifica todos los valores posibles de la variable junto con la
probabilidad de que cada uno ocurra. En el caso continuo, es decir, cuando la variable
puede tomar cualquier valor de un intervalo, la distribución de probabilidad permite
determinar las probabilidades correspondientes a subintervalos de valores. Una forma
usual de describir la distribución de probabilidad de una variable aleatoria es mediante
la denominada función de densidad en el caso de variables continuas y función de
masa de probabilidad en el caso de variables discretas, en tanto que lo que se conoce
como función de distribución representa las probabilidades acumuladas.
Una distribución de probabilidad es aquella que permite establecer toda la gama de
resultados probables de ocurrir en un experimento determinado. Es decir, describe la
probabilidad de que un evento se realice en el futuro.
La distribución de probabilidad es una herramienta fundamental para la prospectiva,
puesto que con ella es posible diseñar un escenario de acontecimientos futuros
considerando las tendencias actuales de diversos fenómenos.
Las características más importantes a considerar en una distribución de probabilidad
son:
La probabilidad de un resultado específico está entre cero y uno.

La suma de las probabilidades de todos los resultados mutuamente excluyentes
es 1.
Toda distribución de probabilidad se genera por una variable (debido a que puede
tomar diferentes valores) aleatoria x (porque el valor que se toma es completamente al
azar), y puede ser de dos tipos:
1. Variable aleatoria discreta (x)
Solo puede tomar valores representados por números enteros y un número finito de
ellos. Por ejemplo:
X variable que nos define el número de alumnos aprobados en el curso de historia

universal en un grupo de 30 alumnos (1, 2 ,3 y así sucesivamente ó los 30).
2. Propiedades de una variable aleatoria discreta (X)
Las probabilidades que se relacionan con cada uno de los valores que toma x deben
ser mayores o iguales a cero y menores o iguales a 1: P (xi) < 1
La sumatoria de las probabilidades asociadas a cada uno de los valores que toma x
debe ser igual a 1: E p (xi) = 1
Ejemplo de variable aleatoria discreta: Al lanzar una moneda se puede obtener solo dos
resultados: cara (50%) o sello (50%).
En la siguiente tabla vemos los posibles resultados de lanzar dos veces una moneda:
Si realizamos la tabla de distribución del número posible de caras que se obtiene al

lanzar una moneda dos veces, obtendremos:
Variable aleatoria continua (x)

Esta puede tomar tanto valores expresados en números enteros como fraccionarios y
un número infinito de ellos dentro de un mismo intervalo. Por ejemplo:
x es la variable que nos define la concentración en gramos de oro de algunas muestras
de mineral (7.4 gr, 6.1, 1.9, 23.3, 12.7, 8.1, 9.5, 11.8, ... n)
Propiedades de una variable aleatoria discreta (X)
Las probabilidades vinculadas a cada uno de los valores que toma x deben ser mayores
o iguales a cero. Dicho de otro modo: la función de densidad de probabilidad deberá
tomar solo valores mayores o iguales a cero.
El área definida bajo la función de densidad de probabilidad deberá ser de 1.
Esperanza matemática o valor esperado
El valor esperado de una variable aleatoria X es el promedio ponderado de todos los
valores posibles.
La esperanza matemática o valor esperado de una variable aleatoria se origina en los
juegos de azar, debido a que los apostadores deseaban saber su esperanza de ganar
repetidamente un juego. Por lo tanto, el valor esperado representa la cantidad de dinero
promedio que el jugador está dispuesto a ganar o perder después de un número grande
de apuestas.
Coeficiente de correlación lineal

La correlación, también conocida como coeficiente de correlación lineal (de Pearson),
es una medida de regresión que pretende cuantificar el grado de variación conjunta
entre dos variables.
Por tanto, es una medida estadística que cuantifica la dependencia lineal entre dos
variables, es decir, si se representan en un diagrama de dispersión los valores que
toman dos variables, el coeficiente de correlación lineal señalará lo bien o lo mal que el
conjunto de puntos representados se aproxima a una recta.
De una forma menos coloquial, la podemos definir como el número que mide el grado
de intensidad y el sentido de la relación entre dos variables.
Siendo:
Cov (x;y): la covarianza entre el valor «x» e «y».
σ(x): desviación típica de «x».
σ(y): desviación típica de «y».
Valores que puede tomar la correlación
ρ = -1 Correlación perfecta negativa
ρ=0 No existe correlación
ρ = +1 Correlación perfecta positiva
Hablamos de correlación positiva si siempre que el valor «x» sube, el valor «y» sube, y
además con la misma intensidad (+1).
En el caso opuesto, si siempre que el valor «x» sube, y el valor «y» baja, y además con
la misma intensidad, entonces estamos hablando de correlación negativa (-1).
Es importante saber que esto no quiere decir que lo hagan en la misma proporción
(salvo que tengan la misma desviación típica).
Representación gráfica de la correlación
Correlación perfecta positiva:
No hay correlación:
Correlación perfecta negativa:

Consejo: en muchas ocasiones, no tenemos los medios o los datos suficientes para
utilizar esta fórmula. Por ello, si tenemos dos series de precios, podemos calcular el
coeficiente de correlación en excel, usando la siguiente función: coef.de.correl(serie de
precios x; serie de precios y).
Nuestro objetivo es obtener un modelo que permita establecer relaciones entre dos
variables: la variable y (variable dependiente, respuesta o de interés) y la variable x
(variable independiente, predictiva o explicativa).
Si es posible establecer una relación determinista entre las variables, es decir, de la
forma y = f (x), entonces la predicción no tiene ningún error. Por ejemplo, un circuito
eléctrico compuesto por una alimentación de 10 voltios conectada a una
=V/R=10/ 5=2 amperios. El error obtenido al
medirla es despreciable, por lo que mediciones sucesivas obtendrán siempre
intensidades de dos amperios.
Como se observa en el gráfico, todos los puntos se ajustan a la perfección a la línea
recta.
Sin embargo, en la mayoría de las ocasiones, las relaciones entre las variables nos
son desconocidas o los errores de medición no son negligibles. Bajo estas circunstancias
de relación no determinista, la relación puede expresarse como
y = f (x) + u
donde u es una perturbación desconocida (una variable aleatoria).
La presencia de ese error aleatorio significa que dos observaciones idénticas para x
pueden dar lugar a observaciones distintas para y
en este curso son aquellos modelos en los que la función f (x) es lineal:
y = β0 + β1 x + u
La variable y varía linealmente con la variable x, pero no queda totalmente explicada

por ella a causa de la presencia del error u. Los parámetros β0 y β1 se denominan
coeficientes de regresión; en particular, β0 es el intercepto y β1 es la pendiente.
Consideremos el siguiente diagrama de dispersión que muestra los distintos pesos y

alturas de un grupo de personas.
Aunque las personas más altas tienden a tener mayor peso que las bajas, no podemos
establecer una relación determinista entre las variables peso y altura. Vemos que existe
una relación entre ambas, pero que ésta no es exacta.
El objetivo de un modelo de regresión es encontrar una relación entre las variables que se
ajuste lo mejor posible a los datos. En el caso de un modelo de regresión lineal simple, el
objetivo es encontrar la recta de regresión.
Ŷ = ˆβ0+ˆβ1x.
Por ejemplo, supongamos que la recta de regresión es:
y = −100+ x
Eso significa que se estima que una persona cuya estatura es de 180cm va a pesar
80kg. Obviamente, esto no es siempre cierto: existen personas que miden 180 cm y no
pesan 80kg y al revés.
Tema 1. Regresión lineal simple 3
La diferencia entre el valor y de una variable (p.ej., peso) y su estimación ˆyi es el residuo ei:
ei = yi − ˆyi.
Gráficamente, es la distancia vertical entre una observación y su estimación a través de la
recta de regresión.
ÍNDICE ESTADÍSTICO
NÚMEROS ÍNDICES
Los números índices son una medida estadística que permite comparar una magnitud
simple o compleja en dos situaciones diferentes respecto al tiempo o al espacio
tomando una de ellas como referencia. Al período inicial se le denomina período base o
referencia y se le asigna el valor 100, en cambio, la situación que deseamos comparar
se denomina período actual o corriente.
Para las comparaciones hay que tener en cuenta dos aspectos importantes:
Fijar la situación inicial (de forma arbitraria) a la que se referirán las
comparaciones. Señalar que la elección de la situación inicial condiciona el
resultado de la comparación, por lo que el punto de referencia inicial debe ser el
más idóneo posible a los objetivos que se persiguen.
Las magnitudes que se comparan pueden ser simples o complejas, lo que nos
introduce en el problema de la construcción de sistemas de comparación
adecuados. Una magnitud compleja es comparar la producción de un mismo país
en dos épocas diferentes o la producción global de dos países. No olvidemos
que la producción es una magnitud compleja compuesta por magnitudes simples
heterogéneas (unidades de producción, litros, kilogramos, etc.)
Una clasificación sencilla de los números índices sería:
SIMPLES: Se refieren a un solo producto o concepto
(Serie Cadena): referencia fija y referencia el dato anterior
NÚMEROS ÍNDICES
COMPLEJOS: Se refieren a varios productos o conceptos: Sin ponderar;
Sauerbeck (media aritmética); Media Geométrica; Media Armónica, Bradstreet -
Dûtot (media agregativa).
Ponderados: Laspeyres; Paasche; Edgeworth; Fisher
NÚMEROS ÍNDICES SIMPLES
Son los índices que proporcionan la variación que ha sufrido una magnitud o concepto
entre dos períodos o lugares distintos. Generalmente, esta comparación se realiza con
el valor de un período fijo (periodo base).
Dependiendo de sí la referencia es fija o no, se habla de índices en serie (referencia
fija) e índices en cadena (referencia variable).
NÚMEROS ÍNDICES SIMPLES EN SERIE.- Sean Xt y X0dos valores de una variable X,

el valor del número índice en serie que corresponde al valor Xt tomando con referencia
o base fija X0 se representa mediante: | y se define:
| (X) = 100
Ejemplo 1.-
En la tabla se presenta el número de mujeres (en miles) activas en España desde el tercer
trimestre de 2009 hasta el tercer trimestre de 2010. En la última columna se representan los
números índices simples en serie con base el tercer trimestre de 2009.
NÚMEROS ÍNDICES SIMPLES EN SERIE

Año Trimestre Mujeres activas (miles) Base (2009-3º)
2009 3 10089,4 100
2009 4 10139,3 (10139, 3 / 10089, 4)x100 = 100,4946
2010 1 10213,3 (10213, 3 / 10089, 4)x100 = 101,2280
2010 2 10250,5 (10250, 5 / 10089, 4)x100 = 101,5967
2010 3 10265,2 (10265, 2 / 10089, 4)x100 = 101,7424
Los índices reflejan la variación porcentual que experimentan los distintos valores de la
variable con respecto al valor que se ha tomado como referencia (3º trimestre de 2009).
Observando la tabla, el número de mujeres activas en España en el tercer trimestre de

2010 es un 1,74% superior al que había en el tercer trimestre del año anterior.
Los índices que se obtienen respecto de una base (periodo de referencia) fija se denominan
Indices en serie.
NÚMEROS ÍNDICES SIMPLES EN CADENA
Cuando el índice correspondiente a cada dato se calcula tomando como referencia el
dato inmediatamente anterior.
Sean xt-1 y xt los valores observados de una variable X en dos instantes consecutivos,
el índice en cadena que corresponde al valor xt se representa mediante ICt y se define:
ICt =
Para series de observaciones temporales, estos índices reflejan la variación porcentual

que experimenta la variable entre cada dos observaciones consecutivas.
NÚMEROS ÍNDICES SIMPLES EN CADENA

Año Trimestre Mujeres activas (miles) Base(2009-3º)
2009 3 10089,4 ---------
2009 4 10139,3 (10139, 3 / 10089, 4) . 100 =100,49
2010 1 10213,3 (10213, 3 / 10139, 3) . 100 =100,73
2010 2 10250,5 (10250, 5 / 10213, 3) . 100 =100,36
2010 3 10265,2 (10265, 2 / 10250, 5) . 100 =100,14
3
Los índices en cadena reflejan la variación porcentual entre trimestres del número de
mujeres activas en España.
En esta línea, en el segundo trimestre de 2010 el número de mujeres activas fue un

0,36% superior al dato del trimestre anterior.
2010 3
IC =
2010 2
Bibliografía
https://www.sergas.es/Saude-
publica/Documents/1899/Ayuda_Epidat_4_Distribuciones_de_probabilidad_Octubre201
4.pdf
Artículo "Distribución de probabilidades", publicado por el website Galeon.com.
https://www.esan.edu.pe/apuntes-empresariales/2016/10/conoce-las-principales-
distribuciones-de-probabilidad/
https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html
http://www.est.uc3m.es/esp/nueva_docencia/leganes/ing_industrial/estadistica_II/doc%2
0grupo2006/archivos/apuntes_Est2.pdf
http://www.fuenterrebollo.com/Economicas2013/indices-teoria.pdf

Antologia Estadística II Cescijuc

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Antologia Estadística II Cescijuc

Cargado por

Copyright:

Formatos disponibles

CENTRO DE ESTUDIOS SUPERIORES EN CIENCIAS JURIDICAS Y

LICENCIATURA EN ADMINISTRACIÓN DE EMPRESAS

ENRIQUE RUIZ MONTOYA

El programa de fomento para elaboración de antologías complementa la selección y

Este material es de apoyo y consulta didáctica, se pone al alcance de maestros y

La estadística es una herramienta básica en negocios y producción. Es usada para

En la mayoría de los cálculos existe algún tipo de incertidumbre o error humano,

Tema II CORRELACIÓN LINEAL

Tema III REGRESIÓN LINEAL.

Tema V SERIES DE TIEMPO

Uno de los conceptos más importantes de la teoría de probabilidades es el de variable

La probabilidad de un resultado específico está entre cero y uno.

1. Variable aleatoria discreta (x)

X variable que nos define el número de alumnos aprobados en el curso de historia

Si realizamos la tabla de distribución del número posible de caras que se obtiene al

Variable aleatoria continua (x)

Coeficiente de correlación lineal

Correlación perfecta negativa:

La variable y varía linealmente con la variable x, pero no queda totalmente explicada

Consideremos el siguiente diagrama de dispersión que muestra los distintos pesos y

Tema 1. Regresión lineal simple 3

NÚMEROS ÍNDICES SIMPLES EN SERIE.- Sean Xt y X0dos valores de una variable X,

o base fija X0 se representa mediante: | y se define:

NÚMEROS ÍNDICES SIMPLES EN SERIE

Observando la tabla, el número de mujeres activas en España en el tercer trimestre de

Para series de observaciones temporales, estos índices reflejan la variación porcentual

NÚMEROS ÍNDICES SIMPLES EN CADENA

En esta línea, en el segundo trimestre de 2010 el número de mujeres activas fue un

Artículo "Distribución de probabilidades", publicado por el website Galeon.com.

También podría gustarte