Está en la página 1de 15

INFERENCIAS DE POBLACIONES, VARIABLES ESTADÍSTICAS

BIDIMENSIONALES, CORRELACIÓN LINEAL, DIAGRAMA DE ÁRBOL

JENNIFER PAOLA GONZALES FERNÁNDEZ

MARÍA MAGDALENA ORTIZ ORTIZ

MARLÍN DEL MAR PÉREZ URDANETA

PABLO DAVID GARCÍA PLATA

ROSIMAR PAOLA GARCÍA CHIRINOS

TRABAJO DE ESTADÍSTICA

ARNOLDO TOMAS PINTO MANJARREZ

INSTITUCIÓN EDUCATIVA NUESTRA SEÑORA DEL CARMEN


NOVENO GRADO (9C)
HATONUEVO, LA GUAJIRA – COLOMBIA
AÑO: 2023

1
TABLA DE CONTENIDO

INTRODUCCION…………………………………………………………………3

1. INFERENCIAS DE POBLACIONES……………………………………..4

1.1 ESTIMADO Y ESTIMACION PUNTUAL……………………………….4

1.2 PROPIEDADES DE UN ESTIMADOR…………………………………..5

2. VARIABLES ESTADÍSTICAS BIDIMENSIONALES. DEPENDENCIA.5

2.1 VARIABLES ESTADÍSTICAS BIDIMENSIONALES…………………..5

2.2 TABLA DE DOBLE ENTRADA………………………………………….6

2.3 DEPENDENCIA ALEATORIA Y FUNCIONAL…………………………7

2.4 COVARIANZA……………………………………………………………8

3. CORRELACIÓN LINEAL………………………………………………..9

3.1 COEFICIENTE DE CORRELACIÓN LINEAL………………………….9

3.2 RECTA DE REGRESION…………………………………………………10

4. DIAGRAMA DE ÁRBOL…………………………………………………11

2
INTRODUCCIÓN

El siguiente trabajo escrito está hecho para identificar diferentes temas y subtemas de la
materia de estadísticas donde trata de la recolección, presentación, análisis y uso de los
datos para tomar decisiones, solucionar problemas y diseñar productos y procesos, es por
eso que resulta vital para nosotros como estudiantes tener conocimientos estadísticos.

3
1. INFERENCIAS DE POBLACIONES
1.1 ESTIMADO Y ESTIMACION PUNTUAL

En estadística, la estimación puntual es un proceso mediante el cual se estima el valor de un


parámetro poblacional a partir de los datos de una muestra. Es decir, la estimación puntual
consiste en aproximar el valor de un parámetro de una población usando como referencia el
valor muestral del parámetro.

Por ejemplo, para determinar la media de una población de 1000 individuos podemos hacer
una estimación puntual y calcular el valor de la media de una muestra de 50 personas. De
manera que podemos tomar el valor de la media muestral como una estimación puntual de
la media poblacional.

Así pues, la estimación puntual sirve para hacer una aproximación de un parámetro de una
población estadística cuyo valor es desconocido. De esta forma, aunque no se sabe el valor
del parámetro poblacional con certeza, nos podemos hacer una idea de cuánto vale.

Generalmente, el tamaño de la población de un estudio estadístico es muy grande, por lo


que podemos usar la estimación puntual para analizar a menos individuos y tomar el valor
de una muestra como una aproximación del valor de la población.

Por lo tanto, un estimador puntual es el valor muestral de un parámetro que se toma como
una aproximación del valor poblacional de dicho parámetro mediante un proceso de
estimación puntual.

 La media de la población se puede estimar puntualmente mediante la media de la


muestra:

 La proporción de la población se puede estimar puntualmente mediante la


proporción de la muestra:

 La desviación típica de la población se puede estimar puntualmente mediante la


desviación típica de la muestra, aunque hay mejores estimadores:

4
~
Ejemplo: si X B ( n , p ) un posible estimador de P es P=X /n

Se puede ver que es un estimador insesgado, ya que:

E ^p=E ( X /n )=E (X )/n=np/n=p

1.2 PROPIEDADES DE UN ESTIMADOR


Estamos diciendo que un estimador es una aproximación de un parámetro teórico o
desconocido de una población. Para estimar la media de la altura de una población,
podemos seleccionar una muestra y calcular la media aritmética de la muestra. Ahora bien,
también tendría sentido usar como estimador el siguiente:
min ⁡(X 1 , X 2 ,… . Xn)+max ⁡¿ ¿

Por ejemplo, si se desea conocer el precio medio poblacional de un artículo (parámetro


desconocido) se recogen observaciones de precio de dicho artículo en diversos
establecimientos (muestra) pudiendo utilizarse la media aritmética de las observaciones
para estimar el medio poblacional.
Para cada parámetro pueden existir varios estimadores diferentes. En general, se elige el
estimador que posea mejores propiedades que los restantes, como insesgadez, eficiencia,
convergencia y robustez (consistencia).
El valor de un estimador proporciona una estimación puntual del valor del parámetro en
estudio. En general, se realiza la estimación mediante un intervalo, es decir, se obtiene un
intervalo (parámetro muestral ± error muestral) dentro del cual se espera se encuentre el
valor poblacional dentro un cierto nivel de confianza. El nivel de confianza es la
probabilidad de que a priori el valor poblacional se encuentre contenido en el intervalo.

2. VARIABLES ESTADÍSTICAS BIDIMENSIONALES. DEPENDENCIA

2.1 VARIABLES ESTADÍSTICAS BIDIMENSIONALES


Cuando se consideran situaciones en la que el estadístico realiza la observación simultanea
de dos caracteres en el individuo, se obtienen pares de resultados.
Los distintos valores de las modalidades que pueden adoptar estos caracteres forman un
conjunto de pares, que representamos por (X, Y), y llamaremos variable estadística

5
bidimensional. Los dos caracteres observados no tienen por qué ser de la misma clase,
pudiendo presentarse distintas situaciones:

 Dos caracteres cualitativos: El sexo y color del pelo de una persona


 Dos caracteres cuantitativos: El peso y la estatura de una persona.
 Uno cuantitativo y otro cualitativo: La profesión y los años de servicio.

Las variables (X, Y) que representan los valores de dos caracteres cuantitativos, pueden
clasificarse:

 X discreta e Y discreta: Número de hijos y número de hermanos de una persona.


 X continua e Y continua: Perímetro craneal y perímetro torácico de una persona.
 X discreta e Y continua: Hijos de una familia y estatura del padre.
 X continua e Y discreta: Temperatura y pulsaciones.

2.2 TABLA DE DOBLE ENTRADA


El par (X, Y) es la unidad del est2udio y dos pares serán repetidos solo cuando sus
respectivas componentes sean iguales. De otra parte, el número de modalidades que adopta
el carácter X no tiene por qué ser el mismo que el que adopta el carácter Y:
X =( X 1 , X 2 , … . , X K ) Y =(Y 1 ,Y 2 , … .. ,Y m)

Para ordenar los datos se utiliza una tabla de doble entrada donde tengan cabida los k
valores distintos de la variable X y los m valores distintos de la variable Y. En la tabla se
puede expresar el número de veces que se repite cada para de valores posibles (x, y) i j
formado en el producto cartesiano de los dos conjuntos numéricos.

y y1 y2 … yj … ym
x
x1 n11 n12 … ... … n1m
x2 n21 n22 … ... … n2m
… … … … ... … …
xi …… …… …… …nij … nim
… … … … … …
xk nk1 nk2 … … nkm

6
2.3 DEPENDENCIA ALEATORIA Y FUNCIONAL
 Dependencia funcional: Podemos encontrar una relación exacta entre ambas
variables que siempre se cumple. Por ejemplo, si estudias la relación entre el
número de cajas de leche y el número de litros que se compra de una marca,
tenemos una dependencia funcional, porque cada caja tiene siempre el mismo
número de litros. Puede ser más o menos fuerte dependiendo de que el diagrama de
dispersión tienda a acercarse más o menos a la representación de la función. Nos
interesará conocer si es positiva o negativa, así como si es lineal o curvilínea.
 Dependencia aleatoria: No hay una regla exacta que determine la relación entre
ambas variables

DEPENDECIA
POSITIVA
ALEATORIA

DEPENDECIA
POSITIVA
FUNCIONAL

7
SIN DEPENDENCIA

DEPENDENCIA
NEGATIVA
2.4 COVARIANZA ALEATORIA
La covarianza es un valor que indica el grado de variación conjunta de dos variables
aleatorias. Es decir, la covarianza sirve para analizar la dependencia entre dos
variables.
La covarianza es igual al sumatorio de los productos de las diferencias entre los
datos de las dos variables y sus respectivas medias partido por el número total de
datos. a interpretación del valor de la covarianza es muy sencilla:

8
 Si la covarianza es positiva, significa que existe una dependencia entre las dos
variables. Por lo tanto, cuando una variable aumente de valor la otra variable
también aumentará, y al revés.
 Si la covarianza es negativa, quiere decir que la relación entre las dos variables es
negativa. De manera que cuando una variable aumente de valor la otra variable
disminuirá, y viceversa.
 Si la covarianza es igual a cero (o su valor es cercano a cero), implica que no hay
una relación entre las dos variables. Es decir, las dos variables aleatorias son
independientes.
COMO CALCULAR LA COVARIANZA
Para calcular la covarianza de una serie de datos se deben hacer los siguientes pasos:
1. Calcular la media de cada variable por separado.
2. Por cada variable, hallar la diferencia entre cada uno de sus valores y la media de la
variable.
3. Multiplicar las diferencias calculadas en el paso anterior de cada dato.
4. Sumar todos los resultados obtenidos en el paso anterior.
5. Dividir entre el número total de datos. El valor obtenido es la covarianza de la serie
de datos.
A modo de resumen, la fórmula para calcular la covarianza entre dos variables es:

∑ (x1 −x)( y i− y)
COV ( X , Y )= i=1
n
Una manera muy recomendable de sacar la covarianza entre dos variables es hacer una
tabla con todas las parejas de datos y añadir una columna por cada uno de los pasos
explicados arriba. De esta forma tendrás los cálculos mucho mejor organizados y
entenderás mejor qué estás haciendo.
3. CORRELACIÓN LINEAL
3.1. COEFICIENTE DE CORRELACIÓN LINEAL
El coeficiente de correlación, también llamado coeficiente de correlación lineal o
coeficiente de correlación de Pearson, es el valor de la correlación entre dos variables.

9
El coeficiente de correlación de dos variables estadísticas es igual al cociente entre la
covarianza de las variables y la raíz cuadrada del producto de la varianza de cada
variable. Por lo tanto, la fórmula para calcular el coeficiente de correlación es la
siguiente:
cov (x , y )
ρxy=
√ var ( x ) . var ( y )
Cuando se calcula el coeficiente de correlación sobre una población, el símbolo de la
correlación es la letra griega ρ. Pero cuando se está calculando el coeficiente respecto a
una muestra suele usarse como símbolo la letra r.
El valor del índice de correlación puede estar entre -1 y +1, ambos incluidos. Más abajo
veremos cómo se interpreta el valor del coeficiente de correlación.
3.2 RECTA DE REGRESION
En estadística, la recta de regresión es la recta que se obtiene de un modelo de regresión
lineal simple. En concreto, la recta de regresión es la recta que mejor se ajusta a una
nube de puntos y que, por tanto, mejor describe un conjunto de datos estadísticos.
Así pues, la ecuación de la recta de regresión relaciona matemáticamente la variable
independiente X y la variable dependiente Y de un conjunto de datos. Aunque
generalmente la recta de regresión no es capaz de determinar con exactitud el valor de
cada observación, sí que nos permite obtener una aproximación de su valor.
FORMULA DE LA RECTA DE REGRESION
Ahora que ya sabemos la definición de la recta de regresión, vamos a ver cómo se
calcula la ecuación de la recta de un modelo de regresión lineal.
Como toda recta, la ecuación de la recta de regresión está formada por una constante
(b0) y una pendiente (b1):

y=b0 + b1x

Así pues, las fórmulas para calcular los coeficientes de la recta de regresión lineal son
las siguientes:

10
Donde:

 b_0es la constante de la recta de regresión.


 b_1es la pendiente de la recta de regresión.
 x_ies el valor de la variable independiente X del dato i.
 y_ies el valor de la variable dependiente Y del dato i.
 \overline{x}es la media de los valores de la variable independiente X.
 \overline{y}es la media de los valores de la variable dependiente Y.

4. DIAGRAMA DE ÁRBOL

Un diagrama de árbol es una representación gráfica de los posibles resultados de un


experimento que tiene varios pasos. Nos permite calcular la probabilidad de que
ocurra un evento de una manera muy sencilla.

Para el cálculo de las probabilidades, usaremos un truco, si para calcular cierta probabilidad
avanzamos hacia la derecha, entonces multiplicamos. Por otro lado, si para calcular cierta
probabilidad avanzamos hacia abajo, entonces sumamos.

11
Ejemplo:
Una moneda tiene en sus caras un gato y un perro. Se. lanza 2 veces la moneda, calcular:
a) la probabilidad de obtener 2 gatos.
b) la probabilidad de obtener solo 1 gato.
Solución:

Vamos a elaborar el diagrama de árbol para este experimento. Calculamos la probabilidad


para cada uno de los posibles casos, cuando avanzamos a la derecha, multiplicamos.

a) La probabilidad de obtener 2 gatos, la podemos observar en el gráfico.

12
b) La probabilidad de obtener solo 1 gato, se calcula sumando 2 probabilidades, ya que hay
2 maneras de obtener solo 1 gato:

 Obtener gato y perro.


 Obtener perro y gato.

Recuerda que cuando avanzamos hacia abajo, entonces sumamos:

Por lo tanto, la probabilidad de obtener 1 solo gato será:

13
CONCLUSIÓN

Este trabajo evidencia todos y cada uno de los temas vistos dentro del tercer periodo del
grado noveno; lo aquí presentado permitió desarrollar el sentido de localización de cada
uno de los estudiantes, pues fijó datos reales a temas teóricos.
damos a entender con este trabajo, es que la estadística siempre ha estado en el ambiente de
la civilización ya que han existido formas sencillas. En las civilizaciones ya se utilizaban
representaciones gráficas y otros símbolos para contar el número de personas u otras cosas.
También que la estadística nos sirve para recolectar, analizar, organizar y tomar decisiones
que estén de acuerdo con el análisis de este trabajo

14
BIBLIOGRAFÍA

https://www.mate.unlp.edu.ar/practicas/55_5_22102012132242.pdf
https://bookdown.org/aquintela/EBE/estimacion-puntual.html#propiedades-de-los-
estimadores
https://www.estadistica.net/Aeronautica2016/estimadores.pdf
https://www.estadistica.net/Algoritmos2/bidimensional.pdf
https://www.probabilidadyestadistica.net/correlacion/
https://matemovil.com/diagrama-de-arbol-probabilidades/

15

También podría gustarte