Está en la página 1de 19

Elaborado por Luz Eliana Zapata Rueda

Estadística II
Docente: Carlos Alberto Vargas Flórez

Consulta de conceptos

1. ¿Qué es población?
En estadística, el término “población” se refiere al conjunto de elementos que se
quiere investigar, estos elementos pueden ser objetos, acontecimientos,
situaciones o grupo de personas.
La población se puede clasificar de diversas formas, por ejemplo, según la
edad y sexo (demográfico), por el lugar donde viven (por área) y según las
condiciones de trabajo (población activa e inactiva).
2. ¿Qué es muestra?
Muestra. Es un subconjunto o parte del universo o población en que se
llevará a cabo la investigación. Hay procedimientos para obtener la cantidad de
los componentes de la muestra como fórmulas, lógica y otros que se verá más
adelante. La muestra es una parte representativa de la población.
3. Variable aleatoria discreta
Una variable aleatoria discreta es aquella que puede asumir un número
contable de valores.

Por ejemplo, si realizamos el experimento de salir a calle y seleccionar 10


personas al azar para un examen sorpresa de matemáticas, podemos definir la
variable aleatoria A:

 A = número de personas que aprobaron el examen. 


Los valores que asume A (en su rango), van del 0 al 10 (0, 1, 2, 3, 4, 5, 6, 7, 8, 9,
10). El rango lo expresaríamos de la siguiente manera:

 RA = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}


La variable aleatoria A asume un número contable de valores, por ello, es una
variable aleatoria discreta. 

Otro ejemplo, vamos a realizar el experimento de registrar los automóviles a una


caseta de peaje. Podemos definir la variable aleatoria V:
 V = número de vehículos que llegan durante el periodo de un día. 
Los valores que asume V (en su rango), son 0, 1, 2, 3, 4, 5, …; así sean muchos
vehículos los que llegan, siempre podremos contar la cantidad de valores que
asume V. Por ello, la variable V es una variable aleatoria discreta. 

4. Variable aleatoria continua


Una variable aleatoria continua, es aquella que puede asumir un número
incontable de valores.

Por ejemplo, si realizamos el experimento de ir a mi granja y estudiamos las


características de las vaquitas, podemos definir la variable aleatoria C:

 B = peso de una vaca en la granja de Jorge (en kilogramos).


Alguna vaquita puede pesar 425,1872 kg; otra puede pesar 612,5874541 kg; otra
puede pesar 545,897512121 kg. Si tomamos más vacas, podríamos tener más
valores y nunca terminaríamos. 

Se conoce que el becerro más pequeño tiene un peso de 30 kg, y la vaca más
grande tiene un peso de 1000 kg.

Y así, tendríamos un número incontable de valores para el rango de esta variable.


El rango de esta variable puede ser cualquier valor dentro del intervalo que va
desde 30 kg hasta 1000 kg. 

Por ello, se trata de una variable aleatoria continua. 

Otro ejemplo, si vamos a una agencia del banco y registramos los datos de
atención a los clientes, podemos definir la variable aleatoria D:
 D = tiempo de atención a los clientes del banco (en segundos).
Un cliente puede ser atentido en 24,123 s; otro cliente en 72,32142 s; otro en
51,123123 s. Si seguimos tomando más clientes, tendríamos más valores. Se
conoce además que el tiempo mínimo de atención en ventanilla es de 1 s y el
tiempo máximo es de 240 s.

Y así, tendríamos un número incontable de valores para el rango de esta variable.


El rango de esta variable puede ser cualquier valor dentro del intervalo que va
desde 1 s hasta 240 s. Por ello, se trata de una variable aleatoria continua. 

5. Medidas de tendencia central


Ejemplo: el salón de clases

Aquí tienes una lista con las edades de quince niños que hacen parte de un coro.
Como ves, los números son muy variados y están un poco desordenados.

Lo mejor es organizarlos, ya sea de forma vertical u horizontal, así será más fácil
calcular las tendencias.

La media

Es el valor promedio del grupo datos, es decir, la cifra que se obtiene al sumar


todos los datos y dividir el resultado entre la cantidad de los mismos. 

Paso 1:

La suma de 8 + 14 + 9 + 12 + 14 y los demás números, es igual a 172.

Paso 2:

Ahora, este resultado hay que dividirlo por la cantidad de datos. Sabemos que
tenemos las edades de 15 niños, entonces 172 dividido en 15 es igual a 14,
466666...

Para obtener un número más corto lo que puedes hacer es aproximar. Como el
seis es un número mayor a 5, automáticamente el cuatro se aproxima a 5 y así
obtienes la media, que es 11,5.
La mediana 

Calcular la mediana es mucho más fácil porque es justo el valor central, es decir,
el que se encuentra en la mitad de la lista. 

Paso 1:

Lo único que debes hacer es organizar los datos de menor a mayor o de mayor a
menor.

Paso 2: 

Identifica cuál número ocupa el puesto del centro. En este caso la mediana es 12.

Si la cantidad de datos que tienes es impar, como en este ejemplo que son 15
edades, es más fácil identificar el puesto de la mitad. Pero, si llegas a tener
un conjunto de datos par, haz lo siguiente:
Paso 3:

Imagina que en la lista no hay 15 edades, si no 16. Ubica los valores de la mitad y
súmalos: 
11 + 12 = 23

Paso 4: 

Divide el resultado en dos. 

23 ÷ 2 = 11,5

La mediana es de 11,5.

La moda

Es el número que más se repite. Observar esta lista de datos e identifica la cifra
que más aparece. 
Si elegiste el 12 es correcto. La moda es 12, porque se repite 5 veces, mientras
que el catorce, que es otra cifra que aparece mucho, solo está tres veces. Si
tuvieras dos datos que se repiten la misma cantidad de veces, se denomina
bimodal.

La próxima vez que necesites calcular la media, la mediana y la moda recuerda


lo siguiente:

 Organiza tu conjuntos de datos.


 Para calcular la media solo tienes que sumar todos los datos y
dividirlos por la cantidad de datos que tengas.
 Para la mediana, ordena los datos de menor a mayor o viceversa y
elige justo el número que se encuentre en la mitad de todos.
 Para la moda, descubre el dato que más se repite.

6. Medidas de tendencia de posición


Las medidas de posicion son valores que permiten dividir el conjunto de
datos en partes porcentuales iguales y se usan para clasificar una
observación dentro de una población o muestra. Las medidas de
posición más usuales son los cuartiles, los deciles y los percentiles.

Cuantiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto
de datos ordenados en cuatro partes iguales. % de los datos. Se dividen
por 4 Como se calculan? dividen el conjunto en cuatro partes iguales. Por
ejemplo, si el conjunto de datos es de 20 elementos, N=20, tendremos que
el sujeto del primer cuartil es el (N+1)/4=(20+1)/4=21/4=5,25.

Deciles
En estadística descriptiva, un decil es cualquiera de los nueve valores que
dividen a un grupo de datos ordenados en diez partes iguales, de manera que
cada parte representa1/10 de la muestra o población. Como se calculan? Son
aquellas variables que dividen a una distribución en 10 partes iguales, por lo
tanto hay 9 deciles. El decil 5 (D5) coincide con la mediana y con el segundo
cuartil, es decir D5= Me=Q2 El cálculo de los Deciles es similar al de los
Cuartiles y Percentiles.

Percentiles
El percentil es una medida de posición usada en estadística que indica, una
vez ordenados los datos de menor a mayor, el valor de la variable por debajo
del cual se encuentra un porcentaje dado de observaciones en un grupo. Como
se resuelve? El percentil es una medida de posición no central. Por ejemplo, si
el conjunto tiene 199 elementos, (N+1)·i/100=200·50/100=100, por lo que
el percentil 50 será P50=X100.

7. Medidas de tendencia de dispersión


Las medidas de dispersión son otro tipo de medida estadística que en
contraposición de la medida central, miden el grado de dispersión de los
valores de la variable. Dicho de otra manera, son las medidas que indican si
una variable se mueve mucho, poco, más o menos que otras. 
Asimismo, es necesario decir que una medida de dispersión estadística se
presenta como un número real no negativo, que será igual a cero si todos los
datos obtenidos son idénticos. La misma también tendrá la tendencia a subir a
medida que los datos se vuelvan mucho más diversos.

También tenemos que aclarar que las medidas de tendencia central y


dispersión (específicamente estas últimas) tienen las mismas unidades que la
cantidad que se está midiendo. Por ejemplo, si los datos que estamos
recolectando están en centímetros o segundos, también lo estará la medida de
dispersión de la que hablamos.

Y entre las medidas de dispersión más utilizadas o conocidas podemos


mencionar:

o Rango.
o Rango intercuartil (IQR).
o Desviación Estándar.
o Mediana desviación absoluta (MDA).
o Desviación media absoluta o desviación media.
o Desviación estándar de distancia.
o Diferencia absoluta media de Gini.

MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS

Los estudios estadísticos permiten hacer inferencias de una característica de


una población a partir de la información contenida en una muestra. Los métodos
numéricos que describen a los conjuntos de observaciones tienen como objetivo
dar una imagen mental de la distribución de frecuencias.

Una vez localizado el centro de la distribución de un conjunto de datos, lo que


procede es buscar una medida de dispersión de los datos.

La dispersión o variación es una característica importante de un conjunto de


datos porque intenta dar una idea de cuán esparcidos se encuentran éstos.

Existen diversas medidas de dispersión, algunas de ellas son:

            • Rango

            • Desviación estándar

            • Varianza

        A continuación, se explican cada una de ellas.


                 RANGO: El rango de un conjunto de números es la diferencia entre el
mayor y el menor de todos ellos. Hay 2 maneras de expresar ésta medida:

   La diferencia entre los valores mayores y menor.   

  Los valores mayor y menor del grupo. 

          DESVIACION ESTANDAR: La desviación típica o desviación


estándar (denotada con el símbolo σ o s, dependiendo de la procedencia
del conjunto de datos) es una medida de dispersión para variables de razón
(variables cuantitativas o cantidades racionales) y de intervalo. Se define
como la raíz cuadrada de la varianza de la variable.
                      VARIANZA: Encontramos varianza, que es como la mayor parte de
los textos científicos en castellano se refieren a la media aritmética de los
cuadrados de las desviaciones de cada valor respecto de la media aritmética de
los datos (por lo que a veces también se denomina desviación cuadrática media).
La desviación estándar es la raíz cuadrada de la varianza. En algunos textos en
castellano se ve variancia en vez de varianza, pero esta grafía se usa muy poco,
pese a ser la recomendada por la Real Academia.
      La varianza es la media aritmética de los cuadrados de las desviaciones
respecto a la media aritmética, es decir, es el promedio de las desviaciones de la
media elevadas al cuadrado.
MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS

Los estudios estadísticos permiten hacer inferencias de una característica de


una población a partir de la información contenida en una muestra. Los métodos
numéricos que describen a los conjuntos de observaciones tienen como objetivo
dar una imagen mental de la distribución de frecuencias.

Una vez localizado el centro de la distribución de un conjunto de datos, lo que


procede es buscar una medida de dispersión de los datos.

La dispersión o variación es una característica importante de un conjunto de


datos porque intenta dar una idea de cuán esparcidos se encuentran éstos.

Existen diversas medidas de dispersión, algunas de ellas son:

            • Rango

            • Desviación estándar

            • Varianza

        A continuación, se explican cada una de ellas.

                 RANGO: El rango de un conjunto de números es la diferencia entre el


mayor y el menor de todos ellos. Hay 2 maneras de expresar ésta medida:

   La diferencia entre los valores mayores y menor.   

  Los valores mayor y menor del grupo. 


          DESVIACION ESTANDAR: La desviación típica o desviación
estándar (denotada con el símbolo σ o s, dependiendo de la procedencia
del conjunto de datos) es una medida de dispersión para variables de razón
(variables cuantitativas o cantidades racionales) y de intervalo. Se define
como la raíz cuadrada de la varianza de la variable.
                      VARIANZA: Encontramos varianza, que es como la mayor parte de
los textos científicos en castellano se refieren a la media aritmética de los
cuadrados de las desviaciones de cada valor respecto de la media aritmética de
los datos (por lo que a veces también se denomina desviación cuadrática media).
La desviación estándar es la raíz cuadrada de la varianza. En algunos textos en
castellano se ve variancia en vez de varianza, pero esta grafía se usa muy poco,
pese a ser la recomendada por la Real Academia.
      La varianza es la media aritmética de los cuadrados de las desviaciones
respecto a la media aritmética, es decir, es el promedio de las desviaciones de la
media elevadas al cuadrado.

También podría gustarte