Está en la página 1de 40

ING.

STELLA RIBERA
OBJETIVO DE LA
ESTADÍSTICA DESCRIPTIVA
O El objetivo de la estadística descriptiva es
describir los datos observados de forma
sintética y significativa para poder analizarlos
mejor. Es recoger observaciones sobre sujetos
con una determinada propiedad y traducir estas
observaciones en números que proporcionen
información sobre dicha propiedad.
O En resumen, su objetivo es estructurar y
representar la información contenida en los
datos
IMPORTANCIA DE LA
ESTADÍSTICA DESCRIPTIVA
O La estadística descriptiva facilita la visualización de los
datos. Permiten presentarlos de forma significativa y
comprensible, lo que a su vez da pie a una interpretación
simplificada del conjunto de datos en cuestión.
O Los datos brutos serían difíciles de analizar, y la
determinación de tendencias y patrones puede ser un
reto. Además, los datos en bruto dificultan la visualización
de lo que muestran los datos.
O Además, el uso de la estadística descriptiva permite
resumir y presentar un conjunto de datos mediante una
combinación de descripciones tabuladas y gráficas. La
estadística descriptiva se utiliza para resumir datos
cuantitativos complejos
EJEMPLO
O Has realizado una encuesta a 40 encuestados
sobre su color favorito de coche. Y ahora tiene una
hoja de cálculo con los resultados. Sin embargo,
esta hoja de cálculo no es muy informativa y
quieres resumir los datos con algunos gráficos y
tablas que te permitan llegar a algunas
conclusiones sencillas (por ejemplo, el 24% de las
personas dijeron que el blanco es su color favorito).
Seguro que esto sería mucho más representativo y
claro que una fea hoja de cálculo. Y tienes un
montón de opciones para visualizar datos, como
gráficos circulares, gráficos de líneas, etc.
VARIABLES ESTADÍSTICAS

OPoblación y muestra
OCaracteres cuantitativos
o cualitativos
OVariable estadística
POBLACIÓN Y MUESTRA
O Se denomina población al conjunto
completo de elementos, con alguna
característica común, que es el objeto de
nuestro estudio. Esta definición incluye, por
ejemplo, a todos los sucesos en que podría
concretarse un fenómeno o experimento
cualesquiera. Una población puede ser finita
o infinita.
POBLACIÓN Y MUESTRA
O Cuando, aunque la población sea finita, su número
de elementos es elevado, es necesario trabajar con
solo una parte de dicha población. A un subconjunto
de elementos de la población se le conoce como
MUESTRA.
O Al numero de elementos de la muestra se le llama
tamaño de la muestra. Es fácil adelantar que para
que los resultados de nuestro estudio estadístico
sean fiables es necesario que la muestra tenga un
tamaño mínimo. El caso particular de una muestra
que incluye a todos los elementos de la población es
conocido como CENSO.
CARACTERES CUANTITATIVOS
O CUALITATIVOS
O CARACTERES CUANTITATIVOS: Aquellos que
toman valores numéricos. Por ejemplo la
altura, distancia, la velocidad, el peso, las
edades, el número de las mujeres o
varones.
O caracteres cualitativos: también llamados
atributos, son aquellos que no podemos
representar numéricamente y describen
cualidades. Por ejemplo, un color o el
estado civil
VARIABLES ESTADÍSTICAS
Hay dos tipos de variables que se utilizan en el análisis
e interpretación de datos:
O Variables cualitativas: son características de un
individuo u objeto, que se pueden expresar
con palabras. Algunos ejemplos son: el color de ojos,
el color del cabello, el género, el estado civil o la
marca de un producto.
O Variables cuantitativas: son aquellas características
de un objeto o individuo que se pueden escribir en
números. Por ejemplo: edad, ingresos, peso, altura,
presión, humedad o cantidad de hermanos.
VARIABLES ESTADÍSTICAS
A su vez, las variables cuantitativas se dividen en discretas y
continuas.
O Variables discretas: son aquellas que no aceptan un valor entre
dos números consecutivos. Si tienes los datos 1, 2, 3, 10, 11 y
15, entre el 1 y 2 no puede aparecer el 1.48, porque del 1 salta
directamente al 2. Generalmente, las variables discretas son
resultado de un conteo y no permiten que pueden tomar
cualquier valor entre dos intervalos o números. Por ejemplo, si
necesitas escribir la estatura de los números decimales. Por
ejemplo: número de pacientes, número de alumnos, número de
motos por modelo.
O Variables continuas: por ejemplo son aquellas como en un
grupo de basquetbolistas, seguramente, no podrás utilizar los
números 1 y 2, pero si las variables 1.78, 1.65, 1.45, porque la
altura suele expresarse de esa manera.
DISTRIBUCIONES DE
FRECUENCIAS
1. Tabla de frecuencias de una variable
discreta: Cuando se tiene un gran número de
observaciones, pero muy pocas distintas, se
pueden organizar en una tabla de frecuencias,
es decir, cada uno de los valores acompañado
de la frecuencia (también llamada frecuencia
absoluta) con la que aparece. Este es el tipo de
tabla que acompaña a una variable discreta.
O Supongamos que tenemos una muestra de
tamaño N, donde la variable estadística x toma
los valores distintos x1, x2, . . . , xk. En primer lugar
hay que ordenar los diferentes valores que toma
la variable estadística en orden (normalmente
creciente). La diferencia entre el valor mayor y
menor que toma la variable se conoce como
recorrido, o rango.
O En el caso de variables discretas, generalmente,
un mismo valor de la variable aparecer 'a
repetido más de una vez (es decir k < N). De
forma que el siguiente paso es la construcción de
una tabla en la que se indiquen los valores
posibles de la variable y su frecuencia de
aparición.
TABLA DE FRECUENCIAS
DE UNA VARIABLE DISCRETA
TABLA DE FRECUENCIAS
DE UNA VARIABLE DISCRETA
O En la primera columna de esta tabla se escriben
los distintos valores de la variable, xi, ordenados
de mayor a menor. Es posible hacer también
una tabla de frecuencias de una variable
cualitativa. En ese caso, en la primera columna
se escribirán las diferentes cualidades o
atributos que puede tomar la variable. En las
siguientes columnas se escriben para cada
valor de la variable.
TABLA DE FRECUENCIAS
DE UNA VARIABLE DISCRETA
O Frecuencia absoluta ni: Definida como el número
de veces que aparece repetido el valor en cuestión
de la variable estadística en el conjunto de las
observaciones realizadas. Si N es el número de
observaciones(o tamaño de la muestra), las
frecuencias absolutas cumplen las propiedades

O La frecuencia absoluta, aunque nos dice el número


de veces que se repite un dato, no nos informa de
la importancia de ´este
TABLA DE FRECUENCIAS
DE UNA VARIABLE DISCRETA
O Frecuencia relativa fi: Cociente entre la frecuencia
absoluta y el número de observaciones realizadas
N. Es decir:
TABLA DE FRECUENCIAS
DE UNA VARIABLE DISCRETA
O Frecuencia absoluta acumulada Ni: Suma de
las frecuencias absolutas de los valores
inferiores o igual a xi, o numero de medidas
por debajo, o igual, que xi. Evidentemente la
frecuencia absoluta acumulada de un valor se
puede calcular a partir de la correspondiente
al anterior como:
O Ni = Ni−1 + ni y N1 = n1.
TABLA DE FRECUENCIAS
DE UNA VARIABLE DISCRETA
O Frecuencia relativa acumulada Fi: Cociente
entre la frecuencia absoluta acumulada y el
número de observaciones. Coincide además
con la suma de las frecuencias relativas de
los valores inferiores o iguales a xi.
TABLA DE FRECUENCIAS
DE UNA VARIABLE DISCRETA
GRÁFICO DE UNA TABLA DE
FRECUENCIA
AGRUPAMIENTO EN
INTERVALOS DE CLASE
O Cuando el número de valores distintos que toma la variable
estadística es demasiado grande o la variable es continua no
es útil elaborar una tabla de frecuencias como la vista
anteriormente. En estos casos se realiza un agrupamiento de
los datos en intervalos y se hace un recuento del número de
observaciones que caen dentro de cada uno de ellos. Dichos
intervalos se denominan intervalos de clase, y al valor de la
variable en el centro de cada intervalo se le llama marca de
clase. De esta forma se sustituye cada medida por la marca de
clase del intervalo a que corresponda. A la diferencia entre el
extremo superior e inferior de cada intervalo se le llama
amplitud del intervalo. Normalmente se trabajará con
intervalos de amplitud constante. La tabla de frecuencias
resultante es similar a la vista anteriormente.
MEDIDAS DE
CENTRALIZACIÓN
Las medidas de centralización o de
tendencia central expresan el valor en
torno al cual se sitúan los datos de una
muestra y son:
O MEDIA ARITMÉTICA

O MEDIANA

O MODA
MEDIA ARITMÉTICA
O La media aritmética es lo que se conoce como media al uso.
Sumamos todos los valores y lo dividimos entre la cantidad de
observaciones. Por ejemplo, imaginemos que queremos saber a
cuantos trozos de pizza tocamos. Hay 10 trozos y somos 5
personas. Si lo repartimos a partes iguales, el resultado será de
2 trozos por persona. Sin darnos cuenta, acabamos de calcular
una media aritmética.
O Lo hacemos cada día constantemente y sin ser conscientes de
ello. Otro ejemplo, tengo 2 horas para realizar tres ejercicios
de estadística. Así pues, dado que en total tengo disponibles
120 minutos, dedicaré en promedio 40 minutos a cada
ejercicio. Puede que le dediquemos 60 minutos a uno y 30
minutos a cada uno de los otros dos, sin embargo, nuestra
cabeza lo suele calcular de este modo.
MEDIA ARITMÉTICA
O Símbolo de la media aritmética → x̄
O Para calcular la media aritmética es necesario
realizar la suma del número de valores de los que
queremos conocer su media. Por ejemplo, si
queremos repartir caramelos entre los alumnos de
una clase de forma equitativa, en primer lugar
calcularemos cuantos caramelos tenemos en total.
O Posteriormente, debemos de saber entre cuantos
alumnos se van a repartir, para poder calcular la
media aritmética. El número de caramelos lo
dividiremos entre el número de alumnos y
obtendremos cuántos caramelos tendremos que
darle a cada uno de ellos para que se repartan de
forma igualitaria.
MEDIA ARITMÉTICA

Es decir, la media se calcula sencillamente sumando los distintos


valores de x y dividiendo por el número de datos. En el caso de que los
diferentes valores de x aparezcan repetidos, tomando entonces los
valores x1, x2, . . . , xk, con frecuencias absolutas n1, n2, . . . , nk, la
media se determina como:
MEDIA ARITMÉTICA
O En el caso de tener una muestra agrupada en k
intervalos de clase la media se puede calcular, a
partir de las marcas de clase ci y el número ni de
datos en cada intervalo, utilizando una expresión
similar a:

O Sin embargo, hay que indicar que la expresión


anterior es solamente aproximada. En el caso de
que sea posible, es más exacto para el cálculo de
la media, no realizar el agrupamiento en intervalos
y usar el anterior método.
MEDIANA
O Una medida de centralización importante es la
mediana Me. Se define ´esta como una medida
central tal que, con los datos ordenados de
menor a mayor, el 50% de los datos son
inferiores a su valor y el 50% de los datos
tienen valores superiores. Es decir, la mediana
divide en dos partes iguales la distribución de
frecuencias o, gráficamente, divide el
histograma en dos partes de áreas iguales.
Vamos a distinguir diversos casos para su
cálculo.
MEDIANA
O Supongamos en primer lugar que los diferentes
valores de la variable no aparecen, en general,
repetidos.
O En este caso, y suponiendo que tenemos los
datos ordenados, la mediana será el valor
central, si N es impar, o la media aritmética de
los dos valores centrales, si N es par. Por
ejemplo, si x = 1, 4, 6, 7, 9, la mediana sería 6.
Por otro lado, si x = 1, 4, 6, 7 la mediana es Me
= (4+6)/2 = 5.
MEDIANA
O En el caso de que tengamos una variable discreta
con valores repetidos sobre la cual hemos
elaborado una tabla de frecuencias se calcula en
primer lugar el número de observaciones N dividido
entre 2.
O Podemos distinguir entonces dos casos. El primero
de ellos es cuando dicho valor N/2 coincide con la
frecuencia absoluta acumulada Nj de un valor xj de
la variable (o, lo que es lo mismo, cuando la
frecuencia relativa acumulada Fj = 0.5). En este
caso la mediana se ha de situar entre este valor de
la variable y el siguiente ya que de esta forma
dividirá la distribución de frecuencias en 2. Es
decir, se calcula como la media aritmética de dicho
valor de la variable y su superior
MODA
O Otra medida de centralización es la moda, que
es el valor que más se repite dentro del
conjunto de datos. Por ejemplo, en el conjunto
siguiente: 9 2 5 7 5 4 1 7 3 9 9, la moda es el
9, que se repite tres veces o, dicho de otro
modo, su frecuencia es tres. Si existen varios
valores que se repiten el mismo número de
veces, se dice que la muestra es multimodal
(bimodal si hay en concreto dos modas).

También podría gustarte