Está en la página 1de 10

INGENIERIA DE SOFTWARE

Pensamiento Matemático

Descripción breve
Conceptos Básicos Estadística

Faiber Jesús Diaz Salcedo


Ingeniería de Software
¿Qué es la estadística?

La Estadística es la parte de las Matemáticas que se encarga


del estudio de una determinada característica en una población,
recogiendo los datos, organizándolos en tablas, representándolos
gráficamente y analizándolos para sacar conclusiones de dicha
población.

Según se haga el estudio sobre todos los elementos de la


población o sobre un grupo de ella, vamos a diferenciar dos tipos de
Estadística:

Estadística descriptiva. Realiza el estudio sobre la población


completa, observando una característica de la misma y calculando
unos parámetros que den información global de toda la población.

Estadística inferencial. Realiza el estudio descriptivo sobre


un subconjunto de la población llamado muestra y, posteriormente,
extiende los resultados obtenidos a toda la población.

Ejemplo: Cuando van a llegar cualquier tipo de elecciones,


por ejemplo, las elecciones generales, es muy frecuente que los
medios de comunicación, nos adelanten los resultados de
encuestas o sondeos en los que se nos indica el resultado final de
dichas elecciones con una precisión y con un error determinados.
Estos sondeos son realizados por distintas técnicas sobre un grupo
más o menos numeroso de personas. Naturalmente, cuánto mayor
sea el número de españoles con derecho a voto encuestados,
mayor será la fiabilidad de la encuesta, pero también mayor será el
coste del sondeo. El estudio de esta muestra se haría mediante
estadística descriptiva, pero lo que nos interesa no es el resultado
de este estudio reducido sino el resultado final de las elecciones. El
paso de generalizar los resultados de la muestra a toda la
población, se hace mediante técnicas de Estadística inferencial. La
elección de la muestra debe hacerse mediante métodos de
muestreo para que el estudio resulte lo más fiable posible.
Conceptos básicos. Ya hemos hablado de ellos en los
ejemplos anteriores, en cualquier estudio estadístico aparecerán los
conceptos: individuo, cada uno de los elementos, personas u
objetos que se van a estudiar; población, que es el conjunto
formado por todos los elementos a los que les vamos a hacer el
estudio; muestra, el subconjunto de la población que elegimos para
hacer un estudio más reducido.

ESTUDIO DE MEDIA Y DESVIACIÓN TÍPICA.

De todas los parámetros estudiados, los más significativos


son la media para las medidas de centralización y la desviación
típica para las medidas de dispersión.

Vamos a hacer un estudio conjunto de ambas para entender


mejor su significado.

La media aritmética es el centro de gravedad de la


distribución estadística. Si nos imaginamos el diagrama de barras o
el histograma de frecuencias apoyado en un punto del eje horizontal
de forma que quedase en equilibrio, el valor de este punto en dicho
eje sería el valor de la media.

Coeficiente de variación. Si hemos realizado un estudio


estadístico en dos poblaciones diferentes, y queremos comparar
resultados, no podemos acudir a la desviación típica para ver la
mayor o menor homogeneidad de los datos, sino a otro parámetro
nuevo, llamado coeficiente de variación y que se define como el
cociente entre la desviación típica y la media.

Puntuaciones normalizadas. Si antes hemos comparado


variables, también podemos estar interesados en comparar datos
de distribuciones distintas y saber, cuál destaca más o menos
dentro de su grupo según la característica observada. Esto lo
vamos a hacer tipificando la variable con la fórmula

VARIABLES ESTADÍSTICAS.

Al hacer un estudio de una determinada población,


observamos una característica o propiedad de sus elementos o
individuos. Por ejemplo, con los alumnos y alumnas de nuestra
clase, podemos estudiar el lugar de residencia, el número de
hermanos, la estatura, etc. Cada una de estas características
estudiadas se llama variable estadística. Aunque este es el
concepto que vamos a utilizar, también reciben el nombre
de carácter estadístico.

Dependiendo de la característica podemos distinguir varios


tipos de variables:

Variable cualitativa. Es aquella característica que no


podemos expresar con números y hay que expresarla con palabras.
Por ejemplo, el lugar de residencia.

Variable cuantitativa. Es cualquier característica que se


puede expresar con números. Por ejemplo, el número de hermanos
o la estatura. Dentro de esta variable podemos distinguir dos tipos:

Variable cuantitativa discreta. Es aquella variable que


puede tomar únicamente un número finito de valores. Por ejemplo,
el número de hermanos.

Variable cuantitativa continua. Es aquella variable que


puede tomar cualquier valor dentro de un intervalo real. Por
ejemplo, la estatura.

MEDIDAS DE ASIMETRÍA.

se han estudiado los parámetros de centralización y de


dispersión que son las medidas más frecuentes que se calculan en
cualquier estudio estadístico.

Sin embargo existe también medidas que indican de la


simetría o asimetría de la distribución y del achatamiento o no de la
misma.

Empezando con la simetría, es lógico pensar que si la


distribución tiene una única moda y es simétrica, entonces las tres
medidas de centralización coinciden. Si no es simétrica, suele
suceder que la mediana esté comprendida entre la moda y la
media.

Medidas de simetría o asimetría. Miden la mayor o menor


simetría de la distribución. Existen dos medidas de este tipo:

Índice de simetría de Pearson:


Índice de simetría de Fisher:

Si la distribución es simétrica, ambos índices son iguales a 0;


si es asimétrica a la derecha, ambos son positivos; y si es
asimétrica a la izquierda, ambos índices son negativos.

Medidas de curtosis. Miden la mayor o menor concentración


de datos alrededor de la media. Se suele medir con el coeficiente
de curtosis:

Si este coeficiente es nulo, la distribución se dice normal


(similar a la distribución normal de Gauss) y recibe el nombre de
mesocúrtica.

Si el coeficiente es positivo, la distribución se llama


leptocúrtica, más puntiaguda que la anterior. Hay una mayor
concentración de los datos en torno a la media.

Si el coeficiente es negativo, la distribución se llama


platicúrtica y hay una menor concentración de datos en torno a la
media. sería más achatada que la primera.
FRECUENCIAS. TABLAS ESTADÍSTICAS.

Para hacer un estudio estadístico de una característica de


una población, necesitamos elegir dicha característica y después
hacer un recuento. Uno de los primeros recuentos que hacemos en
clase es en la elección del delegado o delegada del curso. Este
recuento puede resultar más o menos fácil dependiendo del número
de alumnos y alumnas que tengamos, ¿cuántas veces nos ha
pasado que no nos coincide el recuento final de los votos con el
número de personas que hay?

Una vez que hemos realizado el recuento, hay que organizar


los datos y expresarlos de forma simplificada para que su
interpretación sea fácil y rápida. Esto se hace disponiendo los datos
por columnas o filas formando lo que llamamos una tabla
estadística.

Número de veces que


Valores de la variable
aparecen
x1 f1
x2 f2
... ...
xn fn
N: Número total de
datos

En primer lugar la tabla estará formada por estas dos


columnas, pero más tarde iremos añadiendo más según los
cálculos que necesitemos. Sin hacer muchos cálculos, podemos ir
completando la tabla con las frecuencias, que definimos a
continuación:

Frecuencia absoluta. Es el número de veces que aparece


cualquier valor de la variable. Se representa por fi. En algunos libros
de texto nos la encontraremos representada por ni.
Frecuencia absoluta acumulada. Es la suma de la
frecuencia absoluta de un valor de la variable con todos los
anteriores. Se representa por Fi.

Frecuencia relativa. Es el cociente entre la frecuencia


absoluta y el número de datos (N). Se representa por hi. Al
multiplicarla por 100 obtenemos el porcentaje de individuos que
presentan esta característica.

Frecuencia relativa acumulada. Es la suma de la frecuencia


relativa de un valor de la variable con todos los anteriores. También
se puede definir como el cociente entre la frecuencia absoluta
acumulada y el número total de datos. Se representa por Hi.

Vamos a realizar tres estudios estadísticos entre nuestros


alumnos y alumnas, cada uno de ellos correspondiente a un tipo de
variable estadística: lugar de residencia, número de hermanos y
estatura. Preguntamos uno a uno sobre estas características y
obtenemos:

lugar de residencia: Pozo Alcón, P.A., P.A., P.A., P.A., P.A.,


P.A., P.A., P.A., Fontanar, Campo Cebas.

número de hermanos: 2, 3, 2, 3, 3, 3, 3, 4, 2, 2, 2.

estatura: 1.59, 1.75, 1.71, 1.85, 1.64, 1.62, 1.66, 1.60, 1.63,
1.76, 1.66.

En las siguientes escenas puedes construir la tabla de


frecuencias para variables discretas y continuas.

MOMENTOS.

Se llama momento de orden r respecto de un valor "c" a la


expresión:

Si c=0 se le llama momento respecto al origen:


Los primeros momentos respecto al origen son:

Si c= se le llama momento respecto de la


media o momento central:

Los primeros momentos respecto a la media son:

GRÁFICOS ESTADÍSTICOS.

Diagrama de barras o rectángulos. Consiste en dos ejes


perpendiculares y una barra o rectángulo para cada valor de la
variable. Normalmente, se suele colocar en el eje horizontal los
valores de la variable (aunque también se puede hacer en el
vertical). El otro eje se gradúa según los valores de las frecuencias.
La representación gráfica consiste en dibujar una barra o un
rectángulo para cada uno de los valores de la variable de altura
igual a su frecuencia.

Histograma de frecuencias. Es un caso particular del


diagrama anterior en el caso de variables continuas. Si los
intervalos son correlativos, los rectángulos aparecen pegados en la
representación gráfica. En caso de que la amplitud de los intervalos
no se igual para todos, hay que hacer coincidir el área del
rectángulo con la frecuencia del intervalo. Un ejemplo muy utilizado
de histograma es una pirámide de población.

Polígono de frecuencias. Representamos dos ejes


perpendiculares y representamos en el horizontal los valores de la
variable y en el vertical las frecuencias. Representamos los puntos
que tiene por primera coordenada el valor de la variable y por
segunda el valor de la frecuencia. Uniendo todos los puntos
obtenemos una línea poligonal que es la representación que
buscamos.
Diagrama de sectores. Consiste en dividir un círculo en
tantos sectores como valores de la variable. La amplitud de cada
sector debe ser proporcional a la frecuencia del valor
correspondiente.

Cartograma. Cuando el estudio estadístico se hace sobre


una zona geográfica, la representación gráfica se puede hacer
sobre un mapa, coloreando con distintos colores cada una de las
regiones representadas en el estudio.

Pictograma. Consiste en la representación gráfica del


estudio realizado utilizando dibujos alusivos a los distintos valores
de la variable estadística.

Parámetros estadísticos. Son datos que resumen el estudio


realizado en la población. Pueden ser de dos tipos:

Parámetros de centralización. Son datos que


representan de forma global a toda la población. Entre ellos vamos
a estudiar la media aritmética, la moda y la mediana.

Parámetros de dispersión. Son datos que informan de la


concentración o dispersión de los datos respecto de los parámetros
de centralización. Por ejemplo el recorrido, la desviación media, la
varianza y la desviación típica.

También podría gustarte