Está en la página 1de 27

1

INTRODUCCIÓN
La estadística es el estudio de los modos de recolectar y analizar datos con el fin de
establecer conclusiones acerca del medio del cual se han obtenido los datos. a es la ciencia
que trata sobre la toma, organización recopilación, presentación y análisis de datos para
deducir conclusiones sobre ellos y para tomar decisiones que estén de acuerdo con los
análisis efectuados.

El objetivo de este texto es dar a conocer la importancia que tiene la estadística.


2

Definición de Estadística
 
La estadística es la ciencia que se encarga de la recopilación, representación y el uso de
datos sobre una o varias características de interés para, a partir de ellos, tomar decisiones o
extraer conclusiones generales.

La estadística se divide en dos grandes ramas de estudio que son:

La estadística descriptiva, la cual se encarga de la recolección, clasificación y descripción


de datos muéstrales o poblacionales, para su interpretación y análisis.

La estadística matemática o inferencial, que desarrolla modelos teóricos que se ajusten a


una determinada realidad con cierto grado de confianza.

Estas dos ramas no son independientes; por el contrario, son complementarias y entre
ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin de que quien
tenga el poder de decisión, tome las medidas necesarias para transformar ese futuro o para
mantener las condiciones existentes.

Siendo la estadística aplicada la unión de la estadística descriptiva e inferencial.


 

 
Conceptos de Básicos

Población. Es el conjunto de todos los elementos a los que se somete a un estudio


estadístico.
Muestra. Es un conjunto representativo de la población sujeta a estudio, el número de
individuos de una muestra es menor que el de la población.
Individuo. Es cada uno de los elementos que componen la población.

 
3

Muestreo. Es la reunión de datos que se desea estudiar, obtenidos de una proporción


reducida y representativa de la población.
Valor. Es cada uno de los distintos resultados que se pueden obtener en un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Dato. Es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Clasificación de la estadística

La estadística se puede clasificar en dos grandes ramas:

Estadística descriptiva o deductiva. Se emplea simplemente para resumir de forma


numérica o gráfica un conjunto de datos. Se restringe a describir los datos que se analizan.
Si aplicamos las herramientas ofrecidas por la estadística descriptiva a una muestra, solo
nos limitaremos a describir los datos encontrados en dicha muestra, no se podrá generalizar
la información hacia la población.

Estadística inferencial o inductiva. La estadística inferencial permite realizar


conclusiones o inferencias, basándose en los datos simplificados y analizados de una
muestra hacia la población o universo. Por ejemplo, a partir de una muestra representativa
tomada a los habitantes de una ciudad, se podrá inferir la votación de todos los ciudadanos
que cumplan los requisitos con un error de aproximación.

Tipos de variables

Variable cualitativa. Las variables cualitativas se refieren a características o cualidades


que no pueden ser medidas con números. Podemos distinguir dos tipos:

Variable cualitativa nominal. Una variable cualitativa nominal presenta modalidades no


numéricas que no admiten un criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y
viudo.

Variable cualitativa ordinal o variable cuasi cuantitativa

Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un
orden. Por ejemplo:

La nota en un examen: suspenso, aprobado, notable, sobresaliente.

Puesto conseguido en una prueba deportiva: 1º, 2º, 3º,...

Medallas de una prueba deportiva: oro, plata, bronce.


4

Variable cuantitativa. Una variable cuantitativa es la que se expresa mediante un número,


por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

Variable discreta. Una variable discreta es aquella que solo puede tomar un número finito
de valores entre dos valores cualesquiera de una característica.

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continúa. Una variable continua es aquella que puede tomar un número infinito de
valores entre dos valores cualesquiera de una característica.

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

En la práctica medimos la altura con dos decimales, pero también se podría dar con tres
decimales.

Variable aleatoria. Se llama variable aleatoria a toda función que asocia a cada elemento
del espacio maestral E un número real.

Se utilizan letras mayúsculas X, Y, ... para designar variables aleatorias, y las respectivas
minúsculas (x, y, ...) para designar valores concretos de las mismas.

Variable aleatoria discreta. Una variable aleatoria discreta es aquella que sólo puede
tomar valores enteros.

Ejemplos: el número de hijos de una familia, la puntuación obtenida al lanzar un dado.

Variable aleatoria continúa. Una variable aleatoria continua es aquella que puede tomar
todos los valores posibles dentro de un cierto intervalo de la recta real.

Ejemplos: la altura de los alumnos de una clase, las horas de duración de una pila.

Variable aleatoria binomial. La variable aleatoria binomial, X, expresa el número de


éxitos obtenidos en cada prueba del experimento.

La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2,
3, 4,..., n suponiendo que se han realizado n pruebas.

Ejemplo: k = 6, al lanzar una moneda 10 veces y obtener 6 caras.

Variable aleatoria normal. Una variable aleatoria continua, X, sigue una distribución
normal de media μ y desviación típica σ, y se designa por N(μ, σ), si se cumplen las
siguientes condiciones:

1. La variable puede tomar cualquier valor: (-∞, +∞)


5

2. La función de densidad, es la expresión en términos de ecuación matemática de la curva


de Gauss.

Variable estadística bidimensional. Una variable bidimensional es una variable en la que


cada individuo está definido por un par de caracteres, (X, Y).

Estos dos caracteres son a su vez variables estadísticas en las que sí existe relación entre
ellas, una de las dos variables es la variable independiente y la otra variable dependiente.

Nivel de medición

Puede especificar el nivel de medición como Escala (datos numéricos de una escala de
intervalo o de razón), Ordinal o Nominal. Los datos nominales y ordinales pueden ser de
cadena (alfanuméricos) o numéricos.

Nominal. Una variable puede ser tratada como nominal cuando sus valores representan
categorías que no obedecen a una clasificación intrínseca. Por ejemplo, el departamento de
la compañía en el que trabaja un empleado. Algunos ejemplos de variables nominales son:
región, código postal o confesión religiosa.

Ordinal. Una variable puede ser tratada como ordinal cuando sus valores representan
categorías con alguna clasificación intrínseca. Por ejemplo, los niveles de satisfacción con
un servicio, que abarquen desde muy insatisfecho hasta muy satisfecho. Entre los ejemplos
de variables ordinales se incluyen escalas de actitud que representan el grado de
satisfacción o confianza y las puntuaciones de evaluación de las preferencias.

Escalas. Una variable puede tratarse como escala (continua) cuando sus valores representan
categorías ordenadas con una métrica con significado, por lo que son adecuadas las
comparaciones de distancia entre valores. Son ejemplos de variables de escala: la edad en
años y los ingresos en dólares.

Distribución de frecuencias

Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la


variable por filas. En las columnas se dispone el número de ocurrencias por cada valor,
porcentajes, etc. La finalidad de las agrupaciones en frecuencias es facilitar la obtención de
la información que contienen los datos.

Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra de la


exhibición de imágenes violentas por televisión, para lo cual han recogido los siguientes
datos:
6

Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable
acompañados del número de veces (la frecuencia) que aparece cada valor:

X: Símbolo genérico de la variable.

f: Frecuencia (también se simboliza como ni).

La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria
de los individuos del grupo estudiado es indiferente.

La interpretación de los datos ha sido facilitada porque se ha reducido el número de


números a examinar (en vez de los 20 datos originales, la tabla contiene 5 valores de la
variable y 5 frecuencias).

Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el
número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o "pi"),
frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de los valores
iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No obstante la frecuencia
acumulada también es definida incluyendo al valor de referencia), frecuencias acumuladas
relativas (la frecuencia acumulada relativa es el total de frecuencias relativas de los valores
iguales o inferiores al de referencia, y se simbolizan "fr" o "pa")

Ejemplo: Consideremos el siguiente grupo de datos:

La distribución de frecuencias es:


7

La reducción de datos mediante el agrupamiento en frecuencias no facilita su


interpretación: La tabla es demasiado grande. Para reducir el tamaño de la tabla agrupamos
los valores en intervalos, y las frecuencias son las de los conjuntos de valores incluidos en
los intervalos:

Ahora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar inmediatamente
que el intervalo con mayor número de datos es el 34-39, o que el 75% de los datos tiene
valor inferior a 46.

Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".

Elementos básicos de las tablas de intervalos:

Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en una
distribución de frecuencias

Límites aparentes: Valores mayor y menor del intervalo que son observados en la tabla.
Dependen de la precisión del instrumento de medida. En el ejemplo, los límites aparentes
del intervalo con mayor número de frecuencias son 34 y 39.

Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se contara
con un instrumento de precisión perfecta. En el intervalo 34-39, estos límites son 33.5 y
39.5

Punto medio del intervalo (Mco Marca de clase): Suma de los límites divididos por dos. Mc
del intervalo del ejemplo= 36.5

Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto inferior.
En el ejemplo es igual a 6.
8

REPRESENTACIÓN GRÁFICA DE DATOS

Las tablas estadísticas representan toda la información de modo esquemático y están


preparadas para los cálculos posteriores. Los gráficos estadísticos nos transmiten esa
información de modo más expresivo, nos van a permitir, con un sólo golpe de vista,
entender de que se nos habla, observar sus características más importantes, incluso sacar
alguna conclusión sobre el comportamiento de la muestra donde se está realizando el
estudio.

Los gráficos estadísticos son muy útiles para comparar distintas tablas de frecuencia.

Los gráficos estadísticos más usuales son:

DIAGRAMA DE BARRAS. Se utiliza para la representación de variables cuantitativas


discretas, cada valor de la variable se representa por un punto sobre el eje OX y sobre él se
dibuja una barra de longitud igual o proporcional a su frecuencia absoluta. Si la frecuencia
absoluta que se utiliza es la acumulativa, el diagrama de barras que se obtiene es: diagrama
de barras acumulativo

HISTOGRAMA. Se utiliza para la representación de variables cuantitativas continuas,


cada intervalo se representa sobre el eje OX , este será la base del rectángulo que se dibuja
sobre él con altura igual o proporcional a su frecuencia absoluta. Como los intervalos son
consecutivos, los rectángulos quedan adosados. Si se utilizarán rectángulos de amplitud
diferente, el área del rectángulo es la que tendría que ser proporcional a la frecuencia
absoluta correspondiente a ese intervalo. Histograma acumulativo, si se utiliza la frecuencia
absoluta acumulativa.

POLÍGONO DE FRECUENCIAS.

Se utilizan para variables estadísticas cuantitativas, discretas o continuas.

Para una variable discreta, el polígono de frecuencias se obtiene uniendo por una poligonal,
los extremos superiores de las barras.

Para una variable continua, el polígono de frecuencias se obtiene uniendo por una poligonal
los puntos medios de la base superior de los polígonos del histograma.

Las escalas utilizadas para representar los polígonos de frecuencias influyen mucho por el
impacto visual de los mismos.

DIAGRAMA DE SECTORES. Se utiliza para todo tipo de variable estadística,


cuantitativa o cualitativa. Consiste en dibujar sectores sobre un círculo, siendo la amplitud
de los sectores proporcional a su frecuencia absoluta, cada sector se rellena con un color
diferente.
9

Polígono de frecuencias. El polígono de frecuencias se utiliza para representar variables


cuantitativas. Se construye uniendo los extremos de un diagrama de barras o puntos medios
de los rectángulos de un histograma.

Ojivas. La ojiva es la distribución de frecuencias, es decir, que en ella se permite ver


cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de
solo exhibir los números asignados a cada intervalo.

La ojiva apropiada para información que presente frecuencias mayores que el dato que se
está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la
que se asigna a valores menores, tendrá una pendiente positiva. Una gráfica similar al
polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma
técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor
que y las ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por
esto la aplicación de la técnica es parcial):
Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor que" sucede con el
extremo izquierdo; para la ojiva "menor que", con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de
clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la
mayor.

Ejemplo de ojivas: los siguientes datos son de 4o calificaciones:


10

rango:54.
k: 7.
ic:  R+1 = 54+1=  55= 8
        K       7       7
LI: 63
LS: 63 + 8 - 1= 7o
Tabla
    

Grafica
11

GRÁFICAS  DE LINEALES

Se ilustra  mediante segmentos de línea los cambios en cantidades con respecto al tiempo.
Son especialmente útiles en el comercio y en los negocios.  

Gráfico de Puntos. El denominado gráfico de puntos permite mostrar apropiadamente a


pequeños conjuntos de datos y tiene la gran ventaja de ser fácilmente construido a mano.

En este tipo de gráfico, la abscisa representa los valores de la variable estudiada y la


ordenada la frecuencia de aparición de un valor en el conjunto de datos estudiado. 

Para la construcción de un gráfico de puntos, es necesario que el alumno conozca la


representación de puntos en una recta graduada.

Por ejemplo, el siguiente gráfico representa una alumna de cuarto medio cuya altura es 162
cm.

Si hubiese que representar otra alumna con esta misma estatura, el gráfico se vería de la
siguiente forma:

 Ahora, si se quisiera representar una muestra de la estatura de treinta alumnas de cuarto


año medio, el gráfico quedaría como sigue.
12

Se puede ver con facilidad la distribución de los valores observados y describir la


información contenida en ellos.

Medidas de tendencia central. De la tendencia central de la distribución, nos interesa


calcular un valor central que actúe como resumen numérico para representar al conjunto de
datos. Estos valores son las medidas o índices de tendencia central. Los índices de
tendencia central permiten representar la distribución con un único valor y facilitan la
comparación de otros conjuntos de puntuaciones de una variable.

Las medidas más utilizadas en el análisis de datos son: la media aritmética, la mediana y la
moda.

La media aritmética. También se llama promedio o media, es la medida de tendencia


central más conocida y usada en la práctica, por su sencillez de cálculo y es el fundamento
de un gran número de técnicas estadísticas. Indica la tendencia general de una distribución
de frecuencias de una variable y es el valor central de las observaciones “centro de
gravedad”.

La media ponderada: es una medida de tendencia central, que se da asignándole a cada


clase un peso, y obteniendo un promedio de los pesos, teniendo estos pesos valores
diferentes. Es decir, algunos tienen una importancia relativa (peso) respecto a los demás
elementos. La diferencia cuando calculamos la media aritmética es que a todos los pesos se
les da el mismo valor.

La media geométrica. La media geométrica de una cantidad finita de números (digamos n


números) es la raíz n-ésima del producto de todos los números.

Sólo es relevante la media geométrica si todos los números son positivos. Si uno de ellos es
0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos)
entonces la media geométrica es, o bien negativa o bien inexistente en los números reales.

En muchas ocasiones se utiliza su trasformación en el manejo estadístico de variables con


distribución no normal.

Sea una distribución de frecuencias (x i , n i ). La media geométrica, que denotaremos por


G. se define como la raíz N-ésima del producto de los N valores de la distribución.

Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la


misma, pero utilizando la marca de clase (Xi). xi = 0 entonces G se anula, y si la variable
toma valores negativos se pueden presentar una gama de casos particulares en los que
13

tampoco queda determinada debido al problema de las raíces de índice par de números
negativos.

El empleo más frecuente de la media geométrica es el de promediar variables tales como


porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone que la
variable presenta variaciones acumulativas.

Ventajas e inconvenientes: en su cálculo intervienen todos los valores de la distribución.


Los valores extremos tienen menor influencia que en la media aritmética, es única. Su
cálculo es más complicado que el de la media aritmética.

La mediana. Es el índice empleado cuando la distribución es asimétrica y no es posible


aplicar la media aritmética. La mediana no se ve afectada por los valores extremos que en
su cálculo ocupan las posiciones centrales. Por lo tanto, la mediana es un valor apropiado
para representar la tendencia central de la distribución y se puede obtener todo tipo de
variables excepto en variables cualitativas.

La mediana de una variable X, representada por Md, se define como el valor de la variable
que divide la distribución de frecuencias en dos partes iguales, conteniendo cada una el
50% de las observaciones.

Para el cálculo de la mediana con pocos casos se procede de la siguiente manera: se


ordenan las n puntuaciones de menor a mayor.

Se observa si el número de observaciones n es impar o par. Si es impar, el valor de la


mediana es el de la observación que ocupa la posición central, dentro de ese conjunto de
observaciones ya ordenadas. Si es par, la mediana es la media aritmética de los dos valores
centrales de la distribución.

Lo normal es que el número n de observaciones no sea pequeño; incluso aparecerán


repetidos y, por ello, los datos se presentarán en tablas de distribución de frecuencias
agrupadas o no en intervalos.

Cuando los datos están en intervalos se denomina intervalo crítico y se corresponde con el
que la frecuencia absoluta acumulada na es igual o superior a n/2.

Cuando los datos no están agrupados en intervalos, el cálculo es un caso particular de la


fórmula anterior en la que la amplitud de los intervalos es igual a uno (I = 1).

La mediana se puede calcular en cualquier distribución excepto cuando los datos están
agrupados y existe uno abierto en el que se encuentra la mediana.

La moda. La moda es otro índice de tendencia central que se puede obtener tanto en
variables cualitativas como en cuantitativas. Se representa por Mo, y se define como el
valor o categoría de la variable con mayor frecuencia absoluta.
14

Si se da en una variable cuantitativa con los datos no agrupados en intervalos, la moda es el


valor con la mayor frecuencia absoluta.

Si se da en una distribución de una variable cuantitativa en intervalos, se localiza el


intervalo modal que es el intervalo con la frecuencia máxima y la moda es el medio de
dicho intervalo.

Una frecuencia es un modal cuando existe un único valor con la frecuencia máxima. Si
presenta varios valores con la frecuencia más alta, ésta será bimodal, trimodal,...

Sus principales características son: es un índice de cálculo sencillo y de fácil interpretación.

Es el único que, además de aplicarse a variables cuantitativas, se puede calcular en


variables cualitativas.

Sólo se excluye su cálculo en el supuesto de que coincida con el intervalo abierto.

La elección de una medida de tendencia central

Para seleccionar un valor que resuma adecuadamente la tendencia central de la distribución


de frecuencias,se recomienda como primera opción la media aritmética, por que en ella
basan su importancia muchos estadísticos. Únicamente se desaconseja su uso con pocos
valores extremos, cuando el nivel de medida de la variable es nominal u ordinal y/o en
datos agrupados en los que existen intervalos abiertos en los extremos de la distribución.

Cuando la media no es aplicable, se recomienda la mediana. Y por último, si ésta no es


posible, se aconseja tomar la moda. Resaltar que si una variable cuantitativa es simétrica y
unimodal, coinciden todos los valores de la media, mediana y moda.

Medidas de tendencia no central

Estas medidas descriptivas permiten ubicar la posición que ocupa un valor dentro de un
conjunto de datos, se calcula para variables de tipo cualitativo ordinal y de tipo cuantitativo
(discreta y continua), cabe agregar que los resultados se expresan en las mismas unidades
de los datos en estudio.

Percentiles: son aquellos valores que dividen los datos ordenados en cien partes iguales.
Existen noventa y nueve percentiles, dicha medida hace referencia a un porcentaje de casos
por debajo del percentil y otros porcentaje por encima. Entre dos percentiles consecutivos
cualesquiera se encuentra un 1% o 1/100 partes de los datos.

Deciles: son valores que dividen los datos ordenados en diez partes iguales. Existen nueve
deciles, dicha medida deja un porcentaje de datos por debajo del decil y otro porcentaje por
encima. Entre dos deciles consecutivos cualesquiera se encuentra un 10% o 1/10 partes de
los elementos.
15

CUARTILES: son valores que dividen los datos ordenados en cuatro partes iguales.
Existen tres cuartiles, por lo tanto dicha medida hace referencia a un porcentaje de casos
por debajo del cuartil y otro porcentaje por encima Entre dos percentiles consecutivos
cualesquiera se encuentra un 25% o 1/4 partes de los datos.

DECILES. Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son también un caso particular de los percentiles. Los
deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.

Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.

CUARTILES. Los cuartiles son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales.

Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la
mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual
o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

PERCENTILES. Los percentiles son, tal vez, las medidas más utilizadas para propósitos
de ubicación o clasificación de las personas cuando atienden características tales como
peso, estatura, etc.

Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien
partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales
el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,...,
percentil 99.

Medidas de dispersión. Parámetros estadísticos que indican cómo se alejan los datos
respecto de la media aritmética. Sirven como indicador de la variabilidad de los datos. Las
medidas de dispersión más utilizadas son el rango, la desviación estándar y la varianza.

MEDIDAS DE DESVIACIÓN MEDIA O DESVIACIÓN PROMEDIO

La desviación media o desviación promedio es la media aritmética de los valores absolutos


de las desviaciones respecto a la media aritmética.

PROPIEDADES. Guarda las mismas dimensiones que las observaciones. La suma de


valores absolutos es relativamente sencilla de calcular, pero esta simplicidad tiene un
inconveniente: Desde el punto de vista geométrico, la distancia que induce la desviación
media en el espacio de observaciones no es la natural (no permite definir ángulos entre dos
conjuntos de observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de
hacer inferencia a la población.
16

Cuando mayor sea el valor de la desviación media, mayor es la dispersión de los datos. Sin
embargo, no proporciona una relación matemática precisa entre su magnitud y la posición
de un dato dentro de una distribución.

La desviación media al tomar los valores absolutos mide una observación sin mostrar si la
misma está por encima o por debajo de la media aritmética.

Medidas de dispersión relativa: que determinan la dispersión de la distribución estadística


independientemente de las unidades en que se exprese la variable. Se trata de parámetros
más técnicos y utilizados en estudios específicos, y entre ellas se encuentran los
coeficientes de apertura, el recorrido relativo, el coeficiente de variación (índice de
dispersión de Pearson) y el índice de dispersión mediana.

MEDIDAS DE FORMA. Medidas de forma permiten comprobar si una distribución de


frecuencia tiene características especiales como simetría, asimetría, nivel de concentración
de datos y nivel de apuntamiento que la clasifiquen en un tipo particular de distribución.

Las medidas de forma son necesarias para determinar el comportamiento de los datos y así,
poder adaptar herramientas para el análisis probabilístico.

Un sesgo es un error que aparece en los resultados de un estudio debido a factores que
dependen de la recolección, análisis, interpretación, publicación o revisión de los datos que
pueden conducir a conclusiones que son sistemáticamente diferentes de la verdad o
incorrectas.

La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada o achatada
está una curva o distribución.

Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a
mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.

La curtosis se mide promediando la cuarta potencia de la diferencia entre cada elemento del
conjunto y la media, dividido entre la desviación típica elevado también a la cuarta
potencia.
17

INTRODUCCION A LA PROBABILIDAD

Probabilidad. La probabilidad es una herramienta de ayuda para la toma de decisiones


porque proporciona una forma de medir, expresar y analizar las incertidumbres asociadas
con eventos futuros de razones entre el número de casos favorables y el número de casos
posibles. ¿Qué es probabilidad? Es una medida numérica de la posibilidad de que ocurrirá
un evento en la que sus valores se asignan en una escala de 0 a 1.

MODELOS MATEMÁTICOS Y EXPERIMENTOS ALEATORIOS

Un Modelo Matemático. Es un patrón teórico ó experimental que permite interpretar


mediante métodos matemáticos fenómenos reales o problemas técnicos para
hacer inferencia y tomar decisiones.

Los modelos matemáticos son de dos clases:

a) Determinísticos: cuando se tiene plena certeza acerca del funcionamiento y los


resultados del problema.

b) Aleatorios o Estocásticos. Cuando sólo se tiene certeza parcial acerca del


funcionamiento y se conocen los resultados probables del modelo. Un modelo matemático
debe ser simple e involucrar las variables que lo hacen completo. Las leyes de la dinámica
clásica de partículas pueden considerarse un modelo matemático determinístico.

El modelo de regresión lineal estadístico es en esencia un modelo matemático aleatorio.

El modelo de la teoría de probabilidad que veremos más adelante es justamente el modelo


general de los experimentos aleatorios. Probabilidad y Estadística

ESPACIOS MUESTRALES Y EVENTOS

Definiciones

1. Un experimento aleatorio es aquel que proporciona diferentes resultados aun cuando se


repita siempre de la misma manera.

2. El conjunto de los posibles resultados de un experimento aleatorio recibe el nombre de


espacio maestral del experimento. Denotaremos el espacio maestral con la letra S.

3. Un evento es un subconjunto del espacio muestra de un experimento aleatorio

Sucesos

Antes de iniciar el cálculo de probabilidades, resulta interesante y necesario comprender los


conceptos de sucesos y las relaciones que existen entre ellos.
18

A continuación se presentan tales conceptos. (Como siempre, cualquier duda debe ser
consultada con el instructor respectivo, de manera que puedan ser aclaradas antes de
continuar)

Suceso elemental. Es cada una de las posibles soluciones que se pueden obtener al realizar
un experimento aleatorio.

Ej. Al lanzar un dado, los sucesos elementales son:

Salga el número 1 {1}

Salga el número 2 {2}

Salga el número 3 {3}

Salga el número 4 {4}

Salga el número 5 {5}

Salga el número 6 {6}

Ej. Al lanzar una moneda, los sucesos elementales son:

Salga una cara {C}

Salga un sello {S}

Suceso compuesto. Es un sub-conjunto formado por dos o más sucesos elementales.

Ej. Al lanzar un dado, algunos sucesos compuestos podrían ser:

Salga un número par {2,4,6}

Salga un número impar {1,3,5}

Salga un número primo {1,2,3,5}

Salga un número menor que tres {1,2}, entre otros.

Eventos mutuamente excluyentes. Los eventos mutuamente excluyentes son aquellos en


los que si un evento sucede significa que el otro no puede ocurrir. Si bien suelen usarse en
teorías científicas, también son parte de las leyes y los negocios. Como resultado, entender
los eventos mutuamente excluyentes puede ser importante para una variedad de disciplinas.
19

Fórmula

La fórmula matemática para determinar la probabilidad de los eventos mutuamente


excluyentes es P(A U B) = P(A) + P(B). Dicho en voz alta, la fórmula es "Si A y B son
evento mutuamente excluyentes, entonces la probabilidad de que A o B suceda es
equivalente a la probabilidad del evento A más la probabilidad del evento B".

DIAGRAMAS DE ÁRBOL

 Los diagramas de árbol son ordenaciones empleadas para enumerar todas las posibilidades
lógicas de una secuencia de eventos, donde cada evento puede ocurrir en un número finito.
Proporcionan un método sistemático de enumeración objetiva de los resultados.

A continuación, se presenta un Diagrama de Árbol, referente a las respuestas que se pueden


dar a tres preguntas de Verdadero o Falso.

Tenemos dos opciones posibles para cada pregunta, V o F el árbol presenta dos ramas en
cada pregunta.

 1) La teoría de conjuntos fue desarrollada por G. Cantor.

a) V             b) F

2) G. Cantor es de origen francés.

a) V             b) F

 3) La teoría de conjuntos sirve para simplificar la Estadística.

a) V             b) F
20

Las diferentes formas en que se puede contestar son ocho y forman el espacio muestral.

 S = {VVV, VVF, VFV, VFF, FVV, FVF, FFV, FFF}

Se tienen en un estante 3 libros uno de Álgebra, otro de Contabilidad y otro de Biología.


¿De cuántas formas distintas se pueden ordenar los libros?

TECNICAS DE CONTEO

El principio fundamental en el proceso de contar ofrece un método general para contar el


número de posibles arreglos de objetos dentro de un solo conjunto o entre carios conjuntos.
Las técnicas de conteo son aquellas que son usadas para enumerar eventos difíciles de
cuantificar.

Si un evento A puede ocurrir de n1 maneras y una vez que este ha ocurrido, otro evento B
puede n2 maneras diferentes entonces, el número total de formas diferentes en que ambos
eventos pueden ocurrir en el orden indicado, es igual a n1 x n2.

¿De cuántas maneras pueden repartirse 3 premios a un conjunto de 10 personas, suponiendo


que cada persona no puede obtener más de un premio?

Aplicando el principio fundamental del conteo, tenemos 10 personas que pueden recibir el
primer premio. Una vez que éste ha sido entregado, restan 9 personas para recibir el
segundo, y posteriormente quedarán 8 personas para el tercer premio. De ahí que el número
de maneras distintas de repartir los tres premios.

10 x 9 x 8 = 720

¿Cuántas placas de automóvil se pueden hacer utilizando dos letras seguidas de tres cifras?
No se

admiten repeticiones.

26 x 25 x 10 x 9 x 8 = 468000

n un número entero positivo, el producto n (n-1) (n-2)...3 x 2 x 1 se llama factorial de n.


21

El símbolo se lee factorial y es el producto resultante de todos los enteros positivos de 1 a


n; es decir, sea

5! = 5 x 4 x 3 x 2 x 1 = 120

Por definición 0! = 1

Si el número de posibles resultados de un experimento es pequeño, es relativamente fácil


listar y contar todos los posibles resultados. Al tirar un dado, por ejemplo, hay seis posibles
resultados.

Si, sin embargo, hay un gran número de posibles resultados tales como el número de niños
y niñas por familias con cinco hijos, sería tedioso listar y contar todas las posibilidades. Las
posibilidades serían, 5 niños, 4 niños y 1 niña, 3 niños y 2 niñas, 2 niños y 3 niñas, etc.

Para facilitar el conteo examinaremos tres técnicas:

* La técnica de la multiplicación

* La tecnica aditiva

* La tecnica de la suma o Adicion

* La técnica de la permutación

* La técnica de la combinación.

PRINCIPIO DE LA MULTIPLICACION. Si se desea realizar una actividad que consta


de r pasos, en donde el primer paso de la actividad a realizar puede ser llevado a cabo de
N1 maneras o formas, el segundo paso de N2 maneras o formas y el r-ésimo paso de Nr
maneras o formas, entonces esta actividad puede ser llevada a efecto de. El principio
multiplicativo implica que cada uno de los pasos de la actividad deben ser llevados a efecto,
uno tras otro. Si un evento E1 puede suceder de n1 maneras diferentes, el evento E2 puede
ocurrir de n2 maneras diferentes, y así sucesivamente hasta el evento Ep el cual puede
ocurrir de np maneras diferentes, entonces el total de maneras distintas en que puede
suceder el evento “ocurren E1 y E2…..y Ep” es igual a producto.

N1 x N2 x ..........x Nr maneras o formas

Ejemplo. Se dispone de 3 vías para viajar de C1 a C2 y de 4 vías para viajar de C2 a C1.


¿De cuántas formas se puede organizar el viaje de ida y vuelta de C1 a C2.Respuesta: (3)
(4)=12
22

PRINCIPIO ADITIVO. Si se desea llevar a efecto una actividad, la cual tiene formas
alternativas para ser realizada, donde la primera de esas alternativas puede ser realizada de
M maneras o formas, la segunda alternativa puede realizarse de N maneras o formas ..... y
la última de las alternativas puede ser realizada de W maneras o formas, entonces esa
actividad puede ser llevada a cabo de,

M + N + .........+ W maneras o formas

Ejemplos:

Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que puede
seleccionar de entre las marcas Whirlpool, Elsy y General Electric, cuando acude a hacer la
compra se encuentra que la lavadora de la marca W se presenta en dos tipos de carga ( 8 u
11 kilogramos), en cuatro colores diferentes y puede ser automática o semiautomática,
mientras que la lavadora de la marca E, se presenta en tres tipos de carga (8, 11 o 15
kilogramos), en dos colores diferentes y puede ser automática o semiautomática y la
lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11 kilogramos, dos
colores diferentes y solo hay semiautomática. ¿Cuántas maneras tiene esta persona de
comprar una lavadora?

Solución:

M = Número de maneras de seleccionar una lavadora Whirlpool

N = Número de maneras de seleccionar una lavadora de la marca Elsy

W = Número de maneras de seleccionar una lavadora de la marca General Electric

M = 2 x 4 x 2 = 16 maneras

N = 3 x 2 x 2 = 12 maneras

W = 1 x 2 x 1 = 2 maneras

M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora

PRINCIPIO DE LA SUMA O ADICCION

Si una primera operación puede realizarse de m maneras y una segunda operación de n


maneras, entonces una operación o la otra pueden efectuarse de:

m+n maneras.

Ejemplo. Una pareja que se tiene que casar, junta dinero para el enganche de su casa, en el
fraccionamiento lomas de la presa le ofrecen un modelo económico ó un condominio, en el
fraccionamiento Playas le ofrecen un modelo económico como modelos un residencial, un
23

californiano y un provenzal. ¿Cuántas alternativas diferentes de vivienda le ofrecen a la


pareja?

PRESA PLAYAS

Económico Residencial

Condominio Californiano

Provenzal

m=2 n=3

2+3= 5 maneras

PRINCIPIO DE PERMUTACIÓN. A diferencia de la fórmula de la multiplicación, se la


utiliza para determinar el número de posibles arreglos cuando solo hay un solo grupo de
objetos. Permutación: un arreglos o posición de r objetos seleccionados de un solo grupo de
n objetos posibles. Si nos damos cuenta los arreglos a, b, c y b, a, c son permutaciones
diferentes, la fórmula que se utiliza para contar el número total de permutaciones distintas
es:

FÓRMULA: n P r = n! (n - r)

Ejemplo: ¿Cómo se puede designar los cuatro primeros lugares de un concurso, donde
existen 15 participantes?

Aplicando la fórmula de la permutación tenemos:

n P r = n! (n - r)! = 15! = 15*14*13*12 *11*10*9*8*7*6*5*4*3*2*1 (15-4)!


11*10*9*8*7*6*5*4*3*2*1 = 32760

Dónde: n= número total de objetos r= número de objetos seleccionados!= factorial,


producto de los números naturales entre 1 y n.

NOTA: se puede cancelar números cuando se tiene las mismas cifras en numerador y
denominador. !

PRINCIPIO DE COMBINACION. En una permutación, el orden de los objetos de cada


posible resultado es diferente. Si el orden de los objetos no es importante, cada uno de estos
resultados se denomina combinación. Por ejemplo, si se quiere formar un equipo de trabajo
formado por 2 personas seleccionadas de un grupo de tres (A, B y C). Si en el equipo hay
dos funciones diferentes, entonces sí importa el orden, los resultados serán permutaciones.
Por el contrario si en el equipo no hay funciones definidas, entonces no importa el orden y
los resultados serán combinaciones. Los resultados en ambos casos son los siguientes:
24

Permutaciones: AB, AC, BA, CA, BC, CB

Combinaciones: AB, AC, BC

Combinaciones: Es el número de formas de seleccionar r objetos de un grupo de n objetos


sin importar el orden.

La fórmula de combinaciones es:

N C r = n! R! (n – r)!

Ejemplo: En una compañía se quiere establecer un código de colores para identificar cada
una de las 42 partes de un producto. Se quiere marcar con 3 colores de un total de 7 cada
una de las partes, de tal suerte que cada una tenga una combinación de 3 colores diferentes.
¿Será adecuado este código de colores para identificar las 42 partes del producto?

Usando la fórmula de combinaciones:

N C r = n! = 7! = 7! = 35

R! (n – r )! 3! (7 – 3)! 3! 4!

El tomar tres colores de 7 posibles no es suficiente para identificar las 42 partes del
producto.
25

Conclusión
Los conceptos antes mencionados han sido analizados e investigados de tal manera de
hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que
trata de entender, organizar y tomar decisiones que estén de acuerdo con los análisis
efectuados. La estadística juega un papel muy importante en nuestras vidas, ya que
actualmente ésta se ha convertido en un método muy efectivo para describir con mucha
precisión los valores de datos económicos, políticos, sociales, psicológicos, biológicos y
físicos, además, sirve como herramienta para relacionar y analizar dichos datos. El
trabajo del experto estadístico ha evolucionado mucho, ya no consiste sólo en reunir y
tabular los datos, sino sobre todo en el proceso de interpretación de esa información, ahora
tiene un papel mucho más importante del que tenía en años pasados.
26

BIBLIOGRAFIA

http://probabilidadestadistic.blogspot.com/2010/09/tecnicas-de-conteo.html

https://phels18.wordpress.com/2013/04/23/tecnicas-de-conteo/

http://aprendoestadistic.blogspot.com/2013/04/eventos-mutuamente-excluyentes.html

http://www.profesorenlinea.cl/matematica/Estadistica1(VF).htm

https://estadisticageneral.wordpress.com/relaciones-entre-sucesos/

http://www.mat.uda.cl/hgomez/Apuntes/lect3.pdf

https://upload.wikimedia.org/wikipedia/commons/3/3a/
MODELOS_ALEATORIOS_Y_DETERMINISTAS.pdf

http://metodosunoydos.galeon.com/enlaces2221651.html

http://www.universoformulas.com/estadistica/descriptiva/curtosis/

http://weslintorres.blogspot.com/2009/05/medidas-de-forma.html

http://www.hiru.eus/matematicas/medidas-de-dispersion

Leer más: http://www.monografias.com/trabajos89/medidas-de-dispersion/medidas-de-


dispersion.shtml#desviacioa#ixzz4uOXYflAE

https://www.ecured.cu/Medidas_de_dispersi%C3%B3n

Leer más: http://www.monografias.com/trabajos27/datos-agrupados/datos-


agrupados.shtml#centiles#ixzz4uOUYFmU3

Leer más: http://www.monografias.com/trabajos27/datos-agrupados/datos-


agrupados.shtml#cuartiles#ixzz4uOUJ0qfw

Leer más: http://www.monografias.com/trabajos27/datos-agrupados/datos-


agrupados.shtml#deciles#ixzz4uOTktEcE

http://bioestadisticaula.blogspot.com/2012/08/medidas-de-tendencia-no-central.html
27

http://jaimeprobabilidadyestadistica.blogspot.com/2011/04/la-media-geometrica.html

https://es.plusmaths.com/la-media-aritmetica-ponderada.html

https://psikipedia.com/libro/analisis-de-datos/2476-medidas-de-tendencia-central

http://ww2.educarchile.cl/portal.herramientas/sitios_educativos/estadistica/
gr_graf_ptos.htm
http://elzhifestadistica.blogspot.com/2012/05/graficas-estadisticas.html

http://poligonosyojivas.blogspot.com/

http://calculo.cc/temas/temas_e.s.o/estadistica/teoria/poligono-frec.html

http://recursostic.educacion.es/descartes/web/materiales_didacticos/Estadistica_3eso/
graficos_estadisticos_mgc.html

https://www.uv.es/webgid/Descriptiva/3_distribucin_de_frecuencias.html

https://www.ibm.com/support/knowledgecenter/es/SSLVMB_23.0.0/spss/base/
dataedit_define_variable_measurement.html
https://www.ditutor.com/estadistica/variables_tipos.html
http://www.eumed.net/libros-gratis/2007a/239/1b.htm
http://tsu-estadistica.blogspot.com/2012/12/estadistica-conceptos-basicos.html

También podría gustarte