Documentos de Académico
Documentos de Profesional
Documentos de Cultura
estadísticas
Licenciatura en Adm. De Empresas
4° “A”Equipo 5
Elaborado por :
Blanca Irai Llanes Aviles Maximiliano Lázaro Flores
Juan David Gatica Gómez Lázaro Abdiel López Enríquez
Karla Durango Gonzalez Abner Gabriel Remirez
5.1.Estadística descriptiva
Los conceptos básicos de la estadística
:;
La estadística descriptiva
Es un conjunto de técnicas y procedimientos que ayudan a describir, mostrar y resumir,
la información de un conjunto de datos.
5.1.1. Representación tabular
(distribuciones de frecuencias)
La representación tabular es una de las formas mediante las cuales se puede
representar una serie de datos para su interpretación y análisis.
La media aritmética
La media aritmética es el promedio o medición de tendencia central de uso más común. Se calcula
sumando todas las observaciones de una serie de datos y luego dividiendo el total entre el número de
elementos involucrados. La expresión algebraica puede describirse como:
La mediana
La mediana es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de las
observaciones serán menores y la otra mitad serán mayores. La mediana no se ve afectada por
ninguna observación extrema de una serie de datos. Por tanto, siempre que esté presente una
observación extrema es apropiado usar la mediana en vez de la media para describir una serie de
datos.
La Moda
La moda o modo es el valor de una serie de datos que aparece con más frecuencia.
Se obtiene fácilmente de una clasificación ordenada. A diferencia de la media
aritmética, la moda no se ve afectada por la ocurrencia de los valores
extremos. Ejemplo: Los valores siguientes son las calificaciones de un alumno durante
todo el año 7; 8; 9; 7; 9; 8; 8; 8; 7; 8
Podemos afirmar entonces que el modo es igual a 8, dado que es el valor que aparece
con más frecuencia.
5.1.4. Medidas de dispersión: rango,
varianza, desviación estándar
Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los
valores de la distribución respecto al valor central.
La dispersión o variabilidad es una característica muy importante de un conjunto de datos. Por
ejemplo, si se fabrica un medicamento donde la variación en la dosis es muy grande, esto
implica que un alto porcentaje de dosis será desechada por ser un factor de riesgo para la salud;
o si un grupo de analistas financieros detecta ganancias ampliamente dispersas (que van de
valores muy pequeños a valores extremadamente grandes), éstas serán un indicador del riesgo
que existe para los accionistas y para los acreedores.
Rango.
Es la medida de variación más simple, y se obtiene con la diferencia que existe entre el dato
mayor (DM) del conjunto con el dato menor (dm) del mismo.
Rango de una muestra R = DM - dm
Ejemplo: Considérese los siguientes conjuntos de datos:
2 2 2 2 2 3 4 4 4 4 4 4 4 4 4 5 6 10
R = 10 - 2 = 8
Varianza
Una medida de dispersión mucho más común, que se calcula al promediar los cuadrados de las
desviaciones individuales a partir de la media, es la media de desviaciones cuadráticas o la
varianza. La varianza es una medida de dispersión promedia de un conjunto de datos. Para
una población se construye al tomar la diferencia entre cada valor observado y la media
poblacional, elevando al cuadrado cada una de estas desviaciones y luego hallando la media
aritmética de los valores cuadrados. Para una muestra, una expresión casi análoga se
construye con la ayuda de su media.
Desviación típica o estándar
Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de
todas, ya que para su cálculo se utilizan todos los desvíos con respecto a la media aritmética
de las observaciones, y además, se toman en cuenta los signos de esos desvíos. Se le designa
con la letra castellana S cuando se trabaja con una muestra y con la letra griega minúscula s
(Sigma) cuando se trabaja con una población. Es importante destacar que cuando se hace
referencia a la población él número de datos se expresa con N y cuando se refiere a la
muestra él número de datos se expresa con n.
La desviación estándar es también útil para describir qué tan lejos las observaciones
individuales de una distribución de frecuencias se apartan de la media de la distribución.
5.1.5. Medidas de posición: cuartiles,
deciles y percentiles
Medidas de posición.
Es encontrar en una serie de datos o en una distribución de frecuencias valores específicos,
además proporcionan información resumida de la variable objeto de estudio.
Nos facilitan información sobre la serie de datos que estamos analizando.
Los Cuartiles (Qn):
son los tres valores de la variable de una distribución que la dividen en cuatro partes
iguales, es decir, al 25%, 50% y 75%. Para calcular el valor de uno de los cuatro Cuartiles, se
utiliza la formula:
Qk = k (n/4) En donde: Qk = Cuartil número 1, 2, 3 ó 4 n = total de datos de la distribución. Se
advierte que la posición del segundo cuartil corresponde a la ubicación de la mediana, es decir
que el segundo cuartil será siempre igual a la mediana.
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de
los datos. D5 coincide con la mediana.
Cálculo de los deciles En primer lugar buscamos la clase donde se encuentra
Percentiles
Finalmente los percentiles, también conocidos como centiles son otras de las
Medidas de Posición más comunes y empleadas, utilizadas sobre todo para
clasificación de datos correspondientes a las medidas de las personas, como la
estatura, el peso, el diámetro craneal, etc. Igualmente, técnicamente, son
definidos como ciertos valores que dividen en cien partes idénticas
porcentualmente hablando los datos que han sido ordenados de forma sucesiva
de menor a mayor. En cuanto a su denotación, ésta corresponde a la forma P1,
P2…. Pn, no obstante son leídas como Percentil 10, Percentil 90, etc.
5.1.6. Regresión y correlación lineal
La Regresión Lineal es la técnica que explora y cuantifica la relación entre una variable
dependiente y una o más variables predictores que desarrolla una ecuación lineal con fines
predictivos, puede ser utilizada para un sin fin de problemas de investigación de mercados.
¿Cuál es la utilidad de la regresión lineal en investigación de mercados?
Se utiliza para predecir un amplio rango de fenómenos, desde medidas económicas hasta
aspectos del comportamiento humano, en temas de investigación de mercados puede
aplicarse por ejemplo para:
Predecir las ventas de un producto
Medir los resultados de una campaña publicitaria
Determinar la factibilidad de un punto de venta
Identificar el segmento de mercado correcto para un producto
Podemos definir la Regresión Lineal como la Técnica que explora y cuantifica la relación
entre una variable(s) dependiente (Y) y una o unas variables predictoras (X1, X2, X3…. ) que
desarrolla una ecuación lineal con fines predictivos.
La correlación lineal te permite cuantificar la relación entre dos (o más de dos) variables
cuantitativas,, por ejemplo el peso en kilogramos y la estatura en cms de un grupo de personas.
Primero te voy a explicar la correlación lineal de solo dos variables. En esta relación podemos
estudiar dos factores:
La dirección de la relación: Diremos que es directa o positiva cuando al incrementar la variable
X, se incremente en alguna medida la variable Y. Por ejemplo, la relación de estatura-peso,
cuando mayor es la estatura de una persona, generalmente mayor es el peso. Diremos que es
Inversa o negativa cuando al aumentar la variable X, disminuye la variable Y. Por ejemplo,
cuando sube el nivel de inversión en un país, disminuye el desempleo.
La fuerza de la relación. Es decir que porcentaje de la variación de la variable dependiente (Y)
es explicada por la variable independiente (X).
5.2.Estadística inferencial