Está en la página 1de 24

Tipos de

estadísticas
Licenciatura en Adm. De Empresas
4° “A”Equipo 5
Elaborado por :
Blanca Irai Llanes Aviles Maximiliano Lázaro Flores
Juan David Gatica Gómez Lázaro Abdiel López Enríquez
Karla Durango Gonzalez Abner Gabriel Remirez
5.1.Estadística descriptiva
Los conceptos básicos de la estadística

Estadística: es la rama de la matemáticas que se encarga de


recopilar y organizar datos
Po b l a c i ó n : c o n j u n t o d e i n d i v i d u o s s o b r e e l q u e s e v a e s t u d i a r
una característica.
Individuo: unidad o estadística en cada uno de los elementos
que componen la población.
Muestra: es un conjunto representativo de la población.

:;
La estadística descriptiva
Es un conjunto de técnicas y procedimientos que ayudan a describir, mostrar y resumir,
la información de un conjunto de datos.
5.1.1. Representación tabular
(distribuciones de frecuencias)
La representación tabular es una de las formas mediante las cuales se puede
representar una serie de datos para su interpretación y análisis.

Tabla de frecuencias: ordenación de los datos estadísticos, asignado a cada dato


su frecuencia. Existen simples e intervalos.

FRECUENCIA ABSOLUTA: f: numero de veces que se repite el elemento.


FRECUENCIA RELATIVA: f/N: es un cociente que indica la porción que cada una de
las frecuencias absolutas representa del total de datos.
FRECUENCIA ACOMULADA: F: es el resultado de sumar sucesivamente las
frecuencias absolutas o relativas.
FRECUENCIA ABSOLIUTA ACOMULADA: F/N
5.1.2. Representación gráfica
 Proporciona al lector o usuario mayor rapidez en la comprensión de los datos, una
grafica es una expresión artística usada para representar un conjunto de datos.
 De acuerdo al tipo de variable que vamos a representar, las principales graficas son
las siguientes:
 Histograma: Es un conjunto de barras o rectángulos unidos uno de otro, en razón
de que lo utilizamos para representar variables continuas. Polígono de frecuencias:
Esta grafica se usa para representar los puntos medios de clase en
una distribución de frecuencias

 Un polígono de frecuencias es un gráfico usado en estadística para mostrar la


frecuencia con la que cambia una variable o categoría.
Para crear uno necesitas un histograma de datos.
 Gráfica lineal: Son usadas principalmente para representar datos clasificados
por cantidad o tiempo; o sea, se usan para representar series de tiempo o
cronológicas. Gráfica de barra 100% y gráfica circular: se usan especialmente
para representar las partes en que se divide una cantidad total. La ojiva: Esta
grafica consiste en la representación de las frecuencias acumuladas de una
distribución de frecuencias. Puede construirse de dos maneras diferentes;
sobre la base "menor que" o sobre la base "o más". Puede determinar
el valor de la mediana de la distribución.
En estadística denominamos gráficos a aquellas imágenes que, combinando la
utilización De sombreado, colores, puntos, líneas, símbolos, números, texto y
un sistema De referencia (coordenadas), permiten
presentar información cuantitativa.
 El diagrama de dispersión permite analizar si existe algún tipo de relación
entre dos variables. Por ejemplo, puede ocurrir que dos variables estén
relacionadas de manera que al aumentar el valor de una, se incremente el de
la otra. En este caso hablaríamos de la existencia de una correlación positiva.
Para qué se usa un diagrama de dispersión?
Entre sus usos está descubrir y mostrar las relaciones entre dos conjuntos
asociados de datos y confirmar relaciones anticipadas entre dos conjuntos
asociados de datos.
El diagrama de dispersión puede estudiar la relación entre:
• Dos factores o causas relacionadas con la calidad.
• Dos problemas de calidad.
• Un problema de calidad y su posible causa.
 Gráfica de barras
En los gráficos de barras o columnas a cada valor del eje X le corresponde un
valor del eje Y que determina el alto de una columna. Son muy valiosos para
comparar magnitudes. Por ejemplo, se puede representar el número de
habitantes de una ciudad según el rango de edad.
Para realizar un gráfico de línea se deben dibujar los dos ejes nombrándolos con
la variable que representan. Por ejemplo: X: rango de edad; Y: número de
habitantes. Luego introducir el rango y escala de cada variable y dibujar las
barras uniendo la información de ambas variables.
 Gráfica circular
También llamado gráfico de torta, muestra la distribución de determinado total
en diferentes partes. Es una herramienta valiosa para los casos en los que se
conoce el absoluto, y lo que interesa es conocer la forma en la que este se
repartió en varias partes. Por ejemplo, se puede representar el porcentaje de
votos que sacó cada partido político en una elección.
Para realizar un gráfico de torta se debe dibujar un círculo con un compás.
Dibujar el radio del círculo y con un transportador calcular los siguientes datos.
Colorear cada porción de la torta con un color.
5.1.3. Medidas de tendencia central: media,
mediana, moda
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión exprean hasta qué punto estas medidas de tendencia
central son representativas como síntesis de la información.

 La media aritmética
La media aritmética es el promedio o medición de tendencia central de uso más común. Se calcula
sumando todas las observaciones de una serie de datos y luego dividiendo el total entre el número de
elementos involucrados. La expresión algebraica puede describirse como:

 La mediana
La mediana es el valor medio de una secuencia ordenada de datos. Si no hay empates, la mitad de las
observaciones serán menores y la otra mitad serán mayores. La mediana no se ve afectada por
ninguna observación extrema de una serie de datos. Por tanto, siempre que esté presente una
observación extrema es apropiado usar la mediana en vez de la media para describir una serie de
datos.
La Moda
La moda o modo es el valor de una serie de datos que aparece con más frecuencia.
Se obtiene fácilmente de una clasificación ordenada. A diferencia de la media
aritmética, la moda no se ve afectada por la ocurrencia de los valores
extremos. Ejemplo: Los valores siguientes son las calificaciones de un alumno durante
todo el año 7; 8; 9; 7; 9; 8; 8; 8; 7; 8
Podemos afirmar entonces que el modo es igual a 8, dado que es el valor que aparece
con más frecuencia.
5.1.4. Medidas de dispersión: rango,
varianza, desviación estándar
 Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los
valores de la distribución respecto al valor central.
La dispersión o variabilidad es una característica muy importante de un conjunto de datos. Por
ejemplo, si se fabrica un medicamento donde la variación en la dosis es muy grande, esto
implica que un alto porcentaje de dosis será desechada por ser un factor de riesgo para la salud;
o si un grupo de analistas financieros detecta ganancias ampliamente dispersas (que van de
valores muy pequeños a valores extremadamente grandes), éstas serán un indicador del riesgo
que existe para los accionistas y para los acreedores.
 Rango.
 Es la medida de variación más simple, y se obtiene con la diferencia que existe entre el dato
mayor (DM) del conjunto con el dato menor (dm) del mismo.
 Rango de una muestra R = DM - dm
 Ejemplo: Considérese los siguientes conjuntos de datos:
 2 2 2 2 2 3 4 4 4 4 4 4 4 4 4 5 6 10
 R = 10 - 2 = 8
 Varianza
Una medida de dispersión mucho más común, que se calcula al promediar los cuadrados de las
desviaciones individuales a partir de la media, es la media de desviaciones cuadráticas o la
varianza. La varianza es una medida de dispersión promedia de un conjunto de datos. Para
una población se construye al tomar la diferencia entre cada valor observado y la media
poblacional, elevando al cuadrado cada una de estas desviaciones y luego hallando la media
aritmética de los valores cuadrados. Para una muestra, una expresión casi análoga se
construye con la ayuda de su media.
 Desviación típica o estándar
Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de
todas, ya que para su cálculo se utilizan todos los desvíos con respecto a la media aritmética
de las observaciones, y además, se toman en cuenta los signos de esos desvíos. Se le designa
con la letra castellana S cuando se trabaja con una muestra y con la letra griega minúscula s
(Sigma) cuando se trabaja con una población. Es importante destacar que cuando se hace
referencia a la población él número de datos se expresa con N y cuando se refiere a la
muestra él número de datos se expresa con n.
La desviación estándar es también útil para describir qué tan lejos las observaciones
individuales de una distribución de frecuencias se apartan de la media de la distribución.
5.1.5. Medidas de posición: cuartiles,
deciles y percentiles
Medidas de posición.
 Es encontrar en una serie de datos o en una distribución de frecuencias valores específicos,
además proporcionan información resumida de la variable objeto de estudio.
 Nos facilitan información sobre la serie de datos que estamos analizando.
 Los Cuartiles (Qn):
son los tres valores de la variable de una distribución que la dividen en cuatro partes
iguales, es decir, al 25%, 50% y 75%. Para calcular el valor de uno de los cuatro Cuartiles, se
utiliza la formula:
Qk = k (n/4) En donde: Qk = Cuartil número 1, 2, 3 ó 4 n = total de datos de la distribución. Se
advierte que la posición del segundo cuartil corresponde a la ubicación de la mediana, es decir
que el segundo cuartil será siempre igual a la mediana.
 Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de
los datos. D5 coincide con la mediana.
Cálculo de los deciles En primer lugar buscamos la clase donde se encuentra

 Percentiles

Finalmente los percentiles, también conocidos como centiles son otras de las
Medidas de Posición más comunes y empleadas, utilizadas sobre todo para
clasificación de datos correspondientes a las medidas de las personas, como la
estatura, el peso, el diámetro craneal, etc. Igualmente, técnicamente, son
definidos como ciertos valores que dividen en cien partes idénticas
porcentualmente hablando los datos que han sido ordenados de forma sucesiva
de menor a mayor. En cuanto a su denotación, ésta corresponde a la forma P1,
P2…. Pn, no obstante son leídas como Percentil 10, Percentil 90, etc.

5.1.6. Regresión y correlación lineal
La Regresión Lineal es la técnica que explora y cuantifica la relación entre una variable
dependiente y una o más variables predictores que desarrolla una ecuación lineal con fines
predictivos, puede ser utilizada para un sin fin de problemas de investigación de mercados.
¿Cuál es la utilidad de la regresión lineal en investigación de mercados?
Se utiliza para predecir un amplio rango de fenómenos, desde medidas económicas hasta
aspectos del comportamiento humano, en temas de investigación de mercados puede
aplicarse por ejemplo para:
Predecir las ventas de un producto
Medir los resultados de una campaña publicitaria
Determinar la factibilidad de un punto de venta
Identificar el segmento de mercado correcto para un producto
Podemos definir la Regresión Lineal como la Técnica que explora y cuantifica la relación
entre una variable(s) dependiente (Y) y una o unas variables predictoras (X1, X2, X3…. ) que
desarrolla una ecuación lineal con fines predictivos.
La correlación lineal te permite cuantificar la relación entre dos (o más de dos) variables
cuantitativas,, por ejemplo el peso en kilogramos y la estatura en cms de un grupo de personas.
Primero te voy a explicar la correlación lineal de solo dos variables. En esta relación podemos
estudiar dos factores:
La dirección de la relación: Diremos que es directa o positiva cuando al incrementar la variable
X, se incremente en alguna medida la variable Y. Por ejemplo, la relación de estatura-peso,
cuando mayor es la estatura de una persona, generalmente mayor es el peso. Diremos que es
Inversa o negativa cuando al aumentar la variable X, disminuye la variable Y. Por ejemplo,
cuando sube el nivel de inversión en un país, disminuye el desempleo.
La fuerza de la relación. Es decir que porcentaje de la variación de la variable dependiente (Y)
es explicada por la variable independiente (X).
5.2.Estadística inferencial

Es la rama de Estadística que se ocupa de los procesos de estimación (puntual y por


intervalos), análisis y pruebas hipótesis. La finalidad de la estadística inferencial es llegar a
conclusiones que brinden una adecuada base científica para la toma de decisiones,
considerando la información muestral recolectada.
En otras palabras la estadística inferencial se ocupa del análisis, interpretación de los
resultados y de las conclusiones a las que se puede llegar a partir de la información obtenida
de una muestra con el fin de extender sus resultados a la población bajo estudio. La
generalización de las conclusiones obtenidas en una muestra a toda la población esta sujeta a
riesgo por cuanto los elementos de la muestra son obtenidos mediante un muestreo
probabilístico.
 Estimación Puntual: Es la estimación del valor del parámetro por medio de un único
valor obtenido mediante el cálculo o evaluación de un estimador para una muestra
específica. Por ejemplo: Si se quiere determinar en cuál de las ciudades, Lima o
Arequipa, el sueldo semanal promedio de un empleado es mayor 8
 Estimación por intervalos: Es la estimación del valor de un parámetro mediante un
conjunto de valores contenidos en un intervalo. Para la obtención de intervalos de
confianza se debe considerar el coeficiente de confianza que es la probabilidad de que
el intervalo contenga al parámetro poblacional.
 Prueba de Hipótesis: Es el procedimiento estadístico de comprobación de una
afirmación y se realiza a través de las observaciones de una muestra aleatoria. El
objetivo de la inferencia estadística es hacer inferencias acerca de una población
basada en la información contenida en una muestra. Ahora considerando que las
poblaciones están caracterizadas por medidas descriptivas numéricas llamadas
parámetros., a la inferencia estadística le corresponde hacer inferencias acerca de los
parámetros poblacionales.
Prueba Z
Las pruebas Z son cálculos estadísticos que se
pueden usar para comparar las medias
poblacionales con las de una muestra. El puntaje z
le dice qué tan lejos, en desviaciones estándar, un
punto de datos está de la media o promedio de un
conjunto de datos. Una prueba z compara una
muestra con una población definida y
generalmente se usa para tratar problemas
relacionados con muestras grandes ( n > 30). Las
pruebas Z también pueden ser útiles cuando
queremos probar una hipótesis. Generalmente,
son más útiles cuando se conoce la desviación
estándar.
Al igual que las pruebas z, las pruebas t son
cálculos que se utilizan para probar una hipótesis,
pero son más útiles cuando necesitamos
determinar si hay una diferencia estadísticamente
significativa entre dos grupos de muestras
independientes. En otras palabras, una prueba t
pregunta si es poco probable que haya ocurrido
una diferencia entre las medias de dos grupos
debido al azar. Por lo general, las pruebas t son las
más apropiadas cuando se tratan problemas con
un tamaño de muestra limitado ( n <30).
 ¿Qué es una prueba de chi-cuadrado?
La prueba de Chi-Cuadrado es un procedimiento estadístico utilizado para determinar si existe una
diferencia significativa entre los resultados esperados y los observados en una o más categorías.
Se trata de una prueba no paramétrica que es utilizada por los investigadores para examinar las
diferencias entre variables categóricas en la misma población. También puede utilizarse para
validar o proporcionar un contexto adicional para las frecuencias observadas.
La idea básica de la prueba es que se comparan los valores de los datos reales con lo que se
esperaría si la hipótesis nula fuera cierta.
De esta forma, se busca determinar si una diferencia entre los datos observados y los esperados se
debe al azar, o si se debe a una relación entre las variables que se están estudiando.
5.2.2. Prueba T sobre el coeficiente de
regresión
 La prueba T y la regresión lineal son términos relacionados con la estadística
inferencial que es el método estadístico que nos ayuda a hacer
generalizaciones y predicciones sobre una población al tomar una muestra
pequeña pero ilustrativa de esa población.
 En la estadística inferencial se utilizan típicamente tres tipos de
metodologías: intervalos de confianza, pruebas de hipótesis y análisis de
regresión.
 Si bien la prueba T es una de las pruebas utilizadas en la prueba de hipótesis,
la regresión lineal es uno de los tipos de análisis de regresión.

También podría gustarte