Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Apuntes de Estadistica Descriptiva Umes
Apuntes de Estadistica Descriptiva Umes
Apuntes de Estadistica Descriptiva Umes
CONTENIDO
Pág.
Presentación
CAPITULO I
5
MARCO CONCEPTUAL
Conceptos
Conjunto de datos
Distribución de datos
Hechura de gráficas
CAPITULO II
12
MEDIDAS DE TENDENCIA CENTRAL
Datos no agrupados
Media
Mediana
Moda
Comparación de Media Mediana y Moda
Datos Agrupados
Media
Mediana
Moda
CAPITULO III
20
MEDIDAS DE DISPERSION O VARIABILIDAD
Datos no agrupados
Varianza
Desviación Estándar
Coeficiente de variación
Datos Agrupados
Varianza
Desviación Estándar
Coeficiente de variación
Coeficiente de sesgo o de Pearson
Quartiles, deciles y percentiles
CAPITULO IV
26
INTRODUCCION A LA INVESTIGACION DE MERCADOS
Metodología
Tamaño de la muestra
Bibliografía
Conforme las necesidades se presentan a diario más complejas dentro una sociedad,
el hombre está condicionado a tomar decisiones en todos los campos del saber y
hacer, así por ejemplo en la ciencia de la Economía, Comunicaciones, Jurisprudencia,
Mercadotecnia e Ingeniería, la estadística es una herramienta útil para resolver
problemas, aún en circunstancias de zozobra e incertidumbre.
El autor
EL CHOMPIPE:
UNO DE ESTOS DIAS…
MORALEJA:
CAPITULO 1
MARCO CONCEPTUAL
ESTADÍSTICA:
Conjunto de métodos científicos utilizados para la organización, recopilación,
presentación y análisis de datos tanto para la deducción de conclusiones, como para
tomar decisiones razonables.
CARACTERISTICA CUALITATIVA:
Es aquella que únicamente puede describirse, no se mide en forma numérica, por
ejemplo: tipos de aceite que utilizan las amas de casa, departamentos que originan
devoluciones en un Supermercado, el sexo de los estudiantes, el color del cabello.
NO se mide en una forma numérica.
CARACTERISTICAS CUANTITATIVAS:
Son aquellas que se pueden contar y medir. Ejemplo: los diámetros de tornillos
producidos por una fábrica, el peso de una carga de maíz, el ingreso de estudiantes de
escuela nocturna.
POBLACIÓN:
Es el conjunto de individuos, objetos, acontecimientos, definidos por algún rasgo
común, que los une e identifica a todos los miembros.
PARAMETRO:
Es toda medida descriptiva de la población total, de todas las observaciones de
interés a investigar.
RANGO:
Es la medida de dispersión más simple, consiste en restar la medición de datos
mayor, menos la medición del dato menor.
80 – 20 = 60
MUESTRA:
Cualquier subconjunto de la población, un grupo limitado de individuos, objetos o
acontecimientos tomados de una población. Puede definirse también como una parte
representativa de la población que se selecciona para ser estudiada, cuando la
población es demasiado grande como para analizarla en su totalidad.
Ejemplo:
Se tiene una población de 1000 ejemplares de pares de zapatos del mismo tamaño y
de la misma marca.
Deseamos saber si tienen defectos de fabricación?
Decidimos tomar una muestra del 5%
la muestra total a analizar será: 50 pares de zapatos.
ESTADISTICO:
Medida descriptiva de una muestra.
El estadístico sirve de una estimación al parámetro, relacionado con la población
ATRIBUTO:
Constituye la característica a la que se refieren los datos.
VARIABLE:
Es la característica de la muestra o población que se está observando.
Ejemplo cantidad de café por taza despachada, resistencia a la rotura de fibra de
plástico, porcentaje de azúcar en los cereales, pero del producto azúcar, los años de
los estudiantes del tercer de publicidad en la Universidad Mesoamericana.
VARIABLES CONTINUAS:
Las variables que pueden asumir cualquier valor en determinado intervalo de
valores, como altura, peso, longitud, espesor, velocidad, y viscosidad.
VARIABLES DISCRETAS:
Es la que puede asumir solo ciertos valores por lo regular, enteros.
Los datos discretos surgen al contar el número de conceptos que posee cierta
característica. Ejemplo, número de clientes por día, la cantidad de alumnos en un
salón de clases, los defectos de un auto, los accidentes de trabajo en una fábrica.
VARIABLES NOMINALES:
Comprenden categorías como sexo (masculino o femenino), el color de los ojos
(verdes, azules, cafés, negros), campo de estudio (Medicina, Ortopedia, Derecho,
Ingeniería, Contabilidad), etc.
ESCALA ORDINAL:
Son las que clasifican las observaciones en categorías con un orden significativo.
Ejemplo, primero, segundo, tercero, muy alto, alto, bajo.
INTERVALO DE CLASE:
Es la diferencia entre los límites reales, superior e inferior de cada clase, Es deseable
que todos los intervalos de clase sean de igual tamaño. por ejemplo:
10.5 - 15.05 = 5
LIMITE DE CLASE:
El valor inferior o superior de cada clase.
DISTRIBUCION DE FRECUENCIAS;
Es el resultado de ordenar los datos, dividiéndose en clases.
Organización tabular que contiene todas las variantes o clases de la variable y sus
frecuencias respectivas.
ORGANIZACIÓN DE DATOS:
Los datos tomados en diferentes escenarios para establecer controles o análisis.
Por ejemplo, tomar la edad de los estudiantes de la Universidad, de los centros
hospitalarios, para conocer la clase de proyectos que ellos realizan.
Pero esos datos en bruto o anotados en papeles, no pueden analizarse ni mucho
menos obtener conclusiones, en forma desordenada.
AGRUPACION DE DATOS:
La técnica más utilizada son las llamadas series ordenadas, que consiste en enumerar
las observaciones en orden ascendente o descendente.
Por ejemplo:
Qué pasa con un hogar en donde los padres han procreado a 10 hijos, con las edades
siguientes:
Se puede establecer que la diferencia que existe entre el primogénito y el último hijo
es de 22 años, que la diferencia de edades entre cada hermano difiere de 2 a 4 años.
DISTRIBUCIÓN DE FRECUENCIAS:
Mientras los datos no se organicen especialmente si ellos son numerosos, lo único que
se tiene es números desordenados. Lo que procede es ordenarlos si se desea
analizarlos y obtener beneficio estadístico.
PRACTICA:
Ejemplo 1:
Se tiene los datos de ventas de neumáticos, que una empresa distribuye:
19, 17, 18, 20, 17, 18, 23, 15, 20, 17, 23, 18, 22, 20
21, 25, 22, 17, 19, 24, 21, 20, ,20, 19, 19, 21, 18, 21
18, 16, 20, 25, 20, 23, 20, 19, 16, 25, 19, 17, 18, 21
24, 22, 20, 16, 19, 15, 23, 22, 22, 23, 24, 19, 21, 24
donde N = 60
n = 1 + 3.33 (1.78)
n = 1 + 5.93 = 6.93 ≈ 7
Fórmula:
IC =Número Mayor-Número MenorNumero de Clases
Sustituyendo:
IC =25 –15 7=1.43
Se aproxima a 2, para comodidad del ordenamiento
Clases f PM FA FR
15- 16 5 15.5 5 0.08
17-18 11 17.5 16 0.18
19-20 19 19.5 35 0.32
21-22 13 21.5 48 0.22
23-24 9 23.5 57 0.15
25-26 3 25.5 60 0.05
60 1.00
En donde :
f: Frecuencia
Pm: Punto medio
Fa: Frecuencia acumulada
Fr: Frecuencia relativa
GRAFICAS :
Histograma:
Un histograma es la gráfica de barras de una distribución de frecuencias. Por lo
general se colocan sobre el eje horizontal, los límites exactos de la clase y sobre el eje
vertical se coloca el número de observaciones.
Una gráfica o diagrama de barras ilustra mediante rectángulos, cantidades de
frecuencias para diferentes categorías de datos.
Ejemplo:
POLIGONO DE FRECUENCIA:
Es una línea que se arranca en el punto de intersección y que pasa por todos los
puntos medios de las barras. Los polígonos de frecuencia son especialmente útiles
para comparar dos o más muestras, ejemplo:
GRAFICA DE PIE
Son apropiadas para ilustrar las divisiones de una cantidad total. Las circunferencias
se dividen en sectores. Para efectuar esta operación se utiliza la regla de tres, con el
objeto de transformar los porcentajes en grados, es decir, la suma de los porcentajes
de 100, se igualan a 360 grados que contiene una circunferencia. Ejemplo:
EJERCICIOS:
1-El laboratorio de control de calidad de una empresa realiza un test de rapidez de
acción de un pesticida de Jardín, en 60 plantas infestadas.
Los resultados fueron observados cada hora habiéndose obtenido los siguientes datos
del número de plantas totalmente libres de la plaga, después de los periodos de
tiempo que se indican.
ntas
ntas
antas
antas
ntas
ntas
Calcule: a) Cual es la población? b) Cual es la muestra?
c) Cual es la variable? d) Tipo de variable?
e) Cuantas clases tiene la variable?
Respuesta:
a ) Total de plantas infestadas
b ) 60 plantas infestadas
c ) Rapidez de acción del pesticida
d ) Cuantitativa
e ) Seis
Problema 2
Los siguientes datos se obtuvieron contando el número de personas que cruzan por
un punto fijo de una calle durante intervalos de un minuto.
Los 54 conteos se hicieron a lo largo del mismo día.
Construya una tabla de frecuencias, que incluye, número de clases, intervalo de clases,
punto medio, frecuencia absoluta, frecuencia acumulada, frecuencia relativa,
histograma, polígono de frecuencias y grafica de pie.
28, 30, 25, 36, 24, 27, 33, 26, 29, 32, 25, 20, 28, 20, 27, 31, 23, 27
24, 34, 25, 24, 22, 26, 28, 38, 32, 26, 30, 37, 21, 28, 31, 38, 28, 27
23, 32, 39, 26, 29, 33, 28, 20, 22, 23, 25, 34, 24, 26, 31, 27, 22, 27
Respuesta :
Total de datos: 54
Rango: : 18
Numero de clases: 7
Intervalo de clase: 2
CAPITULO II
MEDIDAS DE TENDENCIA CENTRAL :
Fórmula:
Mediana para datos no agrupados:
Procedimiento para encontrar posición de la mediana:
a. Ordenar los datos de menos a más
b. Se suman los datos y se divide entre dos
Pm= n+12
En donde:
Pm = Posición de la mediana
n = Numero de datos
Ejemplo :
Establezca la Mediana de los datos siguientes:
8, 10, 20,13, 15, 19, 25
Procedimiento:
a. Ordenar datos de menor a mayor,
8, 10,13, 15, 19, 20, 25
B. sumar numero de datos (n + 1 )
7+1=8
b. luego, dividirlo entre 2,
82=4
Conclusión:
El valor de la mediana es igual a 15, lo que significa que el 50 ciento de datos queda
debajo de 15 y el 50 por ciento de datos se encuentran arriba de 15.
Ejemplo: Se tienen los siguientes datos:
Al verificar, este 3.5 representa un valor que se encuentra entre 25 y 33, entonces
25 + 33 = 58
582=29
Respuesta: La mediana de los números corresponde a: 29
MODA (Mo)
Forma de encontrarla:
__
LA MEDIA O PROMEDIO ARITMETICO: X ( Datos no agrupados )
Fórmula: __
X= Xn
En donde,
__
X = Simboliza a la media
X = Simboliza a la variable
Σ = Sumatoria
n = Número de datos
Ejemplo 1:
Ejemplo 2:
Matemáticas 90
Lenguaje 80
Ciencias Naturales 65
Estudios Sociales 90
__
X= (90+80+65+90)4= 3254=81.25
Conclusión:
El promedio típico de la calificación del estudiante, en las cuatro materias es :
81.25 puntos.
La media es la medida más usada, sin embargo no es siempre ideal usarla como un
promedio, porque son muy sensibles los valores extremos, que causan que una
distribución sea oblicua o asimétrica.
El cálculo de la mediana es simple, solo que requiere del ordenamiento de menos a
más de todos los datos. Entre los tres estadísticos de tendencia central, la mediana es
más útil cuando una distribución esta sesgada, es decir tiene puntuaciones a los lados.
La ventaja de la mediana es que no está afectada por los grandes o pequeños valores
extremos.
Finalmente la moda, no es tan usada como la media o la mediana y se caracteriza por
tener los datos que más se repiten.
Cálculo de la Media:
Al calcular la media de datos agrupados, se parte que las observaciones en cada clase,
son iguales al punto medio de la clase.
FORMULA:
X = f*Pmn= f*Pmf
En donde:
f = Frecuencia o número de observaciones en cada clase
Pm =Punto medio de cada clase
n = Suma de observaciones
Ejemplo:
Un empresario desea comprar una tienda, que le vende la señora América Ixil de la
zona 2 en Quetzaltenango.
Sin embargo antes de tomar una decisión, contrata al señor Romeo Villaseñor, para
que realice un análisis estadístico de lo sucede en esa empresa.
Los datos de ingresos en los últimos dos meses fueron los siguientes:
21, 19, 17, 18, 20, 17, 18, 23, 15, 20, 17, 23, 18, 22, 20
19, 21, 25, 22, 17, 19, 24, 21, 20, 20, 19, 19, 21, 18, 21
20, 18, 16, 20, 25, 20, 23, 20, 19, 16, 25, 19, 17, 18, 21
22, 24, 22, 20, 16, 19, 15, 23, 22, 22, 23, 24, 19, 21, 24
Número de clases f Pm F * Pm Fa Fr
LA MEDIANA :(Md)
La mediana es el valor que divide en dos partes iguales a una serie de datos.
Procedimiento:
Fórmula:
Md =Lmd+n2-FaFmdIc
En donde:
lmd = Límite inferior de la clase de la mediana
n = Numero de datos
Fa = Frecuencia acumulada de la clase que antecede a la clase de la mediana
Fmd = Frecuencia de la clase de la mediana
Ic = Intervalo de clase
Ejemplo:
Con los datos anteriores se procede a encontrar la clase de la mediana:
Pasos:
Se considera la columna de las frecuencias acumuladas:
La frecuencia acumulada de de ser igual o mayor a n/2
En el presente caso le corresponde a 35 por ser mayor a n/2 que es 30
La clase de la mediana es el intervalo de 19 a 20.
Sustituyendo:
Md =19+602-1619 2
Md =19+30-1619 2
Md =19+1419 2
Md =19+0.74*2
=19+1.47
Md =20.47 ≈20
Conclusión:
El valor de la media en el ejemplo es de 20 mil Quetzales.
Significa que este valor divide exactamente en dos partes iguales al total de datos.
LA MODA (Mo)
La moda es la observación que ocurre con mayor frecuencia.
Se encontrará en la clase que tenga la frecuencia más alta, llamada la clase modal.
FORMULA:
Mo =Lmo+DaDb+DaIc
De donde:
lmo = Límite inferior de la clase modal
Da = Diferencia entre la frecuencia de la clase modal y la clase que le antecede
Db = Diferencia entre la frecuencia de la clase modal y la clase que le sigue.
Ic = Intervalo de la clase modal
Ejemplo:
Nota: la clase modal se encuentra tomando la clase que tenga mayor número de
frecuencias, en este caso la clase con frecuencia 19.
Mo =19+86+82
Mo =19+8142
Mo =19+0.57
Mo =19+1.14
Mo =20.14 ≈20
PRACTICA:
Ejercicios datos NO agrupados
Ejercicio 1:
Se busca encontrar la media, mediana y moda de los siguientes datos:
20, 25, 20, 30, 35, 33, 34
Ejercicio 2: Datos:
0, 2, 3, 3, 4, 5, 7
Ejercicio 4: Datos:
7, 9, 2, 1, 4, 5, 6, 2
Respuesta: Media: 4.5 Mediana: 4.5, Moda: 2
Ejercicio 5: Datos:
78, 80, 81, 85, 87, 90, 92, 95
Ejercicio 6 Datos:
0.011, 0.027, 0.032, 0.035. 0.042
Ejercicio 7:
El señor Horacio Rueda, desea saber que tasa de interés que ofrecen dos bancos del
sistema es el más beneficioso. __
5.6%, 7.2%, 6.3%, 7.1% : Res. X: 6.55
__
8.0%, 7.3%, 5.9%, 6.2%: Res. X : 6.85
Respuesta:
Media = 61 Años
Mediana = 61 Años
Moda = 62 Años
Ejercicio 10:
La corte suprema de Justicia, proporciona datos de salarios de los empleados de
medio tiempo en la institución así:
___________________________________________________________________________________________________
_________
Salarios en Quetzales al mes Empleados
790 a menos 1140 15
1140 a menos 1490 10
1490 a menos 1840 20
1840 a menos 2540 15
2190 a menos 2540 10
___________________________________________________________________________________________________
_________
Calcule: Media, mediana y moda. Interprete ? Res. Media: 1640, Md: 1665. Y Mo:
1723
CAPITULO III
Herramientas utilizadas:
RANGO:
Es la medida de dispersión más simple, es la diferencia entre el valor más grande
menos el valor más pequeño.
FORMULA:
Rango = Numero mayor - Numero menor
Ejemplo: Se cuenta con cinco datos:
Rango = 15___________ 5 = 10
___________________ : Varianza
n- 1
En donde:
S Varianza muestral
2:
__
X : Media
Ejemplo:
Los pesos de cinco alumnos son los siguientes:
110, 145, 125, 95, 150
Procedimiento:
Se calcula la media:
__
X : ∑ ( 110 145 125 95 150 ) : 125
__________________________________
5
Se calcula la varianza:
S : ∑ ( 110 – 125) ( 145 – 125 ) ( 125- 125 ) ( 95 -125 ) ( 150- 125 ) 537.50
2 2 2 2 2 2 :
_____________________________________________________________________________
CV: 23.18
_______ ( 100 ) : 0.19 %
125
__ 2
S2=Σf•Pm² - nxn-1 : Varianza
En donde:
S Desviación estándar
: S = (s2)
Ejemplo:
Utilizando los mis datos que se tienen en las medidas de concentración:
Sustituyendo la fórmula:
__
X: 1208.0
_________ : 20.13
60
S2=24,803.0 – 60 (20.13²)60-1
S2=24,803.0 - 60(405.22)59
S 24,803.0 - 24,313.20
2:
_________________________ : 489.8
59 _______ : 8.30 :
Varianza
59
COEFICIENTE DE SESGO:
Ejemplo:
Se desea conocer el grado de sesgo que contiene los resultados de un trabajo en
estadística, respecto a promedios de niños de primaria.
Media 75.0
Mediana 80.0
Desviación estándar 2.7
P= 3(75-80)2.7=-5.5
Fórmula:
Ejemplo:
Aplicar la fórmula:
lp: (n +1) p
______
100
6 más 1 X 80
_____ : 7 X 0.8 : 5.6 80 más 0.60 X 9: 5.4 85.4
100
EJERCICIOS:
1- Las horas trabajadas por el abogado Rustrían Pérez, en los dos últimos meses
fueron:
Calcular:
La Media
La mediana
La Moda
La Varianza
La desviación Estándar
El primer cuartíl
El percentíl 75
El coeficiente de variación
Comente?
Calcule:
Media
Mediana
Moda
Decíl 4
Quartíl 3
Percentil 88
Varianza
Desviación estándar
Coeficiente de variación
Comente ?
CAPITULO IV
PROCESO DE INVESTIGACION:
Pasos:
1. Reconocimiento del problema y/ o oportunidad
2. Objetivos de la Investigación
3. Identificar la población a investigarse
4. Diseño de la investigación
1. Variables a investigarse
2. Fuentes de información
3. Tamaño de la muestra
4. Instrumentos de medición
5. Programa
6. Presupuesto
7. Tabulación y análisis de datos
8. Presentación de resultados
Objetivos de la Investigación:
Que información específica se requiere?
Diseño de la investigación:
Una vez definidos los objetivos del estudio y enumerado las necesidades de
información, el paso siguiente consiste en diseñar el proyecto formal de investigación
e identificar las fuentes apropiada de datos para el estudio.
Variables a investigar:
Una variable es una propiedad que puede fluctuar y cuya variación es susceptible de
medirse u observarse.
Variables cuantitativas:
Por ejemplo en Mercados se puede estar interesado en establecer las Características y
comportamiento del comprador:
Que compra? Quien Compra ? Donde Compra ? Porque compra? Cómo compra?
Cuando compra? Qué cantidad compra? Están satisfechos los clientes? Quienes son
los competidores? Del producto? De la plaza? De el precio? De la Promoción?
Variables cualitativas:
a. Comprensión en la compra
b. Gustos
c. Preferencias
d. Intención de compra
Fuentes de Información:
Primarias: son los datos obtenidos en forma directa.
Secundarios: son los datos obtenidos a través de otras fuentes.
Muestra:
Corresponde a un subconjunto de la población seleccionada, que se caracteriza por ser
representativa.
M=S2pqne2n-1+ S2pq
M=S2pqe2
De donde,
M = Tamaño de la muestra
S² = Desviación estándar
e² = Error de muestreo
n = Tamaño de la población
p = Probabilidad de éxito
q = Probabilidad de fracaso
INSTRUMENTOS DE MEDICION:
Cuestionario:
Es el instrumento más utilizado para recolectar datos, consiste en un conjunto de
preguntas respecto de una o más variables a medir.
Cada pregunta incluye una variable de interés.
Formas de cuestionamientos:
Preguntas dicotómicas: Respuesta de: si o no
Preguntas Múltiples Grande, Mediano, Pequeño
Preguntas abiertas Respuesta abierta
Ejemplo:
Se desea calcular una muestra en una población de 450000 niños en edades de 5 a 10
años.
Por ser una población representativa se calcula con una desviación estándar de 1, la
probabilidad de fracaso es de 10% y un error de muestreo del 3%.
Finita:
Infinita:
M=12•0.10•0.900.032=100
LA ARAÑA
Una gran araña que habitaba una casa vieja, construyo una hermosa telaraña para
atrapar
moscas.
Cada vez que una mosca se posaba en la telaraña, quedaba atrapada y la araña la
devoraba.
Un día una mosca muy inteligente, revoloteo sobre la telaraña mucho tiempo sin
descender. La araña desesperada, apareció y le dijo…. ¨ Vamos Mosquita …………. baja
¨
Nunca aterrizo, donde no veo otras moscas y la verdad es que no veo ninguna, en tu
casa.
La mosca se alejo hasta llegar a otro lugar, donde si había una gran cantidad de
moscas:
MORALEJA:
BIBLIOGRAFIA:
Ritchey Ferris : Estadística para las ciencias Sociales. Mc. Graw Hill.