Está en la página 1de 61

“La estadística es una ciencia

que demuestra que si mi


vecino tiene dos coches y yo
ninguno, los dos tenemos
uno”.
George Bernard Shaw.

La estadística es una herramienta útil,


pero debemos tener en cuenta que no
siempre va a representar la realidad sino
(Dublín, Irlanda. Nació el 20 de julio de 1856 en Dublín, Irlanda). una aproximación o tendencia.
Dramaturgo y periodista irlandés.
George Bernard Shaw falleció el día 2 de noviembre de 1950 en su
casa de campo de Ayot St. Lawrence. Reino Unido.
D E
E S
I ON
U C CI A
RI B E N
IS T CU
D FRE
ESTADÍSTICA

• La estadística es una rama de las matemáticas, se


encarga de describir fenómenos que ocurren en
nuestro entorno, ya sean sociales, económicos, físicos,
químicos, biológicos, etc. Utilizando parámetros
numéricos y con base a estas descripciones la
estadística propone cursos de acción para resolver un
problema o propone patrones de comportamiento
para fenómenos parecidos.
EST.
DESCRIPTIVA

EST.
INFERENCIAL

Es una ciencia que estudia la ESTADISTICA


recolección análisis e
interpretación de los datos.
ESTADÍSTICA DEFINIR EL ELEGIR LA RECOLECTAR
DESCRIPTIVA PROBLEMA MUESTRA LOS DATOS

ORGANIZAR
INTERPRETAR ANALIZAR LA PRESENTAR INFORMACIÓN
INFORMACIÓN INFORMACIÓN INFORMACIÓN

¿SE
ESTADÍSTICA TOMAR SOLUCIÓN SOLUCIONO
INFERENCIAL DECISIONES PROPUESTA EL
PROBLEMA?

DOCUMENTAR
SOLUCIÓN
Es un conjunto de
herramientas, formado por
coeficientes y técnicas, que
tratan de resumir la
información contenida en un
conjunto de datos.
ESTADÍSTICA Es una parte fundamental de
cualquier análisis estadístico
DESCRIPTIVA complejo, en la que se empiezan
a tomar decisiones que afectaran
al conjunto de la investigación.
Los coeficientes descriptivos
darán información sobre la
estructura de la población que se
estudia.
•  Muestra: subconjunto de la
población seleccionado.
 Representatividad
MUESTRA  Tamaño
 10% de la
población

Pequeñas: menores o iguales a 30


datos
Grandes: mayores a 30 datos
Muestreo
¿Que nos interesa saber?
Variables: Datos:
• Características de • Valor de la variable
interés acerca de los asociado a un elemento de
elementos de una la población o la muestra.
muestra o población. • Los datos constituyen la
• Variable y atributos, materia prima de la
cuantitativas discretas, Estadística, pudiéndose
continuas, cualitativas establecer distintas
ordinales y nominales. clasificaciones en función
de la forma en que estos
vengan dados. Conteo o
mediciones.
OTROS CONCEPTOS:
• Parámetro: número que describe una característica de la
población. Por lo general es inferida.
• Estadístico: número que describe una característica de la
muestra. Resulta de la manipulación de datos según
ciertos procedimientos específicos.
• Observación: es la recolección de datos sin alterar la
naturaleza de los mismos.
RECOPILACION DE
DATOS
• Dentro de un proceso de investigación una de las
actividades que se realizan es la recopilación de datos, la
cual es el acopio de información y se incluye desde elaborar
fichas bibliográficas hasta la aplicación de cuestionarios con
el empleo de técnicas de muestreo.
• Existe una gran variedad de técnicas para realizar la
investigación, que se deberán seleccionar de a cuerdo a las
necesidades del problema, así como a diferentes factores
como son el tiempo, costo, tipo de actividades a realizar,
recursos humanos, etc.
1. Encuesta:
Su instrumento es el Cuestionario.
Se formulan preguntas respecto a opiniones,
actitudes, comportamiento y otras
características.
Después las respuestas se editan, codifican

a s e y tabulan para su análisis.


c ni c 2. Entrevista:
T é n t os
u m e Su instrumento es la Guía de Preguntas.
n s tr
I Es un diálogo flexible, permite hacer
preguntas más de una vez (repregunta).
Tanto el entrevistador como el (los)
entrevistado (s) deben tener conocimientos
fundamentados del tema en discusión.
3. Observación:
Su instrumento es la Guía de Observación.
a) Observación Experimental: El investigador
influye sobre los elementos de estudio. Ej:
Prueba de medicamentos, Ensayos de
a s e nuevos métodos de enseñanza, etc.
n i c
Téc entos b) Observación No Experimental: El
investigador toma los datos tal y como los
tr um
Ins
encuentra. Ej: Tráfico, Rating, Supervisión.
4. Análisis Documental:
Su instrumento es la Ficha de Registro.

a s e Consiste en recabar información


c nic relacionada al tema de investigación de
T é n to s todas las fuentes disponibles: Tesis,
u m e Revistas, Páginas Web, Libros, Historias
n s tr Clínicas, Expedientes judiciales, Registro
I de ventas, Historial de Notas,
Documentales, etc.
Estas fuentes deben ser válidas para citarse.
Diseño del Cuestionario
• Preguntas Cerradas:
¿acudes frecuentemente al cine?
Si ( ) no ( )
Preguntas Abiertas:
¿Qué opina del acoso sexual en lugares de trabajo?
…………………………………………………………………
Preguntas Semi-Abiertas:
¿Qué deporte practica?
Fútbol ( ) Voley ( )
Ciclismo ( ) Natación ( )
Otro ( )……………………..
La organización de los datos
constituye la primera etapa
de su tratamiento, pues,

a c i ón facilita los cálculos

g a n iz posteriores y evita posibles


Or a t o s confusiones.
l o s d
d e La organización va a
depender del numero de
observaciones distintas que
se tengan y de las veces que
se repitan cada una de ellas.
En base a lo anterior se pueden estructurar
los datos de tres maneras distintas:

Tipo I: Cuando se tiene un numero pequeño de


observaciones casi todas distintas, estas se darán por
extensión.
 2, 3, 5, 7, 7, 8, 11, 14, 16, 19, 22, 25, 25, 33.
Tipo II: Cuando se tiene un
gran numero de observaciones
pero muy pocas distintas, se
organizan en una tabla de
frecuencias, es decir, cada uno
de los valores acompañado de
la frecuencia con la que se
presenta.
Tipo III: En el caso de que
haya muchas observaciones, la
mayoría de ellas distintas,
pueden disponerse
agrupándolas en intervalos e
indicando el numero de
observaciones que caen dentro
de cada intervalo.
• Medidas de Tendencia central:
media, mediana, moda. Medidas
• Medidas de dispersión: amplitud,
varianza, desviación estándar. de la
• Medidas de posición: fractiles estadística
(cuartiles, deciles, percentiles).
• Medidas de forma: coeficiente de descriptiva
asimetría y coeficiente de curtosis.
:
O S
PAD
R U
A G
N O
O S
AT
D
• Son números que definen cual es
el valor alrededor del que se
concentran los datos u
observaciones.
MEDIDAS • Una vez organizados los datos en
DE su correspondiente distribución de
frecuencias, se procede a dar una
TENDENCI serie de medidas que resuman toda
esa información y que, “de alguna
A CENTRAL manera”, representen a la
distribución.
MEDIA MUESTRAL
La media muestral es simple y de uso común. Representa el promedio
aritmético de los datos. Sin embargo, es sensible a errores en los datos. Un
dato erróneo puede cambiar significativamente el valor de la media muestral.
Para evitar este problema, se puede ignorar un pequeño porcentaje de los datos
más grandes y más pequeños de la muestra antes de calcular la media muestral
• Debe ser un valor comprendido entre el menor y el mayor de los valores de
la distribución.
• Debe venir expresada en la misma unidad que los datos

• Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5, 90


• Entonces X= (2+6+11+8+11+4+7+5 + 90)/9 = 16
MEDIA ARITMÉTICA
PONDERADA

• La media aritmética ponderada es una medida de tendencia


central, que se da asignándole a cada clase un peso, y obteniendo un
promedio de los pesos, teniendo estos pesos valores diferentes. Es
decir, algunos tienen una importancia relativa (peso) respecto a los
demás elementos. La diferencia cuando calculamos la 
media aritmética es que a todos los pesos se les da el mismo valor.
• La media ponderada tiene numerosas aplicaciones, por
ejemplo, la nota de una asignatura donde el examen
final tiene un peso mayor al de un trabajo. O en el
cálculo del IPC (Índice de Precios de Consumo). El IPC
es un indicador de los precios de los bienes y servicios
básicos que consume la población. Para calcularlo, se
otorga pesos a los diferentes bienes (pan, fruta, vivienda,
…) y se calcula la media ponderada.
MODA MUESTRAL
• La moda absoluta de una distribución es el valor que mas
veces se repite. Además de la moda absoluta, aquellos valores
que tengan frecuencia mayor a la de los valores adyacentes
serán modas relativas.
• Puede ser que no exista la moda y también es posible que
exista más de una moda.
Ejemplo. Si los datos son 2, 6, 11, 8, 11, 4, 7, 5
Entonces Mo = 11
MEDIANA MUESTRAL
• La mediana es un valor que, previa ordenación, deja la mitad
de las observaciones en la recta real a la izquierda y la otra
mitad a la derecha. Es decir, el 50% de los datos son menores
o iguales que la mediana y el otro 50% mayores o iguales a
esta. Para su calculo y suponiendo que los valores están
ordenados se procede de la siguiente manera:
1. Si los datos vienen dados por extensión:
• Son una serie de medidas
que por una parte indicaran
el nivel de concentración
de los datos que se están
analizando y por otra
Medidas de informaran sobre la bondad
dispersión de los promedios
calculados como
representantes del conjunto
de datos.
El rango o amplitud

Es la diferencia entre el mayor valor y el menor valor de los datos


de la muestra
VARIANZA MUESTRAL
• La varianza y su raíz cuadrada positiva, la desviación
típica, son las mas importantes medidas de dispersión,
estando íntimamente ligadas a la media como medida de
representación de esta. La varianza se basa en la
cuantificación de las distancias de los datos con respecto al
valor de la media y viene dada por la expresión:
DESVIACIÓN ESTÁNDAR MUESTRAL
• Es la raíz cuadrada positiva de la variancia. La desviación
estándar muestral o desviación típica o error muestral, está
expresada en las misma unidad de medición que los datos de
la muestra.
• El dar dos expresiones para un mismo concepto se explica
porque la varianza es un termino de mas fácil manejo, Tanto
una como la otra son siempre positivas y valen cero solo en el
caso de que todos los valores coincidan con la media
(representatividad absoluta de la media).
COEFICIENTE DE VARIACIÓN
• Es un número que se usa para cara comparar la variabilidad de los datos
de diferentes grupos. Es una medida adimensional, tiene en cuenta el
rango de valores en el que se mueve, permite comparar la dispersión de
varias distribuciones, el coeficiente de variación da información sobre la
representatividad de la media; y aunque no hay valores fijos de
comparación, pues depende de circunstancias tales como el numero de
observaciones, se puede considerar, a efectos prácticos, una cota de 0.5
como lımite para admitir que la media representa aceptablemente al
conjunto de la distribución.

• Para un grupo de datos X = 20, S = 4, entonces v = 4/20 = 0.2 = 20%


• Para un segundo grupo X = 48, S = 6, entonces v = 6/48 = 0.125 =
12.5%
• Se concluye que el primer grupo tiene mayor variabilidad (respecto a su
media)
Ejercicio:
• Se ha realizado una encuesta en 30 hogares en los que se pregunta el
número de individuos que viven en el domicilio. Las respuestas son
las siguientes:
4,4,1,3,5,3,2,4,1,6,2,3,4,5,5,6,2,3,3,2,2,1,8,3,5,3,7,4,2,3.
Obtén :
 Unidad de medida
 Tamaño de la muestra
 Media, mediana, moda
 Varianza, desviación, coeficiente de variación
OS
PA D
R U
A G
O S
AT
D
1.3 DISTRIBUCION DE FRECUENCIAS

• se le llama distribución de frecuencias a la
agrupación de datos en categorías mutuamente
excluyentes que indican el número de
observaciones en cada categoría
Ejemplo:
k= 1+3.32 log(n)

 k=
Ejemplo:
TABLA DE FRECUENCIA

frecuencia absoluta  ¿Cuántas σ ݂݅݉݅


fi= personasܺത
Media= tardan
ൌ menos de Desviación
5 min. ܵൌܵଶ
Fi= frecuencia absoluta acumulada ݊ estándar =
En ser atendidas?
fr= frecuencia relativa
 ¿Qué proporción tarda
ଶ menos
σ ݂݅ ݉݅ െ 3ଶmin?
deܺത
Fra= frecuencia relativa acumulada Varianza= ܵ ൌ
 ¿Qué proporción tarda mas݊െ de ͳ3 min?
MEDIA MUESTRAL para datos agrupados:

• MODA PARA DATOS AGRUPADOS:


MEDIANA MUESTRAL para datos agrupados:
Comparación entre media,
moda y mediana
• Salvo en casos muy específicos, la media es la mejor de las medidas de
representación, pues la moda es bastante inestable y un pequeño cambio en las
observaciones puede afectarle mucho, mientras que la mediana es insensible al
tamaño de los datos, permaneciendo constante si, por ejemplo, se altera
arbitrariamente y en cierto sentido las observaciones extremas. Por otra parte, si
se dispone de las modas y medianas de dos distribuciones hay que conocer cada
uno de los datos de ´estas para calcular la moda y mediana de la distribución
conjunta. La media por el contrario es sensible a las alteraciones de los datos, al
tamaño de estos y si se conocen las medias de dos conjuntos de datos, basta con
saber los tamaños de ambos grupos para calcular la media global.
Varianza de datos
agrupados

Y la desviación típica, por tanto es:


Lo que indica la
Obtención de S2 y S varianza y
desviación
Miden la “disper
si
promedio alreded ón”
or de la
media.
Ni la varianza ni
desviación estánd la La varianza da c
ar pueden omo
ser negativas. resultado unidad
es
cuadradas.
Solo S2 y S podría
n
cuando no haya v ser 0 En la desviación
están
ariac valor esta en las u dar, el
alguna en los dato ión nid
s. originales de los d ades
atos.
COEFICIENTE DE VARIACIÓN
• Es un número que se usa para cara comparar la variabilidad de los
datos de diferentes grupos. Es una medida adimensional, tiene en
cuenta el rango de valores en el que se mueve, permite comparar la
dispersión de varias distribuciones, el coeficiente de variación da
información sobre la representatividad de la media; y aunque no hay
valores fijos de comparación, pues depende de circunstancias tales
como el numero de observaciones, se puede considerar, a efectos
prácticos, una cota de 0.5 como lımite para admitir que la media
representa aceptablemente al conjunto de la distribución.

• Para un grupo de datos X = 20, S = 4, entonces v = 4/20 = 0.2 = 20%


• Para un segundo grupo X = 48, S = 6, entonces v = 6/48 = 0.125 =
12.5%
• Se concluye que el primer grupo tiene mayor variabilidad (respecto a
su media)
MEDIDAS DE POSICIÓN
• Se llaman medidas de posición o cuantiles de orden k a aquellas que
dividen a la distribución en k partes, de tal forma que en cada una de esas
partes haya el mismo numero de elementos2. De entre todas las medidas
de posición destacan los cuartiles, los deciles y los percentiles.
• Los cuartiles dividen a la distribución en cuatro partes iguales, los deciles
en diez y los percentiles en cien. Habrá, por tanto, tres cuartiles
(Q1,Q2,Q3), nueve deciles (D1,D2, · · · ,D9) y, noventa y nueve
percentiles (P1, P2, · · · , P99). El segundo cuartil, el quinto decil y el
quincuagesimo percentil son iguales y coinciden con la mediana.
Ejercicio:
• Se ha realizado una encuesta en 30 hogares en los que se pregunta el
número de individuos que viven en el domicilio. Las respuestas son
las siguientes:
4,4,1,3,5,3,2,4,1,6,2,3,4,5,5,6,2,3,3,2,2,1,8,3,5,3,7,4,2,3.
Obtén :
 Unidad de medida, rango, amplitud.
 distribución de frecuencias, marca de clase, frecuencia absoluta,
relativa y sus correspondientes acumuladas.
 Media, mediana, moda
Responde:
• ¿Qué proporción de hogares esta compuesto por 3 o menos
personas?
GRAFICAS

• Después de agrupar los datos de


un conjunto en una tabla de
frecuencias o de distribución,
es útil representar algunas de
las columnas de la tabla para
obtener una idea general del
comportamiento de todo el
conjunto de datos.
Datos
¿Qué debe llevar un grafico?

Nº del Título del gráfico. Debe indicar a los sujetos, las


gráfico variables y la ubicación espacial y temporal

Gráfico 2. Clasificación de un grupo de estudiantes de la Universidad

Nacional Abierta de acuerdo a la tenencia de la vivienda.

Mérida, octubre del 2000.

Otra forma

8,6%

Alquilada

22,3%
Totalmente propia

50,2%

Propia, pagándose
19,0%

Datos supuestos

Fuente o nota
Histograma.
• Un histograma es una representación
gráfica de una variable en forma de
barras.
• Se utilizan para variables continuas o
para variables discretas, con un gran
número de datos, y que se han agrupado en
clases.
• En el eje abscisas se construyen unos
rectángulos que tienen por base la
amplitud del intervalo, y por altura, la
frecuencia absoluta de cada intervalo.
• La superficie de cada barra es
proporcional a la frecuencia de los
valores representados.
POLÍGONO DE FRECUENCIAS.
OJIVA.

 La ojiva es la distribución de
frecuencias, es decir, que en
ella se permite ver cuántas
observaciones se encuentran
por encima o debajo de ciertos
valores, en lugar de solo
exhibir los números asignados
a cada intervalo.
OTROS.

También podría gustarte