Está en la página 1de 98

PRESENTACIÓN Y REPRESENTACIÓN

DE UN GRUPO DE DATOS

Aldemar González Rodríguez


PhD in Animal Production
MSc in Animal Breeding and Reproduction Biotechnology
Introducción

R Project
(Motor)
• Programa Diseñado para realizar análisis estadístico y R Studio
gráficas.
(Volante)
• Es un software libre.
• Sencillo de compartir código R. Es un programa para manejar R de manera
• Gran comunidad a nivel mundial. más cómoda es un IDE (Entorno de
• Lenguaje de programación, orientado a objetos. Desarrollo Integrado)
Introducción
Introducción
Introducción
Introducción
Introducción
Introducción
Introducción
Introducción
Introducción
¿Quiénes lo usan?

• Investigadores científicos.
• Profesores.
• Estudiantes.
• Analistas financieros.
• Economistas.
Introducción
Introducción
Introducción

EDITOR
Introducción

¿Qué es un Script?
Introducción

Documento de texto
Introducción

Estructura
de análisis
de Datos
Introducción

CONSOLA
Introducción
Introducción

ENTORNO DE
VARIABLES
Introducción

¿Qué es una variable?

Es un espacio en la computadora
donde guardamos un objeto.
Introducción
Introducción
Introducción
Introducción

UTILIDADES
Introducción

MENÚ SUPERIOR
Introducción
¿Para que sirve R?

•Análisis estadístico:

oTablas de Frecuencia (Descriptivo), etc.


oANOVA.
oModelos regresión lineales.
oModelos de redes neuronales.

•Gráficas:
oDistribución (histogramas, boxplot, etc.).
oCorrelación (Heatmap, Scatter, etc.).
oRanking (Barplot, Radar, etc.).
oOtros (Piechart, Dendrogramas, ec.).
oEvolución (Lineplot, series de tiempo, etc.).
oMapas (Cartograma, Canectividad,etc.).
oFlujo (Network, Diagrama de arcos, etc.).
Introducción

Rey Herodes I El Grande


Emperador Chino Yao
Se ordena un empadronamiento
Inicia la estadística en el año 2.238 conocido como el censo de Quirino 51
A.C. con un censo en el imperio. A.C – 21 D.C.
Introducción
Esta disciplina tuvo su inicio
en Alemania a mediados del
siglo XVII, cuando utilizó
la palabra “Estadística” y la
separa de la “Sociología”.

Este trabajo, dio una visión


global de los países
europeos, describiendo
estadísticamente el estado de
su agricultura, las
manufacturas y el
Godofredo Achenwall comercio.
(1719-1772)
Introducción
En el Imperio Inca la estadística
era tan completa como la actual,
empleaba para sus cómputos un
sistema de cordones de variados
colores, armados y combinados;
conociendo (Suarez 1999):

• La población distribuida por


localidades.
• Sexos y condición civil.
• Número de nacimientos y
muertes.
• Número de hombre aptos para la
guerra.
• Cantidad de provisiones con que
contaban.
Introducción
La palabra Estadística:
• Para algunos proviene de la palabra Status, cuyo
significado es Estado.

• Para otros de la palabra Germánica Stara que


significa Estado, encargado de hacer estadística.

• Para otros se deriva del vocablo Griego Statera que


significa Balanza.

(Martínez 2005)
Introducción
En los tiempos modernos la estadística, tiene
funciones importantes dentro de otras ramas, no solo
en lo social:
• En procesos de investigación se denomina
BIOESTADISTICA, como la ciencia encargada de
analizar datos relacionados directamente con:
• Variables biológicas, su importancia, influencia, relación
o diferencia, etc.
• Permiten conocer o tomar decisiones acerca del
comportamiento de los seres vivos bajo condiciones
estipuladas.
Introducción
• Charles Darwin (1809-1882): Incluyo la
estadística dentro de la formulación de sus teorías.

• Kart Pearson (1857-1936): Dedicó gran parte de su


vida al estudio de la estadística y fundó la
biometría.

• Ronald Fisher (1980-1962): Inició la relación entre


los métodos estadísticos y la agricultura, genética y
biología.
Introducción
• Bioestadística ó Biometría (Medición de variables
biológicas): Se ha vuelto una herramienta indispensable
para ramas tan importantes como:
• Genética.
• Nutrición.
• Salud.
• Producción.
• Cualquier otra profesión que trabaje con seres vivos y factores que los
afecten.

• El estudio de variables biológicas, hace indiscutible el


uso de métodos estadísticos para aportar al conocimiento
de los organismos vivos de manera veraz y sensata.
Objetivo
• Objetivo general: Aprender conceptos y formas de
presentar y analizar datos de variables biológicas.

• Objetivos específicos:
• Estudiar los conceptos básicos que se usan en la
bioestadística como rama de la estadística.
• Entender la naturaleza de los datos, forma de tomarlos,
analizarlos, resumirlos, presentarlos y representarlos,
cumpliendo con las expectativas y competencias de una
profesión ligada al campo.
Bioestadística
Es una herramienta usada no solo en investigación, sino
también de producción animal, con el fin de ampliar el
conocimiento y poder tomar decisiones, ya sea en
(comprobar hipótesis, teorías, modelos e incluso leyes):

• Análisis ambientales (nutrición, alimentación).


• Poblaciones humanas (manejo dados por el personal).
• Poblaciones animales (genética).
• Producciones agrícolas (ecología, geología, botánica).
• cualquier otra ciencia relacionadas con la naturaleza del
hombre, los animales, las plantas, microorganismos y medio
ambiente.
El método estadístico
El proceso de elaboración estadística se puede dividir en 6 fases
(Martínez, 2005):

1. Planeamiento o preparación:
a. Objeto de la investigación.
b. Finalidad de la investigación.
c. Fuente de información.
d. Procedimientos.
e. Material.
f. Costo y financiación.
2. Recolección de datos.
3. Criterios y codificación.
4. Procesamiento.
5. Análisis e interpretación.
6. Publicación.
El método estadístico
Todo procedimiento de investigación debe acogerse a los
siguientes criterios:

• Claridad: Toda investigación debe ser entendida por todo el


mundo: investigador(es), lectores, y quienes vayan a utilizar los
resultados, etc.

• Sencillez: Es la clave para brindar claridad en todo


(Instrucciones, finalidad, objetivos, análisis, interpretación,
representación y presentación).

• Utilidad: Toda estadística debe tener alguna aplicación práctica


de interés (No generar una acumulación molesta de datos).
Conceptos
• Estadística: Es un campo del estudio relacionado con:
1. El sistema o método utilizado para recolección, organización,
análisis, descripción y resumen de datos.
2. La obtención de inferencias acerca de un conjunto de datos
cuando solo se observa una parte de ellos (Daniel, 1990 y
Martínez, 2005).

• Bioestadística: Cuando los datos que se recopilan y


analizan corresponden a disciplinas que forman parte de
las ciencias biológicas, como (Suárez, 1999):
• Veterinaria.
• Zootecnia.
• Agronomía.
• Ecología, etc.
Conceptos
Variable: Cuando se observa una característica medible y
esta toma valores distintos entre individuos, lugares,
condiciones de producción o a través del tiempo (Varia por
algún efecto). Ejemplos:

• La altura de plantas de maíz en un cultivo (Varia por intensidad


de luz, ubicación, disponibilidad de agua, genética, etc.).

• La ganancia de peso en animales (varían por raza, sexo, edad,


lugar, alimentación, genética, etc.).

• La cantidad de aportes nutricionales del suelo de una granja


(Varía por efectos edáficos: a)Estructuras físicas
b)Composiciones químicas y c)Condiciones microbiologicas).
Conceptos
Variable aleatoria:
Al igual que la anterior se determina una medición
generando dato en un individuo (Peso, estatura, etc.),
sin embargo, la selección de individuos para el
estudio se realiza de forma aleatoria (al azar) a fin de
evitar sesgos.

Observaciones o medidas :
Corresponde a los valores que resultan de los
procesos de medición, o calificación subjetiva
Conceptos
Variables cualitativas

• Variable nominal. Se obtiene cuando se definen las


categorías y se cuenta el número de observaciones que
quedan en cada una. Las variables nominales comprenden las
categorías como:
• Sexo (macho, hembra).
• Color.
• Raza.

• Variables ordinales o jerárquicas: Constan de valores


relativos asignados para denotar orden, un ejemplo de ello es
la normalidad o gravedad como se presenta un parto:
• Facilidad de parto (Normal, Ayuda, Cesarea).
Conceptos
• Población: Llamada también universo, se define como
el grupo de elementos por los cuales se tiene un cierto
interés en un momento dado. Las características
primordiales de una población son: su naturaleza, su
magnitud, el espacio y el tiempo (Daniel, 1990).

Las poblaciones pueden ser:


• Finita: Si se desea hacer un estudio sobre la población donde
el número de animales esta determinado por censo o
registros.

• Infinita: Si un estudio pretende analizar una población que


no se puede determinar o contar.
Conceptos
• Muestra: Es una parte o subconjunto de una
población.
Cuando la muestra representa a una población
grande o infinita, normalmente es tomada al azar, ya
que todos los individuos tienen la misma
probabilidad de conformar la muestra de estudio.

• Muestreo: Proceso que determina el tamaño y


selección de una muestra. Existen varios métodos
de muestreo con el fin de dar confiabilidad a los
resultados del estudio.
Conceptos
Unidad experimental: Son las unidades que conforman una muestra o una
población. El conjunto de unidades experimentales se simboliza
estadísticamente como:
• N si es una población.
• n si corresponde a una muestra.
Unidades experimentales individuales: Son aquellas en las que se tiene
en cuenta cada uno de los individuos de la muestra o de la población. Por
ejemplo:
Un estudio de incidencia y prevalencia de Influenza Equina (Cada uno de los
equinos a los que se están haciendo las pruebas).
Unidades experimentales grupales: Son las que por facilidad se
trabajan en grupo. Por ejemplo:
Un estudio para determinar la ganancia de peso de caracoles bajo ciertas dietas
(Se pesan los caracoles en grupos de 50).

Hipótesis: Es un supuesto que se asume tentativamente para representar un


resultado que se pretende probar.
Estadística Descriptiva
• Objetivos:
1. Enseñar la forma de construir y presentar un cuadro de
frecuencias absolutas y frecuencias relativas partiendo
de un conjunto de datos brutos.
2. Presentar gráficamente un cuadro de frecuencias por
medio de un histograma y/o de un polígono.
3. Conocer otros tipos de gráficas útiles para representar
datos.
4. Aprender la forma de calcular medidas de tendencia
central, dispersión, posición y forma de datos
agrupados y no agrupados.
5. Estudiar las ventajas, desventajas y propiedades de las
medidas de tendencia central, dispersión, posición y
forma.
Estadística Descriptiva
• Es la base para todos los modelos matemáticos
estadisísticos. Su finalidad es resumir en la mejor
forma un conjunto de elementos (datos) tomados
de una variable sin perder la importancia o
representatividad de cada uno de los datos que
compone el conjunto.

• Es de gran importancia porque facilita el análisis y


el entendimiento de conceptos y variables
biológicas, dando una base para tomar decisiones
que tienen impacto económico, social o ambiental.
Estadística Descriptiva
• Distribución de Frecuencias: Es un método
utilizado para organizar y resumir datos.
Bajo este método los datos que componen una serie,
se ordenan y clasifican, indicando el número de
veces que se repite. La distribución nos permite
manejar gran cantidad información en espacios
pequeños.
Estadística Descriptiva
• Pasos para elaborar una tabla de frecuencias:
1. Estimar el rango (R).
2. Determinar el número de clases (m).
3. Estimar el ancho de cada clase (amplitud de intervalo,
C).
4. Estimar límite inferior y superior de cada clase (xi-1 –
xi).
5. Estimar las marcas de clase (xi).
6. Determinar la frecuencia absoluta (ni).
7. Determinar la frecuencia absoluta acumulada (Ni).
8. Determinar la frecuencia relativa (hi).
9. Determinar la frecuencia relativa acumulada (Hi).
Estadística Descriptiva
1. Estimación del rango (R): El rango o recorrido es
el valor que se obtiene de la distancia entre el
mayor y el menor valor de las observaciones.
Ejemplo: Se tiene el siguiente conjunto de datos.
74, 71, 65, 72, 67, 79, 88, 66, 94, 40, 52.

El rango o recorrido se obtendría:


Dato mayor = 94, Dato menor = 40
R = 94 – 40
R = 54
Estadística Descriptiva
2. Estimación del número de clases: Para elaborar
una tabla de frecuencias, se establece cierto
número de clases (m) en los valores observados.

• Pocas clases: Encubre características importantes de


los datos debidos al agrupamiento.
• Demasiadas clases: pueden aparecer clases vacías y
la información no se resume de forma clara.
Estadística Descriptiva
2. Estimación del número de clases (m): Utilizar la fórmula de Sturges:

m = 1 + 3.322 (log n)

Donde, m es el número de intervalos de clases, y n es la cantidad de unidades


experimentales.
Por lo general esta fórmula da número decimales, y es necesario redondearlo.
Ejemplo: Se ha tomado el peso al destete de 758 cerdos de una piara que se
compone de 4,250 cerdos.
m = 1 + 3.322 (log n)
m = 1 + 3.322 (log 758)
m = 1 + 3.322 (2.8796)
m = 1 + 9.5662
m = 10.5662
m = 11 clases
Estadística Descriptiva
3. Estimación del ancho de cada clase (amplitud de
intervalo, C): Corresponde al número de unidades por
clase.

C=R/m

Donde, R es el rango y m es el número de clases.

Ejemplo: Si el Rango es 108, y la tabla de frecuencias


presentará 7 clases, entonces.

C = 108 / 7 C = 15.43 unidades


Estadística Descriptiva
4. Estimar límite inferior y superior de cada clase (xi-
1 – xi): Este se obtiene tomando el dato menor del
conjunto de datos (Límite inferior de la primera
clase) y sumándole el ancho de clase (C), este
resultado sería el límite superior de dicha clase y el
menor de la segunda clase, así sucesivamente.
Estadística Descriptiva
4. Estimar límite inferior y superior de cada clase (xi-1 – xi):
Ejemplo: Si se tienen las siguientes condiciones, xi-1 = 25, xi = 125, R =
100, m =5, C = 20.
Clase Limites
m xi-1 xi
1 25 45
2 45 65
3 65 85
4 85 105
5 105 125

El problema es que si en el conjunto de datos aparece 45, ¿Dónde ubico este valor?
En la clase 1 o en la clase 2.
Estadística Descriptiva
4. Estimar límite inferior y superior de cada clase (xi-1 – xi):
Ejemplo: Si se tienen las siguientes condiciones, xi-1 = 25, xi
= 125, R = 100, m =5, C = 20.

Clase Limites
m xi-1 xi
1 25 44.9
2 45 64.9
3 65 84.9
4 85 104.9
5 105 125
Estadística Descriptiva
4. Estimar límite inferior y superior de cada clase (xi-1 – xi):
Ejemplo: Si se tienen las siguientes condiciones, xi-1 = 25, xi
= 125, R = 100, m =5, C = 20.

Clase Limites
m xi-1 xi
1 [25 45)
2 [45 65)
3 [65 85)
4 [85 105)
5 [105 125]
Estadística Descriptiva
5. Marcas de clase (): Corresponden al punto central en cada una de
las clases que se han tomado.
Ejemplo: Si se tienen las siguientes condiciones, xi-1 = 25, xi
= 125, R = 100, m =5, C = 20.

Clase Limites Marcas de Clase


m
1 [25 45) 35 = (25+45)/2
2 [45 65) 55
3 [65 85) 75
4 [85 105) 95
5 [105 125] 115
Estadística Descriptiva
6. Frecuencias absolutas (): Se define como el número de veces que
se repite un fenómeno. Corresponde al número de unidades
experimentales que están en cada uno de los intervalos de clase.
Se tienen las siguientes propiedades:
• Las frecuencias absolutas son siempre números enteros.
• La suma de las frecuencias absolutas es igual a n si es una
muestra, o N si es una población.
Estadística Descriptiva
7. Frecuencias absolutas acumuladas (): A menudo es importante
tener las frecuencia acumuladas entre algunas clases, esto facilita la
interpretación y toma de decisiones.

Ejemplo: Si las clases corresponden a edades de un grupo de


terneros para engorde y se quiere hacer una clasificación de
los que son aptos para la etapa de levante, es importante tener
definido hasta cierta edad (límite de clase) cuantos animales
corresponden o se pueden clasificar en levante.
Estadística Descriptiva
8. Frecuencias relativas (hi): Corresponde a la proporción o
porcentaje de los valores que se incluyen en los distintos intervalos
de clase.

Donde, la frecuencia absoluta de cada intervalo es , y el


número total de observaciones .
Estadística Descriptiva
9. Frecuencias relativas acumuladas (Hi):
Es la suma sucesiva de las frecuencias relativas
Estadística Descriptiva
Distribución de Frecuencias: Para ilustrar todo el proceso
completo se presenta el siguiente ejemplo adaptado de Suárez,
1999:
Estadística Descriptiva
1. Estimación del rango (R): El examen de los datos
revela que los puntajes, más bajos y más altos son
85 y 129 kilos, respectivamente. Entonces, el
intervalo inferior de clase debe empezar desde 85
y el intervalo mayor debe tener un límite menor
igual a 129.

El rango o recorrido se obtendría:


,
R = 129 – 85
R = 44
Estadística Descriptiva
2. Estimación del número de clases (m): Formula
de Sturges:

m = 1 + 3.322 (log n)
m = 1 + 3.322 (log 150)
m = 1 + 3.322 (2.17609)
m = 1 + 7.2289
m = 8.22
m = 9 Clases
Estadística Descriptiva
3. Estimación del ancho de cada clase (amplitud de
intervalo, C): Es el valor que va a tener como
amplitud en cada una de las clases que se han
establecido.

C=R/m

Donde, R es el rango y m es el número de clases.


Ejemplo: Si el R es 44, y el número de clases es 9,
entonces, el ancho de cada clase corresponde a:

C = 44 / 9 C = 4.88 C = 5 unidades
Estadística Descriptiva
4. Estimar límite inferior y superior de cada clase (xi-1 – xi):
Ejemplo: Si se tienen las siguientes condiciones, xi-1 = 85, xi
= 130, R = 44, m =9, C = 5.
Clase Limites
m
1 [85 90)
2 [90 95)
3 [95 100)
4 [100 105)
5 [105 110)
6 [110 115)
7 [115 120)
8 [120 125)
9 [125 130]
Estadística Descriptiva
5. Marcas de clase (): Corresponden al punto central en cada una de
las clases que se han tomado.

Clase Limites Marcas de Clase


m
1 [85 90) 87.5
2 [90 95) 92.5
3 [95 100) 97.5
4 [100 105) 102.5
5 [105 110) 107.5
6 [110 115) 112.5
7 [115 120) 117.5
8 [120 125) 122.5
9 [125 130] 127.5
Estadística Descriptiva
6. Frecuencias absolutas ():

Clase Limites Marcas de Frecuencias


Clase absolutas
m
1 [85 90) 87.5 9
2 [90 95) 92.5 11
3 [95 100) 97.5 14
4 [100 105) 102.5 20
5 [105 110) 107.5 27
6 [110 115) 112.5 22
7 [115 120) 117.5 19
8 [120 125) 122.5 16
9 [125 130] 127.5 12
Estadística Descriptiva
7. Frecuencias absolutas acumuladas ():

Clase Limites Marcas de Frecuencias Frecuencias


Clase absolutas absolutas acum.
m
1 [85 90) 87.5 9 9
2 [90 95) 92.5 11 20
3 [95 100) 97.5 14 34
4 [100 105) 102.5 20 54
5 [105 110) 107.5 27 81
6 [110 115) 112.5 22 103
7 [115 120) 117.5 19 122
8 [120 125) 122.5 16 138
9 [125 130] 127.5 12 150
Estadística Descriptiva
8. Frecuencias relativas (hi):

Clase Limites Marcas Frec. Frec. Abs. Frec.


Clase Abs. Acum. Relat.
m hi
1 [85 90) 87.5 9 9 0.06
2 [90 95) 92.5 11 20 0.0733
3 [95 100) 97.5 14 34 0.0933
4 [100 105) 102.5 20 54 0.1333
5 [105 110) 107.5 27 81 0.18
6 [110 115) 112.5 22 103 0.1466
7 [115 120) 117.5 19 122 0.1266
8 [120 125) 122.5 16 138 0.1066
9 [125 130] 127.5 12 150 0.08
Estadística Descriptiva
8. Frecuencias relativas acumuladas (Hi):

Clase Limites Marcas Frec. Frec. Abs. Frec. Frec. Relat.


Clase Abs. Acum. Relat. Acum.
m hi Hi
1 [85 90) 87.5 9 9 0.06 0.06
2 [90 95) 92.5 11 20 0.0733 0.1333
3 [95 100) 97.5 14 34 0.0933 0.2266
4 [100 105) 102.5 20 54 0.1333 0.3599
5 [105 110) 107.5 27 81 0.18 0.5399
6 [110 115) 112.5 22 103 0.1466 0.6865
7 [115 120) 117.5 19 122 0.1266 0.8131
8 [120 125) 122.5 16 138 0.1066 0.9197
9 [125 130] 127.5 12 150 0.08 1
Estadística Descriptiva
Distribución de Frecuencias:

Clase Limites Marcas Frec. Frec. Abs. Frec. Frec. Relat.


Clase Abs. Acum. Relat. Acum.
m hi Hi
1 [85 90) 87.5 9 9 0.06 0.06
2 [90 95) 92.5 11 20 0.0733 0.1333
3 [95 100) 97.5 14 34 0.0933 0.2266
4 [100 105) 102.5 20 54 0.1333 0.3599
5 [105 110) 107.5 27 81 0.18 0.5399
6 [110 115) 112.5 22 103 0.1466 0.6865
7 [115 120) 117.5 19 122 0.1266 0.8131
8 [120 125) 122.5 16 138 0.1066 0.9197
9 [125 130] 127.5 12 150 0.08 1
Estadística Descriptiva
Distribución de Frecuencias:

Clase Limites Marcas Frec. Frec. Abs. Frec. Frec. Relat.


Clase Abs. Acum. Relat. Acum.
m hi Hi
1 [85 90) 87.5 9 9 0.06 0.06
2 [90 95) 92.5 11 20 0.0733 0.1333
3 [95 100) 97.5 14 34 0.0933 0.2266
4 [100 105) 102.5 20 54 0.1333 0.3599
5 [105 110) 107.5 27 81 0.18 0.5399
6 [110 115) 112.5 22 103 0.1466 0.6865
7 [115 120) 117.5 19 122 0.1266 0.8131
8 [120 125) 122.5 16 138 0.1066 0.9197
9 [125 130] 127.5 12 150 0.08 1
Estadística Descriptiva
Distribución de Frecuencias:

Clase Limites Marcas Frec. Frec. Abs. Frec. Frec. Relat.


Clase Abs. Acum. Relat. Acum.
m hi Hi
1 [85 90) 87.5 9 9 0.06 0.06
2 [90 95) 92.5 11 20 0.0733 0.1333
3 [95 100) 97.5 14 34 0.0933 0.2266
4 [100 105) 102.5 20 54 0.1333 0.3599
5 [105 110) 107.5 27 81 0.18 0.5399
6 [110 115) 112.5 22 103 0.1466 0.6865
7 [115 120) 117.5 19 122 0.1266 0.8131
8 [120 125) 122.5 16 138 0.1066 0.9197
9 [125 130] 127.5 12 150 0.08 1
Estadística Descriptiva
• Graficas: Con frecuencia, el significado de los
datos se puede comunicar más efectivamente por
medio de gráficos. Los más conocidos son:

• Histogramas.
• Polígonos de frecuencias.
• Ojivas.
• Diagrama circular o pastel.
• Pictogramas.
Estadística Descriptiva
• Graficas: Recomendaciones para la elaboración de gráficas
(Martínez 2005):
• La mejor gráfica es la más simple.

• Las gráficas deben ser sencillas y claras, de tal manera que sean
comprensibles sin la ayuda de las descripciones del texto.

• Las gráficas nunca sustituyen una tabla, al contrario, deben


complementarse.

• La finalidad de la gráfica es visualizar mejor la información.

• La gráfica es considerada como el medio de expresión de la


estadística, más llamativa y sugestiva, a la vez que presenta la
ventaja de dejar en la memoria una expresión más duradera que
las tablas o el texto, en un menor tiempo de lectura.
Estadística Descriptiva
• El histograma: Es un tipo especial de gráfica de barras para
representar distribuciones de frecuencias absolutas o
relativas. Tiene las siguientes carácterísticas:
• Los valores de la variable que se está considerando se
representan en el eje horizontal (eje x o independiente).

• Las frecuencias absolutas o relativas se representan en el eje


vertical (eje y o dependiente).

• Cada intervalo de clase tomado en la distribución de


frecuencias implica una sección sobre el eje horizontal.

• Por encima de cada intervalo de clase sobre el eje horizontal


se levanta una barra rectangular, de modo que su altura
corresponde con la frecuencia correspondiente.
Estadística Descriptiva
• Ejemplo: Se presenta el histograma para la distribución de frecuencias
absolutas realizada con el peso de cerdos y se tendría:
Estadística Descriptiva
• Ejemplo: Se presenta el histograma para la distribución de frecuencias
relativas realizada con el peso de cerdos y se tendría:
Estadística Descriptiva
Polígono de frecuencias:

Se construye localizando el punto medio de cada


intervalo de clase (marcas de clase) en el eje X y
marcando un punto a la altura de la frecuencia
correspondiente en el eje Y.

Uniendo los puntos medios de las alturas se


obtiene un polígono.
Estadística Descriptiva
• Polígono de frecuencias:
Estadística Descriptiva
• Histograma y Polígono de frecuencias:
Estadística Descriptiva
Ojiva:
Es una representación gráfica para las frecuencias
absolutas o relativas acumuladas de una variable
continua. Para ello se determinan los puntos de
intersección entre cada valor de la variable y su
respectiva frecuencia; luego se unen los trazos
rectilíneos.

Prácticamente es un polígono de frecuencias, con


la diferencia de ser aplicado a una tabla de
frecuencias acumuladas.
Estadística Descriptiva
• Ojiva:
Estadística Descriptiva
• Pie:
Estadística Descriptiva
• Pictograma:
Estadística Descriptiva
• Medidas de tendencia central, dispersión, Posición y
forma: Estas medidas descriptivas, son el resultado de
cálculos matemáticos sencillos que tienen como objetivo
representar o describir en forma muy resumida un grupo
de datos que componen una variable.
Estadística Descriptiva
• Carácterísticas de las medidas descriptivas (Martínez, 2005):
• Debe estar representada por un solo valor.
• Debe ser objetiva y definida por una fórmula algebraica, de tal
manera que cualquier persona que trabaje con los datos,
obtenga siempre el mismo valor.
• Debe ser descriptiva de los datos en forma que su significado
sea fácil de entender.
• No debe ser una abstracción matemática, que únicamente
pueda ser entendida por personas muy versadas en esta
ciencia, ya que una de las funciones de la estadística es
simplificar los datos y no hacerlos más complejos.
• Debe ser fácil de calcular.
Estadística Descriptiva
• Carácterísticas de las medidas descriptivas (Martínez,
2005):
• Debe ser calculada con todos los elementos del grupo de
datos.
• Debe depender de todo el grupo de datos, de tal manera
que si se altera uno de estos, consecuentemente se altera el
valor obtenido.
• A pesar de que cada uno de los valores del grupo de datos,
debe tener influencia sobre la medida obtenida, ésta debe
ser de tal calidad que no vea influenciada en gran medida
por el cambio de algunos pocos datos.
• Debe ser de uso fácil para cálculos matemáticos posteriores.
Estadística Descriptiva
• Las medidas descriptivas se pueden clasificar en:

1. Medidas de tendencia central.

2. Medidas de dispersión.

3. Medidas de forma.

4. Medidas de posición.
Estadística Descriptiva
• Medidas de tendencia central: Es una forma útil
de describir mediante un solo dato, la totalidad de
un grupo de datos.
Como su nombre lo indica es un dato hallado en el
centro de la distribución; es el punto central o
medio entre el conjunto de datos.
Las principales medidas de tendencia central son:
• Media Aritmética.
• Media Ponderada.
• Media Geométrica.
• Mediana.
• Moda.
Estadística Descriptiva
• Medidas de dispersión: Estas medidas indican el
grado de variabilidad entre las observaciones, las
más comunes son:

• Amplitud.
• Varianza
• Desviación estándar.
• Coeficiente de varianza.
Estadística Descriptiva
• Medidas de posición: Cuartiles, Deciles y
Percentiles.
Cuando la distribución contiene un número alto de
intervalos o marcas de clase y se quiere obtener un
promedio de una parte de ella, se puede dividir la
distribución en cuatro, diez o cien partes. En el
primer caso se denominan Cuartiles, en el segundo
se denomina Deciles y en el tercero Percentiles.
Estadística Descriptiva
Estadígrafo de forma: Se pretende determinar si una
distribución es simétrica o asimetrica.
• Cuando una distribución es normal, la media aritmética, la
mediana y la moda son iguales.
Estadística Descriptiva
Estadígrafo de forma: Se pretende determinar si una
distribución es simétrica o asimetrica.
• Cuando la media aritmética es menor que la mediana y
éstas a su vez, menor que la moda (Distribución sesgada a
la izquierda o asimétrica negativa).
Estadística Descriptiva
Estadígrafo de forma: Se pretende determinar si una
distribución es simétrica o asimetrica.
• Si la media aritmética es mayor que la mediana y éstas es
mayor que la moda (Distribución sesgada a la derecha o
asimétrica positiva).
¡Gracias!

También podría gustarte