Está en la página 1de 46

Razones, Proporciones y tasas

Cuando se analiza información estadística es muy importante utilizar el pensamiento proporcional, esto es poder
establecer la relación de una cantidad con respecto a otra que puede ser de la misma categoría o con relación al total de
los datos, esto nos ayuda a establecer la importancia o peso relativo de las magnitudes o cantidades analizadas.

Para aclarar esta idea pensemos en el siguiente ejemplo:


Supongamos que Juan y Pedro practican el bolón cesto y se observa que en un lapso de 15 minutos Juan logró anotar 5
canastas y Pedro obtuvo 7 anotaciones.

¿Podríamos decir que Pedro tuvo mejor acierto al lanzar?

No necesariamente, ya que desconocemos si la cantidad de tiros al aro es la misma para los dos; si ese fuera el caso la
afirmación sería correcta.

Asumamos que Juan anotó 5 de 10 lanzamientos y Pedro anotó 7 de 20 lanzamientos, entonces si podríamos afirmar que
Juan tuvo mejor acierto al lanzar que Pedro Con frecuencia se hace necesario comparar dos cantidades, cuando la
comparación se hace a través de un cociente, nos estamos refiriendo a una razón geométrica, a la cual nos referiremos
simplemente como una razón.

Observación: La razón compara una categoría con otra categoría.

Ejemplo:

Si en este momento en la sala de espera del aeropuerto internacional Toncontín se encuentran 60 personas y se observa
que hay 45 hombres y 15 mujeres, entonces se puede decir que :

La razón de hombres a mujeres es: 45/ 15 = 3 Lo cual significa que hay 3 hombres por cada mujer en el salón

La razón de mujeres a hombres es: 15/ 45 = 1 3 Lo cual significa que hay 1 mujer por cada tres hombres en el salón

Cuando la comparación de la cantidad obtenida en una categoría se hace con relación al total de casos posibles, entonces
estamos hablando de una proporción.

Proporción: es la razón que compara el valor de una categoría con relación al total de casos posibles

Siguiendo el ejemplo anterior podríamos decir lo siguiente con relación a la cantidad de hombres y de mujeres en el salón
de espera del aeropuerto:

La proporción de hombres en el salón es: 45/ 60 = 3 4 = 0.75 ….. Este valor nos indica que las tres cuartas partes (3/4) de
ese grupo de personas son hombres

La proporción de mujeres en el salón es: 15/ 60 = 1 4 = 0.25 …..Este valor nos indica que una cuarta parte (1/4) de ese
grupo de personas son mujeres
La unidad es representativa de la totalidad que implica el 100% de los casos, lo cual nos induce a pensar en porcentajes.

Porcentaje: indica el número de datos que se le dan de una categoría por cada cien , el porcentaje se obtiene multiplicando
la proporción por 100 y se le agrega el símbolo del porcentaje %

Bajo esta modalidad podríamos decir que:

En la sala de espera del aeropuerto, en este momento se observa que el 75% son hombres y el 25% son mujeres.

Si este conteo se hiciera a diario por varios días, meses o años y se encontrara que los porcentajes se mantienen de manera
similar, de manera que se establece un patrón de comportamiento, entonces podríamos estimar que si en el salón hay 160
personas se esperaría que el 75% fueran hombres y el 25% mujeres obteniendo los siguientes datos:

* Mujeres: 160 ∗ 25% = 160 ∗ 0.25 = 40

* Hombres: 160 ∗ 75% = 160 ∗ 0.75 = 120

Al Sumar las dos cantidades 40 + 120 = 160 que corresponde al total de personas y que es el 100% de los casos.

De este modo si volvemos al ejemplo 1 de nuestros amigos deportistas tendríamos que el porcentaje de acierto de cada
uno fue:

Juan obtuvo 5 anotaciones de 10 lanzamientos esto es: 5 /10 ∗ 100% = 0.5 ∗ 100% = 50% Pedro obtuvo 7 anotaciones de 20
lanzamientos esto es: 7 20 ∗ 100% = 0.35 ∗ 100% = 35%

Lo cual nos confirma que el porcentaje acierto de Juan fue mayor que el de Pedro; y se podría esperar que si cada uno
hiciera 100 lanzamientos Juan tendría 50 aciertos y Pedro tendría 35.

Tasas: la tasa es otra clase de razón, que expresa la comparación entre el número de casos reales y el número de casos
potenciales

𝑇𝑎𝑠𝑎 = 𝑁𝑜.𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑅𝑒𝑎𝑙𝑒𝑠

----------------------------------

𝑁𝑜. 𝑑𝑒 𝐶𝑎𝑠𝑜𝑠 𝑃𝑜𝑡𝑒𝑛𝑐𝑖𝑎𝑙𝑒𝑠 ∗ 𝑘

Donde 𝑘 = Base de los casos potenciales (𝑘 puede tomar los valores de 1000, 10000, 100000) usualmente se utiliza 𝑘=1000

Las tasas que se presentan aquí, se refieren a ocurrencia de la muerte y fertilidad. Se presentan a continuación, algunas
tasas de mortalidad y de fertilidad y la forma en que se calcula:
Ejemplos: 1. En el año 2015 se obtuvieron los siguientes datos anuales en una región geográfica

Ejemplo 2. Si en una ciudad de Honduras el número de nacidos vivos durante el año 2017 fue de 23,470, la tasa bruta de
natalidad en dicha ciudad se estima en 154 por cada 1000 personas y el número de muertes durante el 2017 fue de 370.

Conceptos fundamentales de la estadística Distribuciones de Frecuencias Teoría y


ejemplos
La palabra "estadística" se utiliza comúnmente para referirse a una colección de datos numéricos. Este es el significado más
común de la palabra estadística. Sin embargo, la información numérica por si sola puede no constituir una estadística, para
merecer este nombre, los datos deben constituir un conjunto coherente, establecido de forma sistemática y siguiendo
criterios para su recolección, ordenación e interpretación; de manera que podríamos definir la Estadística de la siguiente
manera:

Estadística: es la ciencia que trata sobre la recolección, organización, consolidación, análisis e interpretación de datos.

Las herramientas de la Estadística, se aplican prácticamente en todos los campos del conocimiento: negocios, educación,
psicología, sociología agricultura, economía, investigación, por mencionar algunos de ellos, cuando los datos que se
analizan proceden de las ciencias de la salud y biología hablamos de Bioestadística, esta aplicación especial de la
Estadística al campo de la salud es el objetivo general de esta asignatura.

Rama de la estadística

 Estadística descriptiva: Conjunto de herramientas incluye las técnicas que tratan de la recolección, organización,
representación y análisis de la información; con el propósito de describir los fenómenos.
 Estadística Inferencial: incluye las técnicas que permiten trascender más allá de lo observado (muestra), haciendo
generalizaciones y predicciones sobre lo no observado (población)

Conceptos fundamentales de la estadística

 Población: Es el conjunto total de unidades de estudio sobre el cual estamos interesados en obtener conclusiones (hacer
inferencias) Normalmente es demasiado grande para poder abarcarlo
 Muestra: Es un subconjunto de la población al que tenemos acceso y sobre el que realmente hacemos las observaciones
Debe ser representativa de la población

Algunas razones para muestrear

 ➔ Establecer contacto con toda la población podría requerir mucho tiempo.


 ➔ El costo de estudiar todos los elementos de una población es muy alto.
 ➔ Algunas poblaciones son infinitas.
 ➔ Algunas pruebas son de naturaleza destructiva.
 ➔ Los resultados de la muestra son adecuados.

Ejemplo de Población: Si estamos interesados en conocer la opinión de los estudiantes de la UNAH en relación a la
implementación de la pena de muerte en Honduras. En este caso la población sería todos los estudiantes de la UNAH.

Ejemplo de muestra: Si estamos interesados en conocer la opinión de los estudiantes de la UNAH en relación a la
implementación de la pena de muerte en Honduras. En este caso la población está formada por todos los estudiantes de la
UNAH, aunque esta población es finita sería difícil preguntar sobre este tema a cada estudiante por lo cual se podrían
seleccionar 10 carreras al azar y tomar la opinión de 50 estudiantes de cada carrera y aplicarles un cuestionario sobre este
tema; en este caso la muestra estaría conformada por los 500 estudiantes seleccionados.

Técnicas de muestreo

 Muestreo Estratificado: Se usa cuando se conoce de antemano la población dividida en estratos equivalentes de categorías
y los cuales por general no son de igual tamaño
 Muestreo por conglomerados: Se usa cuando la población está dividida en grupos (conglomerados), se elige al azar varios
grupos y se ellos se selecciona la muestra
 Muestreo sistemático: Es cuando los datos de la población están ordenados en forma numérica la primera observación es
elegida al azar y las siguientes observaciones son elegidas guardando la misma distancia entre ellos.
 Muestreo por conglomerados; Se usa cuando la población está dividida en grupos (conglomerados), se elige al azar varios
grupos y se ellos se selecciona la muestra
 Muestreo aleatorio: Se usa cuando a cada elemento de la población se le da la misma oportunidad de ser elegido en la
muestra
 Variable: Son las características de las unidades de estudio. Estas cambian de un lugar a otro o de un individuo a otro.

Algunos ejemplos de variables son los siguientes:

En los ejemplos anteriores pueden distinguirse dos tipos de variables, las que sus diferentes valores se describen mediante
palabras (cualidades) y las que se describen mediante números (cantidades); de allí que las variables pueden ser:
cualitativas o cuantitativas.

Variables cualitativas: Describen cualidades o atributos de las variables, estas pueden clasificarse en categorías. Por
ejemplo:

 Estado civil: Soltero, casado, viudo, unión libre


 Género: Masculino, Femenino
 Profesión u oficio: Maestro, doctor, abogado, ingeniero, mecánico, ebanista, etc

Variables Cualitativas

Cualitativas Nominales: Sus categorías no implican ningún orden. Ejemplos:

 Religión: Católica, Evangélica, …,etc


 Color de ojos: Café, Verdes, Azules
Cualitativas Ordinales: Implican un orden en sus categorías. Ejemplos:

 Nivel de escolaridad: Primaria, secundaria, universitaria


 Nivel de infarto: Leve, moderado, grave

Variables cuantitativas: Se pueden medir y expresar con números. Por ejemplo:

 Edad
 Estatura
 Calificación de un examen
 No. De frutas en un árbol

Variables cuantitativas

Discretas: son las que solo toman valores enteros que surgen de un proceso de conteo. Ejemplos:

 No. de niños nacidos durante un mes en el Hospital Materno Infantil: 0,1,2,3,4,5, etc
 La cantidad de estudiantes matriculados en la carrera de Enfermeria en la UNAH: 100, 200,353, 421, etc.

Continuas: son las que pueden tomar valores decimales que surgen de un proceso de medición. Ejemplos:

• El precio de un producto: 5.08, 5.35, 6.00, 7.85, 10.13, etc.


• La estatura de una persona medida en metros: 1.5,1.62, 1.73, 1.80, 1.85, etc

Distribuciones de Frecuencia
Cuando estamos haciendo un estudio, la información se obtiene a través de diferentes formas, esto es con encuestas,
cuestionarios, bases de datos, etc. Generalmente la información llega sin ningún orden, por lo que al verla en forma global
no se facilita su comprensión y análisis. Las distribuciones de frecuencias nos permiten organizar datos numéricos. Lo cual,
nos ayuda a obtener características de los datos como ser:

• El rango o alcance de los datos.


• En torno a qué valor o valores se agrupan los datos.
• Qué valores se repiten más. Entre otras.

Todo esto ayuda a conocer y comprender mejor a la población de estudio, lo que nos facilitará el análisis y una mejor toma de
decisiones.

Ejemplo Las edades en años cumplidos de 35 alumnos de las secciones de bioestadística son las
siguientes:16,20,24,18,18,22,26,28,20,25,23,24,19,26,26,22,22,21,25,26,23,21,28,30,18,19, 22,24,21,26,25,20,19,26,25,33

En este caso se tomó una muestra de 40 personas, de donde se esperaría tener 35 datos; por lo cual el tamaño de este
conjunto de datos se dice es n=35 Al tener la información para iniciar el análisis, lo que inicialmente se hace es ordenar los
datos, esto es lo que llamamos en estadística ordenamiento de la información.

Rango de un conjunto de datos

Es la diferencia entre el valor máximo (mín) y el valor mínimo (máx) de un conjunto de Datos. Rango =Valor máximo –
Valor mínimo

En este caso el mín = 16 y máx =35. Así el rango es: Rango = 33- 16 =17

Este valor nos indica que tan lejos están los datos extremos es decir que hay 17 años De diferencia en las edades de los
alumnos Cuando la cantidad de datos es considerable, el arreglo ordenado no sirve de mucho, en este caso resulta
apropiado establecer categorías o grupos, a través de intervalos que nos ayuden a reducir el número de filas en la tabla.

Intervalos de Clase (Clases) Son categorías o grupos que representan un rango de valores. No hay una regla estricta que
indique cuántas clases usar, pero se aconseja que el número sea al menos de 5 y máximo de 15. Cada clase tiene dos
valores extremos: a- b donde “a” es el límite inferior y “b” el límite superior de la clase. Para calcular el número de clases
se utilizara la siguiente formula: Formula de Sturges = 1+3.322 log n

Es importante asegurarse que la primera clase ó intervalo incluya el valor mínimo y que la última clase o intervalo contiene
al valor máximo de los datos; usualmente las clases o intervalos de clase son del mismo ancho y las clases no deben
traslaparse. En nuestro caso el número de clases es: Numero de clases = 1 + 3.322 log 36 = 6.17

Se recomienda redondear el número de clases a un entero. Por lo tanto, el número de clases en nuestro caso serán 6

Como los datos son enteros, la anchura se redondea a un número entero, es decir, ancho=3 (la anchura debe tener tantas
cifras decimales como tienen los datos). También se prefiere que el redondeo sea hacia arriba, por ejemplo 7.001
redondeado hacia arriba da 8, esto asegura que no hará falta agregar una clase más; en cambio el redondeo usual sería 7.

Comencemos a construir las clases con el valor mínimo

Primera Clase : Edades de los alumnos entre 16 -18 años

Segunda Clase : Edades de los alumnos entre 19 -21 años

Tercera Clase : Edades de los alumnos entre 22 -24 años

Cuarta Clase : Edades de los alumnos entre 25 -27 años

Quinta Clase : Edades de los alumnos entre 28 -30 años

Sexta Clase : Edades de los alumnos entre 31- 33 años

Notemos que los limites inferiores a partir de la segunda clase se obtienen sumando la anchura al limite inferior que
procede, esto es:

Segunda Clase: Limite inferior = 16+anchura =16+3=19 Limite superior =18+anchura=18+3=21

Tercera Clase : Limite inferior = 19+anchura=19+3=22 Limite superior = 21+anchura=21+3=24

Como las clases no deben traslaparse (deben ser mutuamente excluyentes), y como la segunda inicia en 19 la primera debe
finalizar en 18,la tercera inicia en 22 la segunda finaliza en 21, etc. También al conocer el limite superior de la primera clase
se puede obtener los otros sumando la anchura al limite superior que precede.

Analizando el conteo de datos que cae dentro de cada clase,se obtiene la siguiente tabla

Limites reales de clase: Datos Enteros Datos 1 decimal: Datos 2 decimal:

LRI : limite real inferior LRI=limite inferior – 0.5 LRI = limite inferior – 0,05 LRI = limite inferior – 0.005

LRS : limite real superior LRS= limite superior + 0.5 LRS = limite superior + 0.05 LRS= limite superior + 0.005

Recuerde que es importante que las clases no deben traslaparse y deben incluir los valores mínimos y máximos del
conjunto de datos

En la segunda columna de la tablas se observa la letra “f” para referirse a las frecuencias absolutas, las frecuencias
absolutas se obtienen contando cuantos datos caen en cada categoría
Las marcas de clase, son aquellas que se denota por Xi , la marca de clase es un valor representativo para cada clase o
Intervalo y se obtiene al calcular el punto medio de los límites de cada clase ó el punto medio de los límites reales de clase
así:

Frecuencia Relativa: En el caso de la Frecuencia Relativa, es la razón que resulta al comparar la frecuencia de cada clase con
el total de frecuencias como se muestra en la tabla:
A continuación tienes un video donde se te explica otro ejemplo de distribuciones de frecuencias. Para ver el video Haga
clic

Gráficos Estadísticos

Posiblemente muchas veces hemos escuchado la frase popular que “una imagen vale más que mil palabras”,
particularmente en el campo de la Estadística esta frase cobra mucha importancia, ya que podemos tener una
montaña de datos que por sí sola no revela mucho sobre la(s) variable(s) que se están considerando; pero
cuando la información se tabula (se coloca en tablas) o se representa gráficamente facilita visualizar el
comportamientos o tendencias de la(s) variable(s) en cuestión.

Las formas de representación estadística más usadas son las tablas estadísticas y los gráficos estadísticos;
usualmente la información estadística se ordena en tablas; posteriormente con la información de la tabla se
construyen los gráficos que sean más adecuados para el tipo de información, propósito de la investigación y al
público que va dirigida la información. Los gráficos que estudiaremos a continuación se muestran en el

siguiente diagrama.

Gráficos para variables cualitativas: Los gráficos más utilizados para variables cualitativas se muestran en la
siguiente figura
Pictograma

Es un gráfico que presenta en forma muy amena la información estadística, utilizando símbolos o figuras
alusivas al tema, donde cada objeto representa una cantidad específica; este tipo de gráfico se utiliza en
publicidad, también cuando se pretende llegar a un público de bajo nivel educativo o a los niños para presentar
la información en forma sencilla y amigable; como se muestra en el siguiente ejemplo:

Ejemplo Suponga que tenemos una tabla con la población de los países centroamericanos y queremos
representar gráficamente la información en un pictograma, utilizaremos la bandera de cada país en lugar de
usar los nombres y para representar sus habitantes, el símbolo que represente a las personas, indicando que
cada figura corresponde a 1 millón de habitantes.

Gráfico de Línea: Como lo indica su nombre, en este tipo de gráfico se unen los puntos indicados en la tabla
estadística con líneas, se utiliza para analizar comportamiento o tendencia de una o más variables. Para ilustrar
este gráfico consideremos el siguiente ejemplo: En este ejemplo hemos tomado las temperaturas mínimas
durante una semana de la estación meteorológica de la UNAH lo cual muestra la siguiente tabla:

Como puede observarse la tabla presenta los datos de las temperaturas mínimas durante una semana y puede
observarse que a partir del día miércoles comenzó a decrecer, sin embargo es mucho más fácil de analizar
observando el grafico de linea que muestra el comportamiento o tendencia de la temperaturas durante una
semana

Gráficas de Barra :Este tipo de gráfica reciben este nombre ya que la información de una tabla se ilustra
utilizando barras que nos indican los valores correspondientes a las diferente categorías; éstas pueden ser
simples, comparativas y compuestas. En General las gráficas de barra se construyen colocando los datos o
categorías de la columna matriz en el eje horizontal y los valores de las categorías en el eje vertical. Con la
información de la tabla anterior podemos construir los tres tipos de graficas de barra dependiendo de cuál sea
nuestro objetivo al analizar o comunicar la información; consideremos la tabla estadística del Instituto de
Formación Profesional FOPIN:

Gráfica de Barra Simple Este tipo de gráfica es útil si nos interesa comparar el número total de aprendices en
cada oficio, la gráfica muestra a simple vista que electrónica tiene el mayor número de aprendices y carpintería
el menor

El grafico de barra simple se utiliza para representar información de una variable cualitativa, en un eje se
colocan las categorías de la variable y en el otro eje las frecuencias de ocurrencia de dichas categorías

Grafica de Barra Comparativa

Este tipo de gráfica se usa para comparar modalidades de una misma categoría, por ejemplo el género de los
aprendices en cada oficio; la gráfica nos muestra en azul la participación de aprendices del género masculino y
en rojo la participación de aprendices del género femenino; se observa que la mayor parte de los aprendices
son del género masculino, en carpintería no hay mujeres, en electrónica hay más mujeres que varones y en
refrigeración hay igual cantidad de cada género.

El grafico de barra comparativa, Se utiliza para poder establecer Diferencias entre dos o mas Modalidades de
una misma categoría Representando con diferentes barras Cada modalidad, pero adyacentes entre si Por cada
categoría
Gráfica de Barra Compuesta

Esta gráfica también permite comparar dos o más modalidades de una misma categoría, distinguiéndolas con
diferentes colores, pero en una sola barra, lo cual permite visualizar el total de cada categoría. La grafica nos
muestra con la porción azul la cantidad de aprendices de género masculino y en rojo la porción de aprendices
del género femenino.

Gráfico Circular

Este gráfico también llamado “Pie” o Gráfico de Pastel, es útil para mostrar la participación de cada categoría
con relación al total de categorías que se analizan, por ejemplo: el color de ojos de una muestra de alumnos se
observa en la siguiente tabla Para representar el porcentaje correspondiente a cada color de ojos en un
diagrama circulares es necesario convertir los porcentajes a grados dado que la circunferencia tiene 360 grados
esto se hace aplicando la regla de tres simple pero para mayor facilidad lo haremos multiplicando cada
porcentaje por 3.6 como lo observamos en la tabla

Gráficos para variables cuantitativas

Histograma: Es un gráfico de barra que se construye colocando en el eje horizontal los límites reales de las
clases o intervalos y en el eje vertical las frecuencias absolutas o porcentuales correspondientes a cada clase.
Veamos la siguiente distribución de frecuencias y observen como en base a ello se realiza el histograma de
frecuencias absolutas. Veamos el siguiente ejemplo tiempo de espera de pacientes de un hospital observados
en su tabla de distribución de frecuencia
Polígono de Frecuencia Es un gráfico de línea que se construye con las marcas de clase en el eje horizontal y las
frecuencias absolutas o porcentuales en el eje vertical

Ojivas Las ojivas son gráficos de línea que se caracterizan por ser ascendentes “Ojiva menor que” y
descendentes “Ojiva mayor que”. La Ojiva menor que, es un gráfico de línea que en su eje horizontal lleva los
límites reales superiores y en el eje vertical las frecuencias acumuladas ya sea absolutas o porcentuales.

Hasta aquí hemos revisado las formas de representación estadística más usadas, hoy día el mayor énfasis no
está en la elaboración de los gráficos ya que las hojas electrónicas y el “software” de paquetes estadísticos que
facilitan la elaboración de todo tipo de gráficos, lo más importante es saber interpretar la información que nos
dan los gráficos que diariamente llegan a nosotros a través de los medios de comunicación o de informes
realizados por terceros; lo que nos obliga a capacitarnos para poder usar la tecnología a nuestra disposición,
tanto para los cálculos como para la elaboración de gráficos cuando los necesitemos en una actividad
investigativa o laboral.

Ejemplo 1 Según un estudio de especialistas en nutrición la distribución de alimentos consumidos en 60 familias


se resume en el siguiente grafico
Ejemplo 2: El siguiente grafico representa el número de intervenciones que se atendieron por año en hospitales
privados a hombres y mujeres

Medidas Descriptivas / Conceptos previos


 Parámetro: Medida descriptiva de la población total de todas las observaciones de interés para el investigador.
 Estadístico: Elemento que describe una muestra y sirve como una estimación del parámetro de la población
correspondiente

Medidas Descriptivas

Previamente a estudiar las medidas de tendencia central, las ubicaremos en el contexto de las medidas
descriptivas más utilizadas en la estadística. Estas medidas sirven para describir los datos o información de
interés en un estudio, permitiendo hacer una especie de retrato de la información, ya que nos proporcionan
aspectos esenciales de la misma, sin tener que ver uno a uno los datos. Las medidas de tendencia central son el
primero de los tres grupos de medidas descriptivas que estudiaremos. En el desarrollo de este tema se
identificará cuáles son las diferentes medidas de tendencia central, como se calculan, y la interpretación de las
mismas. El cuadro sinóptico que se presenta a continuación resume la clasificación de las medidas descriptivas y
dentro de éstas las diferentes medidas de tendencia central que estudiaremos.

Las medidas de tendencia central, son medidas que describen un conjunto de datos, indicando cuales son los
valores que tienden a ubicarse en la parte central de los mismos; y alrededor de ellas se agrupa la mayor parte
de los valores de la información analizada. Las medidas de tendencia central más utilizadas son tres: Media,
Moda y Mediana

 Media aritmética o simple y ponderada: Como pudieron observar en el cuadro sinóptico al inicio del tema, la
media se subdivide en media aritmética o simple y en la media ponderada, por lo cual te invito a conocer las
mismas a fin de diferenciarlas. Para ello te invito a que leas con detenimiento el siguiente texto.
 Media aritmética: Es una medida de tendencia central que indica el valor promedio de un conjunto de datos, de
allí que a veces nos referimos a la media como el promedio de los datos y la denotamos con los siguientes
símbolos:

Características

 •La media solo puede utilizarse para datos cuantitativos y es única.


 •Tiene la desventaja que es afectada por valores extremos

Para calcular la media de un conjunto de datos, ya sea de una muestra o de la población, se suman todos los
datos y el resultado se divide entre el número total de datos, puntuaciones u observaciones.

La fórmula que se utiliza para calcular la media es la siguiente:

Ejemplo

En una encuesta a personas con hipertensión arterial, se les ha preguntado el número de veces que han
recibido el control de 3 5 2 2 1 6 0 6 0 4 3 1 3

Observe que el número de elementos de la muestra es n = 13 Si se hace un arreglo de los datos en orden
ascendente, quedarían de la siguiente manera: 0 0 1 1 2 2 3 3 3 4 5 6 6

Para calcular la media de las edades: se suman todos los valores y se divide entre el número de observaciones,
como se muestra a
continuación:

Es importante recordar que la edad media obtenida de la muestra es un estadístico, es decir, un estimado de la
edad promedio de la población de personas que viajaban en el autobús. Si se tienen todos los datos de la
población, al calcular la media con esos datos se obtiene un parámetro.

Media de la población Si se tienen todos los datos de la población, la media se calcula de la misma manera,
solamente se usa una notación diferente para la Media (μ) y para el tamaño de la población (N), para hacer la
distinción de que se está calculando no un estimador del parámetro de la población sino que el verdadero valor.
La fórmula para calcular la media poblacional es la siguiente

Suponga que se toman todos los


datos del ejercicio anterior, los cualles
se presentan de forma ascendente 0 0
1122222333345556666778

Observe que el numero de elementos de la población es N=24 Para calcular la media poblacional se suman
todos los datos de la población y se divide por el número de observaciones:

Este valor indica que el numero promedio de es población de 24 personas que han recibido control de su
presión arterial Si ordenamos los datos de la población en forma ascendente, posiblemente podamos
observar que en la lista

Si comparamos la media muestral con la media poblacional tenemos: µ = 3.71, se observa una diferencia entre
ambos valores de 0.94 este es un error de estimación relativamente pequeño, sin embargo no siempre es
posible trabajar con todos los datos de la población .

Media Ponderada

Cuando calculamos la media para algunos casos particulares donde los datos a considerar tienen diferente peso
con respecto a los demás. Por ejemplo, al calcular el índice académico de un estudiante, que lleva clases que
tienen diferente número de unidades valorativas; se utiliza la media ponderada para poder obtener un
promedio (no simple) al que se llama índice académico. La fórmula para calcular

Consideremos el siguiente ejemplo: Los dueños de una farmacia compraron aspirinas a tres diferentes
proveedores. El primero les vendió 150 unidades a un precio de 12 lps cada una, el segundo 100 unidades a
12.80 lps
El preio promedio que han pagado
los dueños de la farmacia por cada
aspirina ha sido 12.40

Mediana

Es la medida de tendencia central que se ubica exactamente en el centro del conjunto de datos, dividiendo la
distribución en dos partes iguales, el símbolo para denotar la Mediana es Características

* La mediana ocupa la posición central de un conjunto de datos, divide los datos en dos partes iguales, no se
afecta por los valores extremos de los datos, pero es sensible al tamaño de la muestra.

* Para aclarar este concepto supongamos que tenemos un conjunto de datos ordenado en forma ascendente, la
mediana ocupa la posición central en el conjunto de datos, dividiendo el arreglo de datos en dos partes iguales,
de modo que cada una contiene el 50% de los datos, como se muestra en la siguiente figura.

Ejemplo

Las edades tomadas de una muestra de 16 niños hospitalizados por una crisis de asma son las siguientes

3,5,4,8,8,8,5,6,7,9,5,7,4,4,7,8

Para determinar la mediana la mediana se tendría que observar cual es el dato que se ubica en el centro de los
datos después Al ordenar los datos en forma ascendente tenemos : 3,4,4,4,5,5,5,6,7,7,7,8,8,8,8,9
Note que en este caso el número de elementos de la muestra es par (n=16) en este caso se toman lo

Para calcular la mediana de un conjunto de datos no agrupados, se siguen los siguientes pasos:
1. Se ordenan los datos en forma ascendente.

2. Si el conjunto de datos es impar, la mediana ocupa el valor central del conjunto de valores.

3. Si el conjunto de datos es impar, la mediana se obtiene sacando el promedio de los dos valores centrales.
Como se muestra en el siguiente ejemplo, en el cual quitamos un dato a la muestra del ejemplo anterior
quedando n=15

Note que en este caso el número de elementos de la muestra es impar (n=15), por lo tanto, la mediana se ubica
en el valor central; si el conjunto de datos es par, se toman los dos valores centrales y se saca el promedio de los
dos para obtener la mediana.

Moda
Es la medida de tendencia central con mayor frecuencia dentro de un conjunto de datos, en otras palabras, es el
valor que más se repite en una serie de datos. La notación usada para representar la Moda es

Características
* La moda tiene la ventaja que puede aplicarse a datos cualitativos y cuantitativos, es fácil de calcular, no se ve
afectada por los valores extremos del conjunto de datos; sin embargo, pudiera ser que la moda no exista, es
decir, que ningún dato se repite. Por otra parte la moda podría no ser única, o sea conjuntos de datos con más
de una moda, cuando hay dos modas se dice que los datos son bimodales, y en general, si los datos tienen más
de tres modas, se dice que esos datos son multimodales. Si tomamos nuevamente el ejemplo de las edades
tomadas a 16 niños hospitalizados por una crisis de asma.

3,4,4,4,5,5,5,6,7,7,7,8,8,8,8,9

Para reforzar sus conocimientos sobre medidas de tendencia central para datos no agrupados observe los
siguientes video:Video 1 y Video 2

Medidas de dispersión

Las medidas de dispersión corresponden al segundo bloque de medidas descriptivas, éstas indican que tan
dispersos están los datos entre sí; ayudan a determinar aspectos de homogeneidad o heterogeneidad en un
conjunto de datos.
Interpretación:

• Para el Empleado A, el promedio de las deviaciones de su producción semanal con respecto a la media fue de
65 unidades y • Para el Empleado B, el promedio de las deviaciones de su producción semanal con respecto a la
media fue de 7.5 unidades Lo anterior indica que los valores de producción del Empleado B son más cercanos a
la media, indicando menor variación o dispersión, lo cual podría inducirnos a pensar que su producción es más
estable, versus Empleado A que pareciera ser menos estable en sus resultados.

En Conclusión: Considerando el indicador de dispersión, podríamos recomendar al Gerente de Producción que


en caso de empate, el bono se otorgue al empleado con el indicador de dispersión más bajo. Si éste fuera el
criterio para desempatar. La bonificación sería para el Empleado B Con este ejemplo se evidencia la importancia
de las medidas de dispersión ya que complementan el análisis de la información, indicando que tan
homogéneos o heterogéneos son los datos entre si.

Las medidas de dispersión son medidas que indican que tan Cerca o tan lejos están entre si los valores de un
conjunto de datos
Las medidas de dispersión que estudiaremos son de dos
tipos, las cuales se presentan en el mapa mental

Rango: Esta medida de dispersión nos indica la distancia entre el valor máximo y el valor mínimo de la muestra
o de la población. La fórmula para calcular el Rango de un conjunto de datos es la siguiente: Rango = Valor
Máximo – Valor Mínimo Ejemplo: El numero de mediciones reproducidos a continuación muestran el ultimo
digito del numero del seguro social para un grupo de 5 7 5 1 2 4 ---------Rango = 7– 1 = 6

Desviación Media:

Esta medida de dispersión indica el promedio del valor absoluto de las desviaciones de un conjunto de datos
con respecto a su media; la fórmula para calcular la desviación media es la siguiente:

Desviación Estándar o Desviación Típica:

Esta medida de dispersión -al igual que la Desviación Media- indica el promedio de las desviaciones de los
datos con respecto a su media. El símbolo S se utiliza para denotar la desviación típica de la muestra y el
símbolo σ para la Desviación Estándar de la población.

Las fórmulas para calcular la Desviación Estándar de la muestra y la población para datos no agrupados son las
siguientes:

Si observa la diferencia entre las


dos fórmulas anteriores es que
para la calcular S, se utiliza la
media de la muestra y se divide por
n-1, y para calcular σ se utiliza la
media poblacional y se divide por
N.

Ejemplo: Calculemos la desviación estándar del ejercicio


anterior referido

Varianza:
Esta es una medida de dispersión que se obtiene al elevar al cuadrado la desviación estándar, se denota por los
símbolos: s 2 la muestra y σ 2 para la población; las fórmulas para calcular la varianza son las siguientes:

se interpreta sencillamente como el cuadrado del promedio de las desviaciones de los datos con respecto a su
media. En el caso del ejemplo del ultimo digito del seguro social de 5 personas s=2.39 ¿Cuál seria la varianza?
Solución: Varianza:s2=(2.39)2=5.7121

Medidas de Dispersión Relativas :

Estás son medidas de dispersión que se comparan con otra medida que puede ser de tendencia central ,
estudiaremos únicamente el coeficiente de variación, denotado por CV y se expresa en porcentaje, el cual se
calcula de la siguiente manera:

Ejemplo: En el caso del ejemplo del ultimo digito del seguro


social de 5 personas conocemos la media x =3.8 y la desviación
estándar s=2.39

Utilizando el modo estadístico de la calculadora Dependiendo


del tipo de calculadora vean el siguiente Video

INTRODUCCIÓN A LA CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE


CORRELACIÓN LINEAL :

Intuitivamente diremos que dos variables cuantitativas X e Y, se correlacionan (o que se relacionan linealmente)
si:
• A medida los valores de X crecen, los valores de Y también crecen (correlación directa o positiva)*
• A medida los valores de X crecen, los valores de Y decrecen (Correlación Inversa o negativa)*
• Si esto no sucede, en general, se dice que no hay correlación entre las variables

OBS: Para los objetivos de la clase se supone que la tendencia creciente o decreciente tiene una intensidad de
cambio constante, es decir que la tendencia sigue una línea recta NO horizontal, NO vertical.

DIAGRAMA DE DISPERSION O NUBE DE PUNTOS:

Es un gráfico que permite visualizar el grado de relación que pueden tener dos variables:

• Se grafican puntos en el plano cartesiano, que corresponden a los pares de valores observados para las dos
variables
• Para efectos de ver sólo si hay correlación, no importa que variable ubicamos en el eje horizontal, y cual en el
eje vertical
EJEMPLO 1 Considere los siguientes datos sobre la edad en años (X) y la
talla en centímetros (Y) de doce niños o adolecentes en un centro de
salud:

EJEMPLO 1 Al ordenar los valores de la edad, trayendo consigo los valores


correspondientes de la talla, se tiene: Notar que, en general, cuando
crecen los valores de la edad, también crecen los valores de la talla
(correlación positiva)

EJEMPLO 1 Diagrama de dispersión


para los datos de edad y talla de niños
o adolescentes, Notar que el gráfico
muestra una tendencia lineal
creciente (Correlación positiva)

EJEMPLO 2 Los siguientes datos


corresponden al tiempo (X) que tardaron 10 niños para
desarrollar una prueba psicológica sencilla, y el número de
errores cometidos por cada alumno en la prueba (Y):

EJEMPLO 2 Al ordenar los valores del tiempo, trayendo


consigo los valores correspondientes del número de errores,
se tiene:
Notar que, en general, cuando crecen los valores del tiempo
de realización de la prueba, decrecen los valores del número de errores cometidos (correlación negativa)

EJEMPLO 2 Diagrama de dispersión para el tiempo y número


de errores cometidos por los niños en la prueba . Notar que el
gráfico muestra una tendencia lineal decreciente (Correlación
negativa)
COEFICIENTE DE CORRELACIÓN DE PEARSON (r)
Es una medida del grado de asociación o de correlación que existe entre dos variables cuantitativas:
• Puede tomar cualquier valor real en el intervalo entre -1 y 1 inclusive
• Si r = 1, hay una correlación perfecta positiva
• Si el valor de r es cercano a 1 hay una correlación alta, directa o positiva
• Si r = -1, hay una correlación perfecta negativa
• Si el valor de r es cercano a -1 hay una correlación alta, pero inversa o negativa
• Si el valor de r es cercano o igual a 0, se dice que la correlación es baja, o que no hay correlación
CLASIFICACIÓN EMPÍRICA DE NIVELES DE CORRELACIÓN
COEFICIENTE DE PEARSON (r)

COEFICIENTE DE CORRELACIÓN DE PEARSON (r) La


fórmula para calcular el coeficiente de correlación es:

• Para el cálculo se debe crear una columna que contenga los productos de los valores de x e y, y usar el modo
estadístico de una calculadora científica para obtener todos los valores de las sumatorias
• Después se sustituyen en la fórmula los resultados de las sumatorias y se hacen las operaciones para obtener

el valor de r

ECUACIÓN DE REGRESIÓN DE LA MUESTRA

• Si se sospecha que los valores de una variable aleatoria Y, dependen linealmente de los valores de otra
variable X (conocida), se puede encontrar una función lineal que permita predecir los valores de la variable
dependiente Y, a partir de los valores conocidos de la variable independiente X, minimizando los errores de
predicción.

• A la ecuación de recta Y = 𝑎 + 𝑏𝑋 donde a y b se determinan por medio de un procedimiento particular


especial, se le conoce como ecuación de regresión de Y sobre X, y a la recta que representa, se le conoce como
recta de regresión de mínimos cuadrados.
ECUACIÓN DE REGRESIÓN DE LA MUESTRA

Las fórmulas para calcular los coeficiente a y b de la recta de regresión de mínimos cuadrados (Y sobre X) son*:

* OBS: Las formulas cambian si se quisiera predecir X a partir de la variable Y. Para utilizar estas fórmulas es
necesario que se haya identificado como Y a la variable dependiente

ECUACIÓN DE REGRESIÓN DE LA MUESTRA

Conociendo la ecuación de la recta: Y= 83.26 + 5.123X

Que es equivalente a: Talla = 83.26 + 5.123Edad,

Se puede utilizar esta ecuación para predecir un valor de la variable dependiente (Talla), conociendo un valor de
la variable independiente (Edad)

* OBS: Notar que la recta no es útil para predecir la


talla de personas adultas, por ejemplo si la edad es 50 años, el valor de la talla (Y) calculada con la ecuación
sería de 339.41 cms (más de 3 metros). Esto se debe a que las personas a cierta edad dejan de crecer y el
comportamiento creciente de la ecuación ya no es aplicable.

Ejercicio

En el ejemplo 5, se observó que el coeficiente de correlación para las variables: tiempo de realización de la
prueba (X), y número de errores cometidos (Y) del ejemplo 2, fue -0.8357 (Diapositivas 7, 9,18 y 19)
a) Encuentre la ecuación de la recta de regresión de mínimos cuadrados de Y sobre X

b) Grafique la recta de regresión en el plano cartesiano

c) Utilice la ecuación encontrada en a) para estimar el número de errores cometidos por un niño que realiza la
prueba en 8 minutos

Utilizando el modo estadístico de la calculadora / Vea el video aquí

Estadística descriptiva y ejemplos

ESTADÍSTICA : Es una colección de información numérica de un evento y/o una región.

ESTADÍSTICA: Es una colección de información numérica de un evento y/o una región. Ejemplo : Estadística de
un partido de fútbol , Goles , Tiros a puerta , Tarjetas amarillas rojas , Posesión balón , Faltas cometidas.

También podría gustarte