Está en la página 1de 27

República Bolivariana de Venezuela

Ministerio del Poder Popular para la Educación Universitaria, Ciencia y


Tecnología
Universidad Nacional Experimental Simón Rodríguez
Cátedra: Estadística II
Sección: A

UNIDAD I:

La estadística y la investigación

Facilitador Participante
Alirio Lopez Paz S. Luis Miguel
C.I. 25.444.053

Caracas, Abril 2022


 Definición de La Estadística y la Investigación

La estadística aporta al investigador, en su fase de formulación del problema, la


definición y clasificación de los tipos de variables aleatorias que conforman la
problematización de la investigación, las técnicas adecuadas para la selección de la
muestra y análisis de los datos recopilados y por ultimo conclusiones.

 La estadística

La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar


información para luego analizarla y extraer de ella conclusiones relevantes. Se puede
decir que es la Ciencia de los Datos y que su principal objetivo es mejorar la
comprensión de los hechos a partir de la información disponible.

El origen de la palabra estadística se suele atribuir al economista Gottfried Achenwall


(prusiano, 1719-1772) que entendía la estadística como “ciencia de las cosas que
pertenecen al Estado”.

Conviene saber que la estadística NO es una rama de las matemáticas. Utiliza


herramientas de las matemáticas del mismo modo que lo hace la física, la ingeniería o
la economía, pero eso no las hace ser parte de las matemáticas. Es cierto que tienen
una relación estrecha, pero la estadística y las matemáticas son disciplinas diferentes.

 La investigación

La investigación se asume como un proceso social que busca dar respuestas a


problemas del conocimiento, los cuales pueden surgir de la actitud reflexiva y crítica de
los sujetos con relación a la praxis o a la teoría existente. Es considerada proceso.

En cuanto ésta se realiza en forma continua y coherente en los diferentes pasos o


momentos y apropia o crea un método para la producción de conocimiento. Es social y
está determinada por las características del contexto y es orientada por sujetos sociales
que en acciones individuales o colectivas intentan dar respuestas a interrogantes
planteados en el campo del saber y del hacer.
 Observación

Una unidad de observación es la unidad descrita por los datos que uno analiza. Por
ejemplo, en un estudio de la demanda de dinero, la unidad de observación podría
elegirse como individuo, con diferentes observaciones (puntos de datos) para un punto
dado en el tiempo que difieren en cuanto a qué individuo se refieren; o la unidad de
observación podría ser el país, con diferentes observaciones que difieren solo con
respecto al país al que se refieren.

Un estudio puede tener una unidad de observación y una unidad de análisis diferentes:
por ejemplo, en la investigación comunitaria, el diseño de la investigación puede
recopilar datos a nivel individual de observación, pero el nivel de análisis puede ser a
nivel de vecindario, extrayendo conclusiones sobre las características del vecindario a
partir de datos recogidos de particulares. En conjunto, la unidad de observación y el
nivel de análisis definen la población de una empresa de investigación.

En líneas generales, la observación es una tarea descriptiva. Es decir, señala


cómo son las cosas y sirve para comprender el estado de la cuestión antes de intervenir
de ninguna manera. Sin embargo, también se entiende la observación como un proceso
activo de selección y clasificación mental, o sea, como una forma de ordenar lo
percibido.

Atendiendo a la fuente se clasifican en directa o indirecta:


 Observación directa: es aquella donde se tienen un contacto directo con los
elementos o caracteres en los cuales se presenta el fenómeno que se pretende
investigar, y los resultados obtenidos se consideran datos estadísticos originales.
Para Ernesto Rivas González (1997) "Investigación directa, es aquella en que el
investigador observa directamente los casos o individuos en los cuales se
produce el fenómeno, entrando en contacto con ellos; sus resultados se
consideran datos estadísticos originales, por esto se llama también a esta
investigación primaria".
Ejemplo; el seguimiento de la población agrícola por año, llevado en una
determinada granja.
 Observación Indirecta: es aquella donde la persona que investiga hace uso de
datos estadísticos ya conocidos en una investigación anterior, o de datos
observados por un tercero (persona o entidad). Con el fin de deducir otros
hechos o fenómenos.
Ejemplo; si un investigador pretende estudiar la producción por años de una
granja avícola, en sus últimos cinco años de producción, tendría que hacer un
seguimiento, a tal fin recurriría a las observaciones que posee la oficina
administrativa de la granja durante estos cinco años, o dirigirse a la oficina de
estadística de la localidad donde está registrada dicha granja. Es de notar que el
investigador se vale de observaciones realizadas por terceros.

Atendiendo a la periodicidad, puede ser continua, periódica o circunstancial:


 Una observación continua; como su nombre lo indica es aquella que se lleva a
cabo de un modo permanente. Ejemplo: la contabilidad comercial, llevada en
cuanto a compras, ventas y otras operaciones que se van registrando a medida
que van produciéndose.
 Una observación periódica; es aquélla que se lleva a cabo a través de períodos
de tiempo constantes. Estos períodos de tiempos pueden ser semanas,
trimestres, semestres, años, etc. Lo que debemos destacar es que los períodos
de tiempo tomados como unidad deben tomarse constantes en los posible.
Ejemplo; el registro llevado por la Oficinas de Control de Estudios, en cuanto a la
inscripción de los estudiantes por semestre.
 La observación circunstancial, es aquella que se efectúa en forma ocasional o
esporádica, esta observación hecha más por una necesidad momentánea, que
de carácter regular o permanente. Ejemplo; la obtención de números de aulas
utilizadas y no utilizadas en los colegios pertenecientes al municipio Libertador.

Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta:


 Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad
de los elementos de la población se habla de una observación exhaustiva.
 Observación Parcial. Dados que las poblaciones en general son grandes, la
observación de todos sus elementos se ve imposibilitada. La solución para
superar este inconveniente es observar una parte de esta población.
 Observación Mixta. En este tipo de observación se combinan adecuadamente la
observación exhaustiva con la observación parcial. Por lo general, este tipo de
observaciones se lleva a cabo de tal manera que los caracteres que se
consideran básicos se observan exhaustivamente y los otros mediante una
muestra; o bien cuando la población es muy grande, parte de ella se observa
parcialmente.

 Variables

CUANTITATIVA: Una variable cuantitativa es aquella variable estadística que, a


diferencia de la cualitativa, puede expresarse a través de cifras. Por esta razón, puede
analizarse con métodos estadísticos.

CUALITATIVA: La variable cualitativa es aquella variable estadística que expresa una


cualidad, o característica, del objeto o individuo en cuestión.

DISCRETA: Diremos que una variable aleatoria es discreta cuando la función de


distribución asociada a ella sea una función discreta.

CONTINUA: Diremos que una variable aleatoria es continua, siempre y cuando la


función de distribución que se encuentra asociada a ella sea continua.

INDEPENDIENTE: La variable independiente es aquella que determina el valor de la


variable dependiente. Esto, en un modelo o estudio estadístico.

DEPENDIENTE: La variable dependiente es aquella que, dentro de un modelo


económico o estadístico, es explicada por otras variables a las que denominamos
independiente.
 Propiedades de los números importantes para la medición

Las propiedades del sistema numérico asociadas con las escalas de medición son la
identidad, magnitud, igual intervalo y cero absoluto (Stevens, 1957):
1-Identidad: cada número tiene un significado particular.
2-Magnitud: los números tienen un orden inherente ascendente o descendente.
3-Intervalos iguales: las diferencias entre números en cualquier punto de la escala son
las mismas (la diferencia entre 10 y 20 es la misma que entre 100 y 110).
4-Cero absoluto: el punto cero en la escala de medición representa la ausencia de la
propiedad que se estudia.

 Niveles de Medición.

El primer paso en el análisis de datos es simplemente entender lo que estos significan.


Esto se facilita clasificando cada variable según su nivel de medición. El nivel de
medición se refiere a la relación entre los valores que se asignan a los atributos de una
variable.

Una variable es cualquier cantidad que puede ser medida y cuyo valor varía a través de
la población. Por ejemplo, si consideramos una población de estudiantes, la
nacionalidad del estudiante, género, calificaciones, etc. son todas las variables
definidas, y su valor correspondiente diferirá para cada estudiante.

Si queremos calcular el salario promedio de los ciudadanos de un país, podemos salir y


registrar el salario de todas y cada una de las personas para calcular el promedio o
elegir un muestreo aleatorio de toda la población y calcular el salario promedio para esa
muestra, y luego usar las pruebas estadísticas para obtener conclusiones para una
población más amplia.

El tipo de prueba estadística que puede utilizarse para llegar a una conclusión sobre la
población en general depende del nivel de medición de la variable considerada. El nivel
de medición de una variable no es otra cosa que la naturaleza matemática de una
variable o cómo se mide una variable.
Una característica esencial de la medición es la dependencia que tiene de la
posibilidad de variación. La validez y la confiabilidad de la medición de una variable
depende de las decisiones que se tomen para operacionalizarla y lograr una adecuada
comprensión del concepto evitando imprecisiones y ambigüedad, por en caso contrario,
la variable corre el riesgo inherente de ser invalidada debido a que no produce
información confiable.

 Medición Nominal. En este nivel de medición se establecen categorías


distintivas que no implican un orden especifico. Por ejemplo, si la unidad de
análisis es un grupo de personas, para clasificarlas se puede establecer la
categoría sexo con dos niveles, masculino (M) y femenino (F), los respondientes
solo tienen que señalar su género, no se requiere de un orden real.
Así, si se asignan números a estos niveles solo sirven para identificación y puede
ser indistinto: 1= M; 2= F o bien, se pueden invertir los números sin que afecte la
medición: 1= F y 2= M. En resumen, en la escala nominal se asignan números a
eventos con el propósito de identificarlos. No existe ningún referente cuantitativo.
Sirve para nombrar las unidades de análisis en una investigación. La relación
lógica que se expresa es: A ≠ B (A es diferente de B).
 Medición Ordinal. Se establecen categorías con dos o más niveles que implican
un orden inherente entre sí. La escala de medición ordinal es cuantitativa porque
permite ordenar a los eventos en función de la mayor o menor posesión de un
atributo o característica. Por ejemplo, en las instituciones escolares de nivel
básico suelen formar por estatura a los estudiantes, se desarrolla un orden
cuantitativo, pero no suministra medidas de los sujetos. La relación lógica que
expresa esta escala es A > B (A es mayor que B). Clasificar a un grupo de
personas por la clase social a la que pertenecen implica un orden prescrito que
va de lo más alto a lo más bajo. Estas escalas admiten la asignación de números
en función de un orden prescrito.
Las formas más comunes de variables ordinales son ítems (reactivos)
actitudinales estableciendo una serie de niveles que expresan una actitud de
acuerdo o desacuerdo con respecto a algún referente. Por ejemplo, ante el ítem:
La economía venezolana debe dolarizarse, el respondiente puede marcar su
respuesta de acuerdo a las siguientes alternativas:

___ Totalmente de acuerdo


___ De acuerdo
___ Indiferente
___ En desacuerdo
___ Totalmente en desacuerdo

Las anteriores alternativas de respuesta pueden codificarse con números que


van del uno al cinco que sugieren un orden preestablecido, pero no implican una
distancia entre un número y otro. Las escalas de actitudes son ordinales, pero
son tratadas como variables continuas (Therese L. Baker, 1997).

 Medición de Intervalo. La medición de intervalo posee las características de la


medición nominal y ordinal. Establece la distancia entre una medida y otra. La
escala de intervalo se aplica a variables continuas, pero carece de un punto cero
absoluto. El ejemplo más representativo de este tipo de medición es un
termómetro, cuando registra cero grados centígrados de temperatura indica el
nivel de congelación del agua y cuando registra 100 grados centígrados indica el
nivel de ebullición, el punto cero es arbitrario no real, lo que significa que en este
punto no hay ausencia de temperatura.
Una persona que en un examen de matemáticas que obtiene una puntuación de
cero no significa que carezca de conocimientos, el punto cero es arbitrario
porque sigue existiendo la característica medida.
 Medición de Razón. Una escala de medición de razón incluye las características
de los tres anteriores niveles de medición anteriores (nominal, ordinal e
intervalo). Determina la distancia exacta entre los intervalos de una categoría.
Adicionalmente tiene un punto cero absoluto, es decir, en el punto cero no existe
la característica o atributo que se mide. Las variables de ingreso, edad, número
de hijos, etc. son ejemplos de este tipo de escala. El nivel de medición de razón
se aplica tanto a variables continuas como discretas.

 Escalas de Medición.

Existen diferentes tipos de escalas, dependiendo de la naturaleza de las variables que


se estudian o de la precisión que requiera la organización de los datos. Normalmente se
consideran cuatro tipos de escalas de medida Otra aproximación es que los datos
pueden definirse también por la escala usada para la medición de las variables,
distinguiéndose cuatro de ellas: nominales, ordinales, de intervalo y de razón. Los
cuatro niveles de medida determinan qué operaciones son posibles de usar y por
consiguiente las pruebas estadísticas que son permisibles en cada nivel. Todas las
escalas tienen algunas propiedades formales que proporcionan definiciones de las
características de la escala con mayor exactitud que las que puede asignarse en
términos verbales. Estas propiedades pueden expresarse más abstractamente
especificando las operaciones aritméticas posibles y las relaciones entre los objetos
que han sido clasificados.

1) La escala nominal. Comprende los datos nominales que no tienen un orden: los
datos dicotómicos solo pueden tomar dos valores posibles (como vivo o muerto). Es el
nivel de medición más débil. Los números u otros símbolos se usan simplemente para
clasificar un objeto, persona o característica. Ejemplos: número de ficha clínica, de
teléfono, de permiso de circulación, números en las camisetas de un equipo de fútbol.
En una escala nominal, la operación consiste en dividir una clase determinada en un
conjunto de subclases mutuamente excluyentes. La única relación envuelta es la de
equivalencia, simbolizada por el signo =, o su ausencia, por el símbolo ≠.

En las escalas nominales la única operación admisible es la de transformación “uno a


uno” o “simétrica”. Esto implica que los símbolos en la escala pueden ser
intercambiados siempre que esto sea hecho consistente y completamente. Las únicas
estadísticas descriptivas admisibles son aquellas que no cambiarían con una
transformación de ese tipo: el modo y las frecuencias. Bajo ciertas condiciones se
pueden probar hipótesis relacionadas con la distribución de casos en las categorías
usando un chi cuadrado o una prueba exacta de Fisher. La prueba de asociación más
común para datos nominales es el coeficiente C de contingencia.

2) Escala ordinal o de rangos. Comprende los datos ordinales con un mínimo de tres
valores posibles y con un número total limitado. Los objetos en una categoría no sólo
son diferentes de los objetos en otras categorías de esa misma escala sino que tienen
alguna relación con ellos. Relaciones típicas son: mayor, más alto, más difícil, más
enfermo, menos grave. Su significado específico depende de la naturaleza de la
relación que define esa escala. Ejemplos: escalas de clase socioeconómica, grados de
un linfoma, grados de Mallampati, clasificación ASA. Muchas pruebas o escalas de
evaluación resultan en puntajes que tienen la fortaleza de rangos: el puntaje del Mini
Mental State, la escala de Glasgow o el puntaje APACHE son buenos ejemplos. Aun
cuando estos puntajes pueden parecer más precisos que los rangos, generalmente no
cumplen con los requisitos de escalas de mayor nivel y deben ser consideradas como
ordinales.
La diferencia fundamental entre una escala nominal y la ordinal estriba en que ésta
incorpora la relación de “mayor que” (>) o “menor que” (<) a la de equivalencia (=).
Cualquier transformación que no altere el orden de las clases es permisible. La mejor
descripción de la tendencia central es la mediana ya que ésta no se ve afectada por
cambios de puntajes, en tanto no se altere el número de cuentas sobre o bajo ella. Con
la escala ordinal es posible usar todo el rango de pruebas estadísticas conocidas como
“estadísticas ordinales o de rango” o “no paramétricas”. La única presunción de estas
pruebas es que los puntajes deben ser sacados de una distribución continua.

Las escalas visuales análogas (EVA) pertenecen estrictamente a este grupo y en rigor
debieran ser analizadas con pruebas no paramétricas. Sin embargo, algunos autores
han aducido que el error introducido por un análisis paramétrico es de escasa magnitud
y que no altera las conclusiones, por lo que bien puede aprovecharse la mayor potencia
de las pruebas paramétricas, práctica ampliamente aceptada en la literatura
anestesiológica.

3) La escala de intervalo. Comprende los datos continuos o datos discretos que


contienen un elevado número de posibles valores. Las distancias entre cualquier par de
números de la escala tienen una dimensión conocida y constante por lo que es posible
conocer con certeza la magnitud de los intervalos. Se caracteriza por tener una unidad
común de medida que asigna un número real a todos los pares de objetos en el
conjunto ordenado. Aun cuando el punto cero y la unidad de medida son arbitrarios, la
razón entre dos intervalos es independiente de esa unidad y de ese punto.

La medición de temperatura se hace en escala de intervalo. Las escalas Fahrenheit y


Celsius tienen cada una su unidad arbitraria, los grados, y también un cero arbitrario.
Ambas escalas, sin embargo, tienen la misma cantidad y tipo de información pues están
linealmente relacionadas; la medida en una escala puede transformarse a la
equivalente en la otra mediante una transformación lineal.

Las operaciones y relaciones de una escala de intervalo son similares a la estructura de


la aritmética por lo que pueden utilizarse todas las operaciones. En una escala de
intervalo se puede reconocer la equivalencia (=) y el orden (>) y, además, las razones
de cada intervalo. Las pruebas paramétricas pueden y deben usarse si se cumplen las
otras presunciones puesto que las pruebas no paramétricas restan potencia al análisis
al no usar toda la información contenida en una escala de intervalo.
4) Escala de razón. Además de todos los atributos de una escala de intervalos, ésta
tiene en su origen un cero verdadero y en ella la razón entre dos puntos de la escala es
independiente de la unidad de medida. La masa, el peso, la distancia, el tiempo se
miden en esta escala. Por ejemplo, si medimos el peso de dos objetos en gramos o en
onzas, la razón es constante, cosa que no sucede si se mide la temperatura de un
cuerpo en grados Celsius o Fahrenheit. Este tipo de escalas sólo se obtienen cuando
las siguientes cuatro relaciones son operacionalmente posibles: equivalencia, mayor
que, razón conocida entre dos intervalos y razón conocida entre dos valores escalares
cualesquiera. Los números asociados con esta escala son verdaderos con un cero
también verdadero. Cualquier prueba estadística puede ser usada, incluyendo medidas
como la media geométrica y el coeficiente de variación que requieren de un punto cero
verdadero.

El orden de las escalas indica la cantidad relativa de información que contiene cada una
de las ellas. Las mediciones de un nivel de información concreto pueden transformarse
o reescalarse a un nivel inferior, pero no es posible reescalar las variables a un nivel
superior al que se midieron realmente. Al reescalar a un nivel inferior se pierde
información, hecho que tiende a aumentar el error tipo II, de no encontrar una diferencia
cuando en realidad existe, si todo lo demás se mantiene igual. En otras palabras,
reescalar a un nivel inferior reduce la potencia estadística por lo que debe evitarse; por
ejemplo, reducir la edad a dos o más grupos, transformando una variable continua en
una categórica.
UNIDAD II
Presentación y sistematización de Datos
Presentación y sistematización de Datos

La presentación de datos estadísticos constituye en sus diferentes modalidades uno de


los aspectos de más uso en la estadística descriptiva. A partir podemos visualizar a
través de los diferentes medios escritos y televisivos de comunicación masiva la
presentación de los datos estadísticos sobre el comportamiento de las principales
variables económicas y sociales, nacionales e internacionales.

1-Presentación escrita: Esta forma de presentación de informaciones se usa cuando


una serie de datos incluye pocos valores, por lo cual resulta mas apropiada la palabra
escrita como forma de escribir el comportamiento de los datos; mediante la forma
escrita, se resalta la importancia de las informaciones principales.

2-Presentación tabular: Cuando los datos estadísticos se presentan a través de un


conjunto de filas y de columnas que responden a un ordenamiento lógico; es de gran
eso e importancia para el uso e importancia para el usuario ya que constituye la forma
más exacta de presentar las informaciones

3-Presentación gráfica: Proporciona al lector o usuario mayor rapidez en la


comprensión de los datos, una gráfica es una expresión artística usada para
representar un conjunto de datos

Construcción y análisis de tablas de frecuencia

Las tablas de frecuencias son recuadros en los que se señalan los datos estadísticos
de manera organizada con la frecuencia de cada uno de los valores que puede tomar la
variable a estudiar. Se muestran en columnas y filas con el propósito de analizar,
sintetizar e ilustrar la información procedente de los datos recopilados de una de las
investigaciones o estudios determinados

Las frecuencias son el número de períodos que se repite un valor determinado de una
variable. Por ejemplo; si se mide la edad de 6 personas y se obtiene 22, 21, 30, 24, 22 y
30 se tiene que la frecuencia de 22 es 2, es decir, dos personas de veintidós años. 21
tendrá frecuencia 1, 24 frecuencia 1 y 30 frecuencia 2.

Los tipos de frecuencia pueden ser, Frecuencia Absoluta, Frecuencia Acumulada,


Frecuencia Relativa y Frecuencia Relativa Acumulada, el siguiente cuadro explica cada
una de ellas.
Ejemplo: En vista de la alta incidencia de enfermedades en los niños de la comunidad
se está planteando un régimen de vacunación para infantes con edades comprendidas
entre 0 y 5 años, se realizó una visita casa por casa y se indagó la edad de los niños
que residen en el domicilio obteniéndose los siguientes resultados:

Se hallaron 15 niños de 0 años, 21 de un año, 11 de dos años, 5 de tres años, 3 de


cuatro años y 5 de cinco años.

 De ellos 47 tienen entre cero y dos años.

 Los niños de dos años constituyen 18,33% de los observados

 Los niños entre 0 años y 2 años constituyen 78,33% de los niños observados.

 Se observó un total de 60 niños en la comunidad.


Construcción y Análisis de graficas
Los datos numéricos obtenidos en un estudio estadístico pueden presentarse de forma
visual a través de gráficas estadísticas, lo que hace que sean más fácilmente
comprensibles.

Las Gráficas más comunes son las siguientes:

- Diagrama de barras

Ejemplo: Hemos encuestado a 50 estudiantes del colegio sobre su deporte favorito. Los
resultados los hemos organizado en esta tabla de frecuencias.

El proceso para construir un diagrama de barras es muy sencillo.

Se construyen dos ejes.

En el eje horizontal, o eje de abscisas, se representan los datos o modalidades


obtenidos. En nuestro caso: baloncesto, fútbol, balonmano, etc.

En el eje vertical, eje de ordenadas, se representan con números las frecuencias de


cada dato o modalidad.
Sobre el eje horizontal se levantan barras o rectángulos de igual base hasta la altura del
valor numérico de la frecuencia de cada modalidad. En nuestro caso: baloncesto hasta
12, fútbol hasta 8, balonmano hasta 10, etc.

Diagrama de líneas (polígono de frecuencias): El proceso es muy similar al empleado


en los gráficos de barras:

En el eje horizontal, abscisas, se representan los datos.

En el eje vertical, ordenadas, se representan los valores de cada dato si la variable es


cuantitativa o la frecuencia de cada dato si la variable es cualitativa.

Se trazan puntos o marcas que representan esos datos y se unen con segmentos.

En este ejemplo hemos tomado las temperaturas mínimas durante una semana de la
estación meteorológica del colegio y lo hemos representado como una línea poligonal
que nos indica muy bien las variaciones.
UNIDAD III
Reducción de las observaciones
Medidas de posición

Las medidas de posición son valores que permiten dividir el conjunto de datos en partes
porcentuales iguales y se usan para clasificar una observación dentro de una población
o muestra. Las medidas de posición más usuales son los cuartiles, los deciles y los
percentiles.

Cuartiles

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales. % de los datos. Se dividen por 4 Como se
calculan? dividen el conjunto en cuatro partes iguales. Por ejemplo, si el conjunto de
datos es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el
(N+1)/4=(20+1)/4=21/4=5,25.

Deciles

En estadística descriptiva, un decil es cualquiera de los nueve valores que dividen a un


grupo de datos ordenados en diez partes iguales, de manera que cada parte
representa1/10 de la muestra o población. Como se calculan? Son aquellas variables
que dividen a una distribución en 10 partes iguales, por lo tanto hay 9 deciles. El decil 5
(D5) coincide con la mediana y con el segundo cuartil, es decir D5= Me=Q2 El cálculo
de los Deciles es similar al de los Cuartiles y Percentiles.
Percentiles

El percentil es una medida de posición usada en estadística que indica, una vez
ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se
encuentra un porcentaje dado de observaciones en un grupo. Como se resuelve?
El percentil es una medida de posición no central. Por ejemplo, si el conjunto tiene 199
elementos, (N+1)·i/100=200·50/100=100, por lo que el percentil 50 será P50=X100.

Ejemplo 1: Calcular el cuartil 1 (Q1) de las siguientes muestras de notas en


matemáticas de un aula (notas de 0 a 20): 16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17,
9, 10, 14

- Ordenamos de menor a mayor: 1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18,
20
- N = número de muestras = 16 muestras
- x = (N · i) / 4 = (16 · 1) / 4 = 4
- Como x = 4 es un número sin decimales, entonces el cuartil 1 es el valor de la
muestra que ocupa la posición 4
- Q1 (cuartil 1) = 9

Ejemplo 2: En un examen muy difícil de universidad, se obliga al profesor a aprobar al


menos al 25%. Calcular la nota a partir de la cual está obligado a aprobar siendo las
notas (notas de 0 a 20): 0, 4, 1, 0, 0, 7, 2, 1, 4, 0, 3, 9, 2, 0, 0, 4, 8, 1, 0, 9, 4

- Necesitamos calcular el cuartil 3 (Q3) ya que nos interesa calcular el valor a


partir del cual solo hay un 25% con mejores notas
- Ordenamos de menor a mayor: 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4, 4, 7, 8, 9,
9
- N = número de muestras = 21 muestras
- x = (N · i) / 4 = (21· 3) / 4 = 15,75
- Como x = 15,75 es un número con decimales, entonces el cuartil 3 es la media
de los valores que ocupan la posición 15 y 16
- Q3 (cuartil 3) = (4 + 4) / 2 = 4

Medidas de tendencia central

Las medidas de tendencia central son parámetros estadísticos que informan sobre el
centro de la distribución de la muestra o población estadística. Son medidas
estadísticas que pretenden resumir en un solo valor a un conjunto de valores.
Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central más utilizadas son

 Media: La media es el valor promedio de un conjunto de datos numéricos,


calculada como la suma del conjunto de valores dividida entre el número total de
valores. A continuación, se muestra la fórmula de la media aritmética:

Ejemplo: Encuentre la media del conjunto {2, 5, 5, 6, 8, 8, 9, 11}.


Hay 8 números en el conjunto. Súmelos, y luego divida entre 8.

= 6.75
Así, la media es 6.75.

 Mediana: La mediana es un estadístico de posición central que parte la


distribución en dos, es decir, deja la misma cantidad de valores a un lado que a
otro. Las fórmulas propuestas no nos darán el valor de la mediana, lo que nos
darán será la posición en la que está dentro del conjunto de datos. Las fórmulas
que indica la posición de la mediana en la serie son las siguientes:
- Cuando el número de observaciones es par:
Mediana = (n+1) / 2 → Media de las posiciones observaciones
- Cuando el número de observaciones es impar:
Mediana = (n+1) / 2 → Valor de la observación
Ejemplo: Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.
Primero, arregle los números en orden ascendente.
{3, 5, 8, 10, 24, 36, 79, 255}
Hay 8 números en el conjunto -- un número par. Así, encuentre el promedio
de los dos números medios, 10 y 24.
(10 + 24)/2 = 34/2 = 17
Así, la mediana es 17.

 Moda: La moda es el valor que más se repite en una muestra estadística o


población. No tiene fórmula en sí mismo. Lo que habría que realizar es la suma
de las repeticiones de cada valor.
Por ejemplo, ¿cuál es la moda de la siguiente tabla de salarios?

Trabajador Salario
1 €. 1.236
2 €. 1.236
3 €. 859
4 €. 486
5 €. 1.536
6 €. 1.536
7 €. 1.621
8 €. 978
9 €. 1.236
10 €. 768

La moda sería 1.236€. Si vemos los salarios de los 10 trabajadores, veríamos


que 1.236€ se repite en tres ocasiones.
UNIDAD IV
Reducción de las observaciones
Medidas de variabilidad

Son intervalos que muestran la difusión de los datos en un nivel de medición.


Una medida de dispersión o variabilidad nos fija el grado de aproximación o
distanciamiento de los valores de una distribución frente a su promedio de localización,
mostrando por medio de un número si las diferentes puntuaciones de una variable
están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la
variabilidad, y cuanto menor sea, más homogénea será a la media. Cuando es 0 quiere
decir que todos los datos son iguales.

 Rango: El rango es un valor numérico que indica la diferencia entre el valor


máximo y el mínimo de una población o muestra estadística. Su fórmula es:
R = Máx x – Mín x
Donde:
R → Es el rango.
Máx → Es el valor máximo de la muestra o población.
Mín → Es el valor mínimo de la muestra o población estadística.
x → Es la variable sobre la que se pretende calcular esta medida.

Ejemplo: Encontrar el rango y el rango medio del siguiente conjunto de números:


62, 88, 20, 145, 37, 105, 93, 22.
Como los datos no están ordenados de menor a mayor, identifica los valores
mínimo y máximo.
- valor mínimo: 20
- valor máximo: 145

Resta el valor mínimo del valor máximo para encontrar el rango.

Rango: 145 – 20 = 125


 Varianza: La varianza es una medida de dispersión que representa la
variabilidad de una serie de datos respecto a su media. Formalmente se calcula
como la suma de los residuos al cuadrado divididos entre el total de
observaciones. Su fórmula es la siguiente:

X → Variable sobre la que se pretenden calcular la varianza


xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
N → Número de observaciones.
x̄ → Es la media de la variable X.

Ejemplo: Calcular la varianza de las siguientes puntuaciones de un jugador de


baloncesto en los últimos partidos:

- Puntuaciones: 18, 20, 20, 22, 20, 20

Calculamos la media aritmética ():

- Número de valores: 6

Media Aritmética = (18 + 20 + 20 + 22 + 20 + 20) / 6 = 120 / 6 = 20

Calculamos la Varianza:

Varianza σ2 = [(18-20)2 + (20-20)2 + (20-20)2 + (22-20)2 + (20-20)2 + (20-20)2] /


6 = 16 / 6 = 8 /3 = 2,67

 Desviación típica: La desviación típica es otra medida que ofrece información


de la dispersión respecto a la media. Su cálculo es exactamente el mismo que la
varianza, pero realizando la raíz cuadrada de su resultado. Es decir, la
desviación típica es la raíz cuadrada de la varianza.
X → Variable sobre la que se pretenden calcular la varianza
xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
N → Número de observaciones.
x̄ → Es la media de la variable X.
A continuación, vamos a ver varios ejemplos del cálculo de la desviación típica:

- Calcular la desviación típica de las siguientes notas de un alumno en los


últimos exámenes:
 Valores de las notas: 9, 10, 10, 11, 10, 10

Calculamos la media aritmética (x̄ ):

 Número de valores: 6

Media Aritmética = (9 + 10 + 10 + 11 + 10 + 10) / 6 = 60 / 6 = 10

Calculamos la Desviación Típica:

σ2 = [(9-10)2 + (10-10)2 + (10-10)2 + (11-10)2 + (10-10)2 + (10-10)2] / 6 = 2 / 6 =


1 /3 = 0,33

Desviación típica: σ = √ 0,33 = 0,58

 Calcular la desviación típica de las siguientes notas de otro alumno diferente


en los últimos exámenes:
- Valores de las notas: 2, 16, 12, 13, 20, 15

Calculamos la media aritmética (x̄ ):

- Número de valores: 6

Media Aritmética = (5 + 16 + 12 + 13 + 20 + 12) / 6 = 78 / 6 = 13


Calculamos la Desviación Típica:

σ2 = [(5-13)2 + (16-13)2 + (12-13)2 + (13-13)2 + (20-13)2 + (15-13)2] / 6 = (64 +


9 + 1 + 0 + 49) / 6 = 20,5

Desviación típica: σ = √ 20,5 = 4,5

Como conclusión tenemos que el segundo alumno saca mejores notas (media
aritmética = 13 respecto a 10 del primero) pero sin embargo es menos constante
ya que su desviación típica es mucho más alta (vemos como saca notas muy
diferentes).

Desviación media

La desviación media de un conjunto de datos, es la media aritmética de los


valores absolutos de lo que se desvía cada valor respecto a la media aritmética.

La fórmula de la desviación media es la siguiente:

Donde:
x̄ : media aritmética de los datos.
x1, x2, x3, …, xn: datos.
xi: cada uno de los datos.
n: número de datos.
Ejemplo: Calcular la desviación media de los siguientes datos: 3, 5, 8, 6, 2, 4, 7 y 5.

Sumamos los datos y calculamos su media aritmética, teniendo en cuenta que son 8
datos (n = 8).

Viene el cálculo de la media aritmética

Colocaremos los valores de xi – μ y luego de |xi – μ|

Ahora sí, calculamos la desviación media con los valores obtenidos en la tabla:

El valor de la desviación media es de 1,5.

La desviación media siempre queda expresada en las mismas unidades que los datos
originales, por ejemplo, si los datos originales están expresados en kilogramos, pues la
desviación media también quedará expresada en kilogramos.

También podría gustarte