Está en la página 1de 16

Universidad Nacional Experimental del Táchira

Vicerrectorado Académico
Decanato de Docencia
Departamento Matemática y Física

Estadística Descriptiva e Inferencial

Realizado por:
Keilyn Pérez C.I 28256425
Luisana Diaz C.I 2837228
Sección 1
Febrero, 2023
INTRODUCCIÓN

Las definiciones de estadística han tomado muchas formas a lo largo de la historia. Ahora

se puede implementar como una ciencia que nos permite extraer información de los datos y

medir, controlar y comunicar la incertidumbre. La ciencia estadística ha ampliado la gama de

técnicas, procedimientos y teorías para resumir, pero quizás la separación más importante

que se puede hacer de la ciencia estadística es la que distingue los campos de la estadística

detallada e inferencial. El propósito de las estadísticas detalladas es resumir la información

contenida en los datos de la manera más simple y visible posible y obtener límites que

distingan propiedades de grupos de datos (lo que llamamos estadísticas). La tabla de

frecuencias de la que se obtienen estadísticas pertenece al entorno de estadísticas detalladas.


¿Qué distingue a las estadísticas detalladas de la inferencia? Las estadísticas

detalladas funcionan como una población y una muestra (un subconjunto de la

población de la que se seleccionan aleatoriamente los recursos), mientras que las

estadísticas inferenciales funcionan con una muestra que tiene como objetivo sacar

conclusiones sobre la población. Esta práctica se conoce como razonamiento

deductivo y es fundamental enfatizar la diferente naturaleza de los datos. Porque es

un error bastante común sustraer conclusiones de grupos cuyas conclusiones son los

mismos datos. Para explicar este error, es útil explicar la principal diferencia teórica

entre la estadística detallada y la inferencial. La descripción detallada es solo una

descripción de los datos y no supone que tenga más características que las que

pueden explicar las estadísticas anteriores. Dada la incertidumbre, es posible explicar

la población de la muestra, pero debemos aceptar ciertos errores debido a la

naturaleza estocástica de los datos.

Un ejemplo demográfico: si recoges una muestra de 100 alturas de españoles y

obtienes una media de 1,85, podrías aceptarla como una variable aleatoria, por lo que

si tu muestra tiene una media de 1,85, todo es muy posible que la altura media de los

españoles en Estados Unidos se acerca a esa cifra

EL PAPEL DE LA ESTADÍSTICA EN LA INGENIERÍA Y LA CIENCIA

Diariamente se presentan situaciones a resolver, a las que se trata de dar solución

mediante patrones establecidos, a través de los que se ha estandarizado lo que se

tiene que hacer en cada caso. Pero en ocasiones, algunos problemas se salen de

esos parámetros y pudiesen no tener una solución a primera vista; sin embargo, ésta

se puede empezar a dar, si se cuenta con datos estadísticos que se puedan analizar

para determinar las tendencias del problema y buscar mediante algún modelo

probabilístico común, pronosticar su comportamiento.


En la actualidad, afirman Fraga Guerra y Brito Vallina (2006), la Estadística es el

resultado de la unión de dos disciplinas que evolucionan independientemente hasta

confluir en el siglo XIX: la primera es el cálculo de Probabilidades, que nace como

teoría matemática de los juegos al azar y la segunda es la Estadística que estudia la

descripción de datos y tiene raíces más antiguas. La integración de ambas líneas del

pensamiento da lugar a una ciencia que estudia cómo obtener conclusiones de la

investigación empírica mediante el uso de modelos matemáticos.

Por otro lado, en la ciencia La estadística es el nexo común que presentan la

mayoría de las investigaciones científicas en las que interviene el tratamiento de datos

y la interpretación y predicción de los mismos. El estudio estadístico cobra una

especial importancia cuando realizamos investigaciones en campos de la ciencia

médica, donde una mala interpretación de los datos puede provocar consecuencias

nefastas para la población.

Población y muestra

 Población: es el conjunto de elementos que son objeto de estudio estadístico.

 Individuo: cada uno de los elementos de la población. El número total de

individuos de la población se suele representar por la letra N.

Aunque tengan estos nombres, esos elementos pueden referirse a cualquier cosa

y no solo a personas. Por ejemplo, podemos estudiar los televisores que se montan

en una determinada fábrica, la cantidad de vehículos que se desplazan por carretera

un fin de semana de agosto, o los programas de televisión más vistos en una

determinada franja horaria. Cada televisor, vehículo o programa televisivo sería un

individuo de ese estudio.


A veces, es necesario estudiar a todos los individuos de la población. En este caso

se trata de un estudio exhaustivo. Por ejemplo, cuando se realiza el censo de

población de una determinada ciudad. En general, es muy costoso, en tiempo y dinero;

entrevistar a todos los elementos objeto del estudio. Por ello, se selecciona solo una

parte y en este caso se dice que se trata de un estudio muestral.

 Muestra: es una parte de la población con la que realmente se realiza el estudio.

 Tamaño: es el número de elementos del que se compone la muestra y se suele

representar por la letra n.

La elección de la muestra es muy importante para que los resultados que se

extraigan de ella se puedan generalizar a toda la población. Debe haber pocos

individuos, para que no sea muy costosa su realización, pero elegidos de forma que

aparezcan todos los estratos diferentes que forman la población. Por ejemplo, si

quisiéramos saber los gustos culinarios de la juventud actual; no bastaría preguntar a

las puertas de una pizzería, pues hay una parte de jóvenes que prefieren otro tipo de

comidas y no visitan este tipo de establecimientos. Si lo hiciéramos, la muestra

seleccionada no sería representativa de toda la población a estudiar.

Tipos de Variables

En la estadística nos encontramos con dos tipos de variables

 Cualitativas: son aquellas en la que los resultados posibles no son valores

numéricos. Por ejemplo: color del pelo, tipo de ropa preferida, lugar de

veraneo, etc.
 Cuantitativas: aquellas cuyo resultado es un número. A su vez, las hay de

dos tipos:

 Cuantitativas discretas: cuando se toman valores aislados. Por

ejemplo: número de amigos de tu pandilla, número de veces que vas al

cine al mes, número de coches que tiene tu familia.

 Cuantitativas continuas: cuando, entre dos valores cualesquiera,

puede haber valores intermedios. Es decir, se toman todos los valores

de un determinado intervalo. Por ejemplo: peso de las personas, nivel

sobre el mar en que se encuentra tu ciudad, medida del perímetro

torácico.

Niveles de medición

La forma de medir un conjunto de datos se denomina nivel de medición. Los

procedimientos estadísticos correctos dependen de que el investigador esté

familiarizado con los niveles de medición. No todas las operaciones estadísticas se

pueden usar con todos los conjuntos de datos. Los datos se pueden clasificar en

cuatro niveles de medición. Son (de menor a mayor nivel):

 Nivel de escala nominal: Categorías, colores, nombres, etiquetas y alimentos

favoritos junto con las respuestas de sí o no son ejemplos de datos de nivel

nominal. Los datos de escala nominal no están ordenados. Por ejemplo,

intentar clasificar a las personas según su comida favorita no tiene ningún

sentido. Poner la pizza en primer lugar y el sushi en segundo no tiene sentido.

Algunos ejemplos de variables que se pueden medir en una escala nominal


incluyen:

 Género: masculino, femenino


 Color de ojos: azul, verde, marrón
 Color de pelo: Rubio, negro, castaño, gris, otro
 Tipo de sangre: O-, O +, A-, A +, B-, B +, AB-, AB +
 Preferencia política: republicano, demócrata, independiente
 Lugar donde vives: ciudad, suburbios, rural

 Nivel de escala ordinal: Son similares a los datos de la escala nominal, pero

hay una gran diferencia. Los datos de la escala ordinal se pueden ordenar. Un

ejemplo de datos de escala ordinal es una lista de los cinco mejores parques

nacionales de Estados Unidos. Los cinco principales parques nacionales de

Estados Unidos se pueden clasificar del uno al cinco, pero no podemos medir

las diferencias entre los datos.

Algunos ejemplos de variables:

 Satisfacción: Muy insatisfecho, insatisfecho, neutral, satisfecho, muy satisfecho


 Situación socioeconómica: ingresos bajos, ingresos medios, ingresos altos
 Estado del lugar de trabajo: analista de entrada, analista I, analista II, analista
principal
 Grado de dolor: pequeña cantidad de dolor, mediana cantidad de dolor, gran
cantidad de dolor

 Nivel de escala de intervalos: tienen un orden definido, pero hay una

diferencia entre los datos. Las diferencias entre los datos de la escala de

intervalos se pueden medir aunque los datos no tengan un punto de partida.

Las escalas de temperatura como Celsius (C) y Fahrenheit (F) se miden utilizando

la escala de intervalos. En ambas medidas de temperatura, 40° es igual a 100° menos

60°. Las diferencias tienen sentido. Pero los 0 grados no porque, en ambas escalas,

el 0 no es la temperatura mínima absoluta. Existen temperaturas como –10 °F y –15

°C que son más frías que el 0.

 Nivel de escala de cociente: se encargan del problema de las proporciones y

ofrecen más información. Los datos de la escala de cociente son como los
datos de la escala de intervalos, pero tienen un punto 0 y se pueden calcular

cocientes. Por ejemplo, las calificaciones de cuatro exámenes finales de

Estadística de opción múltiple son 80, 68, 20 y 92 (sobre 100 puntos posibles).

Los exámenes son calificados por máquina.

Medidas de tendencia central media, mediana moda.

Las medidas de tendencia central son medidas estadísticas que pretenden resumir

en un solo valor a un conjunto de valores. Representan un centro en torno al cual se

encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más

utilizadas son: media, mediana moda. Las medidas de dispersión en cambio miden el

grado de dispersión de los valores de la variable. Dicho en otros términos las medidas

de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta

forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de

datos entregando información acerca de su posición y su dispersión.

Los procedimientos para obtener las medidas estadísticas difieren levemente

dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran


ordenados en una tabla estadística diremos que se encuentran “agrupados” y si los

datos no están en una tabla hablaremos de datos “no agrupados”.

Media

La media es el valor que se obtiene al sumar todos los datos y dividir el resultado

entre la cantidad de datos. La mediana es el valor que ocupa la posición central

cuando todos los datos están ordenados en orden creciente o decreciente. La moda

es valor que más se repite. Su fórmula es:

Ejemplo:

En un examen calificado del 0 al 10, 3 personas obtuvieron 5 de nota, 5 personas

obtuvieron 4 de nota, y 2 personas obtuvieron 3 de nota. Calcular la nota media:

Mediana

Otra medida de tendencia central es la mediana. La mediana es el valor de la

variable que ocupala posición central, cuando los datos se disponen en orden de

magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la

mediana y el otro 50% tiene valores iguales o superiores a la mediana.Si el número

de observaciones es par, la mediana corresponde al promedio de los dos valores

centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10


EJEMPLO:

Moda

La moda de una distribución se define como el valor de la variable que más se

repite. En un polígono de frecuencia la moda corresponde al valor de la variable que

está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.

EJEMPLO: En un examen calificado del 0 al 10, 3 personas obtuvieron 5 de nota, 5

personas obtuvieron 4 de nota, y 2 personas obtuvieron 3 de nota. Calcular la moda.

Solución: Los datos son los siguientes: 5, 5, 5, 4, 4, 4, 4, 4, 3, 3.

El valor que más se repite es el 4, que aparece 5 veces, por lo tanto, Mo= 4.

Medidas de dispersión

Las medidas de dispersión entregan información sobre la variación de la variable.

Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las

medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación

estándar, Coeficiente de variación.


Rango de variación: Se define como la diferencia entre el mayor valor de la variable y

el menor valor de la variable.

𝑅𝑎𝑛𝑔𝑜 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 = 𝑀á𝑥𝑖𝑚𝑜 − 𝑀í𝑛𝑖𝑚𝑜

La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz

cuadrada, la desviación estándar. La varianza se representa con el símbolo σ² (sigma

cuadrado) para el universo o población y con el símbolo s2 (s cuadrado), cuando se

trata de la muestra. La desviación estándar, que es la raíz cuadrada de la varianza,

se representa por σ (sigma) cuando pertenece al universo o población y por “s”,

cuando pertenece a la muestra. σ² y σ son parámetros, constantes para una población

particular; s2 y s son estadígrafos, valores que cambian de muestra en muestra dentro

de una misma población. La varianza se expresa en unidades de variable al cuadrado

y la desviación estándar simplemente en unidades de variable.

Fórmulas

Donde μ es el promedio dela población.

Donde Ȳ es el promedio de la muestra.


Interpretación de la varianza (válida también para la desviación estándar): un alto

valor de la varianza indica que los datos están alejados del promedio. Es difícil hacer

una interpretación de la varianza teniendo un solo valor de ella. La situación es más

clara si se comparan las varianzas de dos muestras, por ejemplo varianza de la

muestra igual 18 y varianza de la muestra b igual 25. En este caso diremos que los

datos de la muestra b tienen mayor dispersión que los datos de la muestra a. esto

significa que en la muestra a los datos están más cerca del promedio y en cambio en

la muestra b los datos están más alejados del promedio.

Coeficiente de variación

Es una medida de la dispersión relativa de los datos. Se define como la desviación

estándar de la muestra expresada como porcentaje de la media muestral. Es de

particular utilidad para comparar la dispersión entre variables con distintas unidades

de medida. Esto porque el coeficiente de variación, a diferencia de la desviación

estándar, es independiente de la unidad de medida de la variable de estudio.

De posición

Percentiles

Los percentiles son valores de la variable que dividen la distribución en 100 partes

iguales. De este modo si el percentil 80 (P80) es igual a 35 años de edad, significa

que el 80% de los casos tiene edad igual o inferior a 35 años. Su procedimiento de

cálculo es relativamente simple en datos agrupados sin intervalos.


Retomemos el ejemplo de la variable número de partos:

El percentil j (Pj) corresponde al valor de la variable (Yi) cuya frecuencia acumulada

supera inmediatamente al “j” % de los casos (jxn/100).

El percentil 80, en los datos de la tabla, será el valor de la variable cuyo Ni sea

inmediatamente superior a 33,6 ((80x42) /100).

El primer Ni que supera a 33,6 es 39. Por lo tanto al percentil 80 le corresponde el

valor 4. Se dice entonces que el percentil 80 es 4 partos (P80=4). Este resultado

significa que un 80% de las madres estudiadas han tenido 4 partos o menos.

CUARTILES

Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales.

Utilizando cuartiles puede evaluar rápidamente la dispersión y la tendencia central de

un conjunto de datos, que son los pasos iniciales importantes para comprender sus

datos. Debido a que no son afectados por observaciones extremas, la mediana y el

rango intercuartil constituyen una mejor medida de la tendencia central y la dispersión


de conjuntos de datos altamente asimétricos, en comparación con la media y la

desviación estándar.
Conclusión

Las medidas de tendencia central son medidas estadísticas destinadas a resumir

un grupo de valores en un solo costo. En otras palabras, las medidas de dispersión

intentan evaluar qué tan diferentes son los datos entre sí. Así, los dos tipos de medidas

comúnmente utilizados permiten explicar un conjunto de datos proporcionando

información sobre su posición y su varianza. Los métodos para obtener las medidas

estadísticas difieren ligeramente según el tipo de datos.


REFERENCIAS BIBLIOGRÁFICAS Y DOCUMENTALES

 Chao, Lincoln (1999) Estadística para las Ciencias Administrativas. Tercera

Edición. México. Mc Graw-Hill.

 Ríus, F., y otros (s/f) Bioestadística: métodos y aplicaciones. Universidad de

Málaga. España. [Libro en línea] disponible en:

http://www.bioestadistica.uma.es/libro/ [ Consulta: 2014, mayo 16]

 Rivas González, Ernesto (2000) Estadística General. CArac as –Venezuela.

Ediciones de la Biblioteca Central UCV

 Romero Méndez, Ulises (s/f) ¿Cómo se Construye una Tabla de Frecuencias?

[Documento en línea] disponible en: http://bioestadisticaii.es.tl/%BFC%D3MO-

SE-CONSTRUYE-UNA-TABLA-DE-FRECUENCIAS-f-.htm [Consulta: 2014,

junio 07]

 Vitutor.com (s/f) Ejercicio de distribución de frecuencias y diagrama de barras

[Documento en línea] disponible en:

http://www.vitutor.com/estadistica/descriptiva/b_6.html [Consulta: 2014, junio

07

También podría gustarte