Introducción a la Estadística Descriptiva

UNIVERSIDAD TECNOLÓGICA DE CAMPECHE
DIRECCIÓN DE MECATRÓNICA.
Alumno:
Jesús Cabrera López
Materia:
Probabilidad y Estadística.
Docente:
Yuri Diana Junco Jiménez.
Unidad. I.
Estadística Descriptiva
Nombre de la actividad:
Ensayo de la unidad 1.
Grado: 3 Grupo: “E”
Para obtener el título de:

técnico superior universitario en mecatrónica
área: automatización
Generación:
2019-2021
Viernes, 29 de mayo del 2020

Introducción a la estadística
El término Estadística tiene dos acepciones fundamentales. Por un lado, la
Estadística como ciencia o método científico y por otro lado la estadística o
estadísticas como conjunto o colecciones de datos. Este segundo concepto es
muy usado hoy en día para referirnos a resultados ya elaborados en un estudio en
el que se empleó la Estadística como método. Dado que la Estadística es una
disciplina muy amplia, existen diferentes definiciones de la misma según el
enfoque en el que se plantee.
La Estadística constituye una poderosa herramienta para generar conocimiento y
ha experimentado un vigoroso desarrollo desde sus orígenes hasta nuestros días.
Actualmente, se aplica en todas las áreas del saber y, de manera determinante, en
las Ciencias Sociales. Por ejemplo, en Administración de Empresas se utiliza la
estadística para evaluar la aceptación de un producto antes de comercializarlo; en
Economía, para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores; en Sociología para realizar investigación
social estudiando los perfiles y dinámica de colectivos sociales; en el ámbito de las
Relaciones Laborales elaborando análisis de salarios.
Esta se clasifica en dos partes una es la estadística descriptiva dicta la realización
de estudios sobre la población completa, observando una característica de la
misma y calculando unos parámetros que den información glo9bal de toda la
población. Y la estadística indiferencia es loa que realiza el estudio descriptivo
sobre un subconjunto de la población llamado muestra y, posteriormente, extiende
los resultados obtenidos a toda la población. La población es el conjunto de
elementos, individuos o entes sujetos a estudios y de los cuales queremos obtener
un resultado.
Cuando se realiza un estudio de una determinada población, se observa una
característica o propiedad de sus elementos o individuos. Cada una de estas
características estudiadas se le llama variable estadística del cual estaríamos
hablando como el numero de hermanos, la estatura, peso, edad, profesión, etc.
Las variables cualitativas es aquella característica que no podemos expresar con
números y hay que expresarla con palabras. Por ejemplo: un lugar de residencia,
comida favorita, profesión que le gusta etc. Dentro de esta se puede ver las
ordenables y no ordenables, las ordenables son aquellas que sugieren una
ordenación, por ejemplo: graduación militar, el nivel de estudios. Y las no
ordenables son aquellas que solo admiten una mera ordenación alfabética, pero
no establece orden por su naturaleza, por ejemplo: el color de cabello, sexo,
estado civil, etc.
Las variables cuantitativas son aquellas que se caracterizan por que pueden
expresarse con números. Por ejemplo: el numero de hermanos, la estatura,
número de alumnos de una institución, dentro de las variables podemos distinguir
dos tipos: las variables cuantitativas discreta; que es aquella variable que puede
tomar únicamente un número finito de valores, por ejemplo: el numero de
hermanos. Variables cuantitativas continua; es aquella variable que puede tomar

cualquier valor dentro de un intervalo real, por ejemplo: la estatura.
Población, muestra y muestreo

Población. Es el conjunto de personas u objetos de los que se desea conocer algo
en una investigación. "El universo o población puede estar constituido por
personas, animales, registros médicos, los nacimientos, las muestras de
laboratorio, los accidentes viales entre otros".
La población se puede clasificar de la siguiente manera según la cantidad de
individuos que la conforme:
Población finita: es aquella que se puede contar y se pueden estudiar con mayor
facilidad a sus integrantes. Por ejemplo, la cantidad de personas inscritas en un
gimnasio.
Población infinita: son inmensas poblaciones donde se hace muy difícil contabilizar
a sus integrantes, por lo que suele tomarse en cuenta solo una porción de ella a la
hora de realizar un estudio, seleccionando así una muestra. Por ejemplo, la
cantidad de granos de arena en una playa.
Población real: son grupos de integrantes tangibles. Por ejemplo, la cantidad de
animales en un zoológico.
Población hipotética: son poblaciones posibles que pueden ser estudiadas ante
una eventualidad. Por ejemplo, la cantidad de nacimientos de bebés prematuros.
Muestra. Es un subconjunto o parte del universo o población en que se llevará a
cabo la investigación. Hay procedimientos para obtener la cantidad de los
componentes de la muestra como fórmulas, lógica y otros que se verá más
adelante. La muestra es una parte representativa de la población.
Estos estudios que se realizan a las muestras sirven para crear normas o
directrices que permitirán tomar acciones o simplemente conocer más a la
población estudiada.
Muestreo. Es el método utilizado para seleccionar a los componentes de la
muestra del total de la población. "Consiste en un conjunto de reglas,
procedimientos y criterios mediante los cuales se selecciona un conjunto de
elementos de una población que representan lo que sucede en toda esa
población".
Muestreo aleatorio simple: son los elementos se eligen de una lista al azar.
Funciona más eficazmente cuando el universo es reducido y homogéneo.
Muestreo sistemático: son el primer elemento que se elige al azar y luego se
escogen a intervalos constantes los elementos restantes.
Muestreo estratificado: se realiza dividiendo a la población en partes o estratos

que respondan a características establecidas y luego se eligen aleatoriamente los
individuos que se van a estudiar.
Muestreo por conglomerado: en la que la población se divide en grupos
heterogéneos y éstos a su vez se subdividen en grupos homogéneos con
características comunes para ser estudiados de acuerdo a lo requerido por el
investigador.
Distribución de frecuencias y su representación grafica
Las distribuciones de frecuencias son tablas en que se dispone las modalidades
de la variable por filas. En las columnas se dispone el número de ocurrencias por
cada valor, porcentajes, etc. La finalidad de las agrupaciones en frecuencias es
facilitar la obtención de la información que contienen los datos.
La tabla de frecuencias (o distribución de frecuencias) es una tabla en la que
muestra la distribución de los datos mediante sus frecuencias. Esta es utilizada
para variables cuantitativas o cualitativas ordinales. Esta herramienta nos permite
ordenar los datos de manera que se presentan numéricamente las características
de la distribución de un conjunto de datos o muestra.
Generalmente las tablas incluyen varías columnas con las frecuencias relativas
(son el número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o
"pi"), frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias
de los valores iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No
obstante, la frecuencia acumulada también es definida incluyendo al valor de
referencia), frecuencias acumuladas relativas (la frecuencia acumulada relativa es
el total de frecuencias relativas de los valores iguales o inferiores al de referencia,
y se simbolizan "fr" o "pa").
Existen cuatro tipos de frecuencia:
Frecuencia absoluta: es el número de veces que el valor está en el conjunto (X1,
X2,…, XN). La suma de las frecuencias absolutas de todos los elementos
diferentes del conjunto debe ser el número total de sujetos N.
Frecuencia absoluta acumulada: es la suma de las frecuencias absolutas de los
valores menores o iguales a Xi.
Frecuencia relativa: es la proporción de valores iguales a Xi en el conjunto de
datos. Es decir, la frecuencia relativa es la frecuencia absoluta dividida por el
número total de elementos.
Frecuencia relativa acumulada: es la frecuencia absoluta acumulada dividida por
el número total de sujetos.
Su propósito es resumir en un solo número la posición o localización de la
distribución de datos.
Esta se puede graficar de diferentes maneras:
Histograma: Gráfico de rectángulos adyacentes. En el eje horizontal se marcan los

intervalos y en el vertical la frecuencia absoluta.
Polígono de frecuencias: estos se marcan con puntos las coordenadas de la
marca de clase (eje horizontal) y la frecuencia absoluta (eje vertical). Para cerrar el
polígono se crean dos puntos medios ficticios, uno anterior a la primera clase y
otro posterior a la última, cada uno con frecuencia igual a cero.
Ojiva o polígono de frecuencia acumulada: en el eje horizontal se marca
sucesivamente los límites superiores de cada clase y en el vertical las frecuencias
acumuladas o relativas acumuladas. El primer dato es el límite inferior de la
primera clase con frecuencia 0. Se unen los puntos y se obtiene una curva.
Diagrama de Pareto: Su principal uso es para poder establecer un orden de
prioridades en la toma de decisiones dentro de una organización. Se ordenan las
clases o datos por frecuencia absoluta de mayor a menor, en el eje X se colocan
los datos o clases, en el eje Y de la izquierda es la frecuencia absoluta (fi)
mientras que en el de la derecha es la frecuencia relativa acumulada porcentual
(Hi%).
Gráfica de Pastel. Es un gráfico circular que se utiliza como recurso estadístico
para representar porcentajes o proporciones de los datos. (clase o xi y hi o hi%).
Gráfica de Barras: se utiliza para representar gráficamente un conjunto de datos o
valores, y está formado por barras rectangulares de longitudes proporcionales a
los valores representados.
Gráfica de Tallo y Hoja: este permite obtener simultáneamente una distribución de
frecuencias de la variable y su representación gráfica, la hoja es la última cifra del
número y las otras cifras de la izquierda de la hoja forman el tallo.
Medidas de tendencia central, localización y dispersión
Las medias de tendencia central o posición nos indican donde se sitúa un dato
dentro de una distribución de datos. Las medidas de dispersión, variabilidad o
variación nos indican si esos datos están próximos entre sí o sí están dispersos,
es decir, nos indican cuán esparcidos se encuentran los datos. Estas medidas de
dispersión nos permiten apreciar la distancia que existe entre los datos a un cierto
valor central e identificar la concentración de los mismos en un cierto sector de la
distribución, es decir, permiten estimar cuán dispersas están dos o más
distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un
conjunto de datos, siendo la media aritmética el dato central más utilizado. Cuando
existe una dispersión pequeña se dice que los datos están dispersos o
acumulados cercanamente respecto a un valor central, en este caso el dato
central es un valor muy representativo. En el caso que la dispersión sea grande el
valor central no es muy confiable. Cuando una distribución de datos tiene poca
dispersión toma el nombre de distribución homogénea y si su dispersión es alta se
llama heterogénea.
Las medidas de tendencia central se utilizan con bastante frecuencia para resumir
un conjunto de cantidades o datos numéricos a fin de describir los datos
cuantitativos que los forman.
Las medidas de tendencia central más utilizadas son: media, mediana y moda.
La media (promedio) de un conjunto de datos se encuentra al sumar todos los
números en el conjunto de datos y luego al dividir entre el número de valores en el
conjunto.
La mediana es el valor del elemento central del conjunto. Para encontrar la
mediana, primero arreglar los valores del conjunto de acuerdo a su magnitud; es
decir, arreglar los valores del más pequeño al más grande o del más grande al
más pequeño y después localizar el valor central, es decir, el número de valores
sobre la mediana es el mismo que el número de valores debajo de la mediana.
la moda es el valor el cual ocurre más frecuentemente en el conjunto. Si un valor
es seleccionado al azar del conjunto dado, un valor modal es el valor más
probable a ser seleccionado.
Las medidas de dispersión en cambio miden el grado de dispersión de los valores
de la variable. Dicho en otros términos las medidas de dispersión pretenden
evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de
medidas usadas en conjunto permiten describir un conjunto de datos entregando
información acerca de su posición y su dispersión.

Introducción a la Estadística Descriptiva

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Introducción a la Estadística Descriptiva

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD TECNOLÓGICA DE CAMPECHE

Grado: 3 Grupo: “E”

Para obtener el título de:

Viernes, 29 de mayo del 2020

hermanos. Variables cuantitativas continua; es aquella variable que puede tomar

Población, muestra y muestreo

Muestreo estratificado: se realiza dividiendo a la población en partes o estratos

Histograma: Gráfico de rectángulos adyacentes. En el eje horizontal se marcan los

También podría gustarte