Está en la página 1de 9

Proyecto Final

Análisis descriptivo de datos


El análisis descriptivo, como su nombre lo indica, consiste en describir las tendencias claves en los
datos existentes y observar las situaciones que conduzcan a nuevos hechos. Este método se basa
en una o varias preguntas de investigación y no tiene una hipótesis. Además, incluye la
recopilación de datos relacionados, posteriormente, los organiza, tabula y describe el resultado.
Un análisis básico descriptivo implica el calcular las medidas simples de composición y distribución
de variables. Dependiendo del tipo de datos, pueden ser proporciones, tasas, razones o
promedios.  

Además, cuando sea necesario, como en el caso de las encuestas por muestreo, pueden utilizarse
medidas de asociación entre variables para decidir si las diferencias observadas entre mujeres y
hombres son estadísticamente significativas o no.   

Las ventajas del análisis descriptivo son:

 El investigador tiene un alto grado de objetividad y neutralidad.


 Se considera expansivo en comparación con otros métodos cuantitativos y ofrece un
amplio panorama de un fenómeno.
 Es el mejor método para la recolección de datos que describen las relaciones y exhiben el
mundo real.
 El conocimiento del análisis descriptivo ayuda a la comprensión de un tema y a interpretar
los resultados de modelos estadísticos más complejos a modelos simples.
 Este tipo de estudio da al investigador la flexibilidad de utilizar tanto datos
cuantitativos como datos cualitativos para descubrir las características de la población.

Las desventajas del análisis descriptivo son:

 La confidencialidad y la falta de veracidad de los encuestados es una de las principales


deficiencias del análisis descriptivo.
 Si el cuestionario de investigación no se diseña de manera apropiada y cuidadosa, pueden
ocurrir errores en el resultado general de la investigación.
 Si el investigador escoge sólo la información que apoya su hipótesis e ignora la parte de los
datos que no encajan, puede conducir a sesgos y errores en la investigación.
 Si el estudio de caso se utiliza para el diseño de la investigación descriptiva, es difícil
generalizar sobre la base de un solo caso y sacar conclusiones generales.
 El investigador piensa que tiene el conocimiento completo del tema de estudio. Los
prejuicios del investigador que podrían impactar las acciones tomadas durante la realización de la
investigación.
Uso de encuestas en el análisis descriptivo

Las encuestas incluyen la recopilación de una cantidad de datos relativamente grande. Estas se
encargan de describir, registrar e interpretar fenómenos sin interferir en las variables existentes.  
En este método, los encuestados responden a través de entrevistas o cuestionarios y
posteriormente, los investigadores analizan y describen las respuestas ofrecidas. Es un método
rápido para generar datos cuantitativos y tener un gran número de muestras, ya que el porcentaje
de respuestas es bajo.

Una encuesta es el enfoque más apropiado para la recopilación de datos descriptivos. Se compone
de elementos estructurados y no estructurados, Los estructurados son aquellos que utilizan una
lista formal de preguntas para todos los encuestados de la misma manera. En el caso de una
encuesta no estructurada, se guía la investigación basándose en respuestas de los encuestados.
El análisis descriptivo es un método científico que antecede a los estudios cuantitativos. Cuando el
investigador logra observar el comportamiento de un sujeto sin influir e identificar sus
limitaciones, esta herramienta se vuelve invaluable.

Por último, conoce el impacto del análisis descriptivo en proyectos de investigación.

Gráficos estadísticos.

Los gráficos estadísticos son potentes herramientas para la visualización de datos que permiten
representar de manera accesible información compleja. Consiguen presentar la información al
usuario o lector de manera clara y precisa, facilitando la comparación y la comprensión de la
evolución de distintas variables.

Además, pueden adaptarse al nivel del público al que van dirigido, convirtiéndolos en una vía de
gran utilidad para ofrecer información clara a cualquier persona: desde los lectores de periódicos y
revistas, hasta estudiantes, docentes, divulgadores científicos o directivos de compañías que
desean mostrar el avance de su negocio.

Ventajas:
Interés visual
Una de las mayores ventajas del uso de un gráfico, es que hace que la información sea visualmente
interesante para la audiencia. El gráfico por sus colores y contrastes capta inmediatamente la
atención.

Énfasis directo
Otra ventaja de utilizar un gráfico es que, dependiendo del tipo elegido, se pueden enfatizar
directamente las principales conclusiones de los datos para la audiencia.
Desventajas:
Limitación del análisis
Una desventaja de los gráficos, es que puede simplificar la información, por lo que algunos de sus
aspectos más complicados son menos aparentes.
Falta de precisión

Otra desventaja del uso de un gráfico es que, por diseño, probablemente no será tan preciso como
los datos brutos de origen.

Usos de gráficos estadísticos

El precio de la gasolina, de los alimentos, los porcentajes de impuestos, el número de alumnos


estudiando una carrera… El día a día nos rodea de información, de datos que varían por una u otra
razón. Al representar mediante datos los distintos aspectos de la realidad podemos cuantificar,
analizar y comprender cómo evolucionan y se relacionan distintas variables. Todo lo que puede ser
medido, cuantificado, puede representarse a través de los datos y, por tanto, a través de un
gráfico.

Distribución binominal

Una distribución binomial es una distribución de probabilidad discreta que describe el número de
éxitos al realizar n experimentos independientes entre sí, acerca de una variable aleatoria.
Para que una variable aleatoria se considere que sigue una distribución binomial, tiene que
cumplir las siguientes propiedades:

 En cada ensayo, experimento o prueba solo son posibles dos resultados (éxito o fracaso).
 La probabilidad del éxito ha de ser constante. Esta se representa mediante la letra p. La
probabilidad de que salga cara al lanzar una moneda es 0,5 y esta es constante dado que la
moneda no cambia en cada experimento y las probabilidades de sacar cara son constantes.
 La probabilidad de fracaso ha de ser también constate. Esta se representa mediante la
letra q = 1-p. Es importante fijarse que mediante esa ecuación, sabiendo p o sabiendo q, podemos
obtener la que nos falte.
 El resultado obtenido en cada experimento es independiente del anterior. Por lo tanto, lo
que ocurra en cada experimento no afecta a los siguientes.
 Los sucesos son mutuamente excluyentes, es decir, no pueden ocurrir los 2 al mismo
tiempo. No se puede ser hombre y mujer al mismo tiempo o que al lanzar una moneda salga cara y
cruz al mismo tiempo.
 Los sucesos son colectivamente exhaustivos, es decir, al menos uno de los 2 ha de ocurrir.
Si no se es hombre, se es mujer y, si se lanza una moneda, si no sale cara ha de salir cruz.
 La variable aleatoria que sigue una distribución binomial se suele representar como
X~(n,p), donde n representa el número de ensayos o experimentos y p la probabilidad de éxito.

La fórmula para calcular la distribución normal es:


P ( x ) =¿
Ventajas:

Solo dos posibles resultados


lo que ocurra en cada experimento no afecta a los siguientes.
no pueden ocurrir 2 sucesos al mismo tiempo

desventajas:
se limita a 2 resultados
puede ser confusa la formula

Usos
La distribución binomial es utilizada frecuentemente en control de calidad. Es un modelo
probabilístico adecuado cuando se muestrea sobre una población que puede considerarse
infinitamente grande, p representa la fracción de items defectuosos en dicha población. En estas
aplicaciones X representa el número de artículos defectuosos encontrados cuando se toma una
muestra al azar de tamaño n.

Distribución poisson

La distribución de Poisson es una distribución de probabilidad discreta que modeliza


la frecuencia de eventos determinados durante un intervalo de tiempo fijado a partir de la
frecuencia media de aparición de dichos eventos.

Para que el proceso de llegadas A(t) sea de Poisson ha de cumplirse que:

Incrementos independientes: Las variables aleatorias del proceso de tiempo entre llegadas son
independientes entre sí.

Homogeneidad: El número de llegadas de usuarios es el mismo en intervalos de igual longitud. Las


variables aleatorias tiempo entre llegadas son idénticamente distribuidas e independientes.

Llegadas individuales: La probabilidad de que ocurran dos sucesos en un intervalo suficientemente


pequeño es despreciable.

La distribución de probabilidades de un proceso de Poisson, K(t), es la siguiente:

pk → k ( t )=e−λt ¿ ¿
VENTAJAS:
Modelo matemático simple que permite desarrollar modelos analíticos.
DESVENTAJA:
Muchos tipos de tráfico no se modelan adecuadamente con estas
La distribución de Poisson se utiliza en el campo de riesgo operacional con el objetivo de modelar
las situaciones en que se produce una pérdida operacional. En riesgo de mercado se emplea el
proceso de Poisson para los tiempos de espera entre transacciones financieras en bases de datos
de alta frecuencia. También, en riesgo de crédito se tiene en cuenta para modelar el número
de quiebras.

Distribución muestral de la media.

En estadística, la distribución muestral es lo que resulta de considerar todas las muestras posibles


que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se
tiene, dada una sola muestra, de acercarse al parámetro de la población. Mediante la distribución
muestral se puede estimar el error para un tamaño de muestra dado.

 Si tenemos una población normal N (m,s) y extraemos de ella muestras de tamaño n, la


distribución muestral de medias sigue también una distribución normal

N¿
 Si la población no sigue una distribución normal, pero n>30, aplicando el llamado Teorema
central del límite la distribución muestral de medias se aproxima también a la normal anterior.
Ventajas 
 Es sencilla de calcular razón por la cual es la medida de tendencia más usada.
 Es estable con un número grande de observaciones.
 A la hora de realizar su cálculo, hace uso de todos los datos posibles.
 Es de gran utilidad en procedimientos estadísticos.
 Es susceptible a cualquier cambio en los datos, funcionando de esta manera como un
detector de variaciones en datos.
Desventajas
 Suele ser sensible a valores demasiado altos o demasiado bajos.
 Es imposible realizar cálculos de tipo cualitativo o datos que tengan clases de extremo
abierto, bien sean inferiores como superiores.
 Debemos evitar emplearla en distribuciones que sean asimétricas.

Cuando hacemos investigación nos interesa inferir si los hallazgos de un grupo de pacientes son
similares a los de la población general, o a los de otro grupo, o bien si se trata de valores
distintivos. Para inferir si hay o no diferencias es que resulta fundamental trabajar con
la distribución muestral de medias.
Cuando en una población se toma una muestra y se mide una variable continua, se obtiene un
conjunto de mediciones que puede resumirse en un valor de media. Si se toma otra muestra de la
misma medición se obtendrá otra media. Puede intuirse entonces que podemos tomar infinitas
muestras y obtener por lo tanto infinitas medias. Esas medias por lo tanto constituyen a su vez una
variable continua, que como toda variable continua tiene determinada distribución de
probabilidades.
Distribución muestral de proporciones.
La distribución muestral de proporciones está estrechamente relacionada con
la distribución binomial; una distribución binomial es una distribución del total de éxitos en las
muestras, mientras que una distribución de proporciones es la distribución de un promedio
(media) de los éxitos.
La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de
proporciones está basada en la aproximación de la distribución binomial a la normal. Esta fórmula
nos servirá para calcular la probabilidad del comportamiento de la proporción en la muestra.
p−P
z=
P(1−P)
√ n
A la fórmula anterior se le puede agregar el factor de corrección (en el denominador):
p−P
z=
P(1−P) N−n
√ n √
N−1
si se cumplen con las condiciones mencionadas anteriormente de que sea una población finita y
sin reemplazo.

Ventajas:
Da la proporción entre 2 poblaciones
Compara 2 poblaciones
Desventajas:
Procedimiento matemático confuso
Se puede llegar a confundir con otras ecuaciones
Cuando se requiere investigar la proporción de algún atributo en una muestra (variables
cualitativas), la distribución muestral de proporciones es la adecuada para dar respuesta a dichas
situaciones. Esta distribución se genera de igual manera que la distribución muestral de medias, a
excepción de que al extraer las muestras de la población, se calcula el estadístico proporción
(p=x/n en donde "x" es el número de éxitos u observaciones de interés y "n" el tamaño de la
muestra), en lugar del estadístico promedio.

Diseño de un muestreo.
Es un procedimiento para conocer algunas características de la población con base en una muestra
extraída de ella.
El objetivo de un diseño de muestreo es proporcionar indicaciones para la selección de una
muestra que sea representativa de la población.
Etapas del proceso de muestreo
• Definir claramente la población.
• Especificar el marco muestral.
• Especificar el método de Muestreo (diseño): Muestreo probabilistico y muestreo no
probabilistico.
• Determinar el tamaño de la muestra.
• Especificar el plan de muestreo. En éste se definen los procedimientos operacionales para la
selección de las unidades muéstrales.
• Seleccionar la muestra.
De acuerdo con el conocimiento o no que se tenga de la población, el muestreo puede ser:
Muestreo Probabilistico y No Probabilistico.
Ventajas
1. Costo reducido.
2. Mayor rapidez
3. Mayores Posibilidades: Aquellas encuestas que están basadas en el método de muestreo tienen
un mayor alcance y flexibilidad de acuerdo al tipo de información que pueda ser obtenida.
4. El muestreo puede ser más preciso que el censo. Esto es debido a que cuando el volumen de
trabajo es reducido se puede emplear personal capacitado al cual se le puede someter a
entrenamiento intensivo.
5. Cuando la medición del elemento trae consigo la destrucción o deterioro del mismo (control de
calidad). Ej.: Calidad de las bombillas para Flash.
6. Cuando la población sea infinita o tan grande que le quede al investigador físicamente imposible
estudiar toda la población.
 
Desventajas
• Error por mala identificación del problema o diferenciación pobre del problema.
• Errores por incapacidad para identificar la información específica requerida.
• Imperfecciones en el diseño del cuestionario.
• Error en la especificación del marco muestral donde Marco muestral es un listado de las
unidades muéstrales o listado de todos los elementos de la población.
• El encuestado responde sobre algo que no sabe.
• El encuestado intencionalmente suministra información incorrecta.
• El encuestado suministra información imprecisa, debido a fallas de memoria.
• Sesgos generados por el encuestador al influir con su tono de voz, explicaciones o apariencia
personal, en el encuestado.
• Sesgos generados por el encuestador al registrar incorrectamente las respuestas de los
encuestados.
• Sesgos generados por el encuestador al desviarse de las instrucciones que se le han dado.
• Errores generados durante la codificación, tabulación, edición, etc.
• Errores en la interpretación de los datos.
Lo que hoy denominamos investigación, se inició en el momento en que el hombre se enfrentó a
problemas y, frente a ellos, comenzó a interrogarse sobre el por qué, cómo y para qué; es decir,
cuando empezó a indagar sobre las cosas.
Aplicado al campo de la ciencia, la investigación es un procedimiento reflexivo, sistemático,
controlado y crítico que tiene por finalidad descubrir o interpretar los hechos y fenómenos,
relaciones y leyes de un determinado ámbito de la realidad.
La tarea de un investigador es: "tomar conocimientos del problema que otros pueden haber
pasado por alto, insertarlos en un cuerpo de conocimiento e intentar resolverlos con el máximo de
rigor y primariamente, para enriquecer nuestro conocimiento. Según eso, el investigador es un
problematizado por excelencia".
Mario Bunge
Debido a su creciente utilización en el área de los negocios, especialmente en la investigación de
mercados, en contabilidad, auditoría y en otras investigaciones de cualquier índole, se resalta la
importancia que tienen los diseños muéstrales en la investigación. Nuestros conocimientos,
nuestras actitudes y nuestras acciones estén basadas, en gran parte, en muestras. Esto es
igualmente cierto en la vida cotidiana y en la investigación científica.

Referencias

https://www.questionpro.com/blog/es/analisis-descriptivo/

https://www.unir.net/marketing-comunicacion/revista/graficos-estadisticos/

https://economipedia.com/definiciones/distribucion-binomial.html

https://economipedia.com/definiciones/distribucion-de-poisson.html

http://agamenon.tsc.uah.es/Asignaturas/ittst/rc1/download/Poisson.pdf

https://proyectodescartes.org/uudd/materiales_didacticos/inferencia_estadistica_JS/distrib_mue
strales.htm

https://miracomosehace.com/ventajas-desventajas-medidas-tendencias-
centrales/#Media,_propiedades,_ventajas_y_desventajas

https://www.sac.org.ar/cuestion-de-metodo/para-que-sirve-la-distribucion-muestral-de-medias/

http://virtual.umng.edu.co/distancia/ecosistema/odin/odin_desktop.php?
path=Li4vb3Zhcy9pbmdlbmllcmlhX2NpdmlsL3Byb2JhYmlsaWRhZF95X2VzdGFkaXN0aWNhL3VuaW
RhZF80Lw%3D
%3D&fbclid=IwAR0w5BvEYHLTI9FhGvYNXwDgyoUfrubcJS6AR9x9ImKb8la2ygaAtptS7pQ#slide_6

https://es.slideshare.net/domingodelacerda/tamao-de-muestra-para-diferencia-de-dos-medias-y-
dos-proporciones?next_slideshow=1

https://revistas.udem.edu.co/index.php/economico/article/download/1410/1467?inline=1

También podría gustarte