Está en la página 1de 74

Proyecto Integrador

Análisis de datos
RECOLECTAR LOS DATOS

• Definir la forma idónea de recolectar los


datos de acuerdo al contexto de la
investigación.
• Elaborar el instrumento de medición.
• Obtener los datos.
• Codificar los datos.
• Archivar los datos y prepararlos para el
análisis.
Análisis de los Datos

Una buena gestión de datos implica:

• desarrollar procesos eficaces para la recolección y el registro sistemáticos


de datos,
• el almacenamiento seguro de los datos,
• la depuración de datos,
• la transferencia de los datos (por ejemplo, entre distintos tipos de
programas informáticos utilizados para el análisis),
• la presentación eficaz de los datos y
• la accesibilidad de los datos para su verificación y utilización por terceros.
Análisis de los Datos

Los aspectos de calidad de los datos que se mencionan comúnmente son:

• Validez: los datos miden lo que se pretende que midan.


• Fiabilidad: los datos se miden y recopilan sistemáticamente según las definiciones y
metodologías estándar; los resultados son los mismos cuando se repiten las
mediciones.

• Exhaustividad: se incluyen todos los elementos de información (según las


definiciones y metodologías especificadas).
• Precisión: los datos están lo suficientemente detallados.
• Integridad: los datos están protegidos de sesgos o manipulaciones deliberados por
motivos políticos o personales.
• Puntualidad: los datos están actualizados y la información está disponible a tiempo
Análisis de los Datos

El análisis de datos consiste en la realización de las operaciones a las


que el investigador someterá los datos con la finalidad de alcanzar los
objetivos del estudio.

Es la técnica que consiste en el estudio de los hechos y el uso de sus expresiones


en cifras para lograr información válida y confiable.
Análisis de los Datos

Todas estas operaciones no pueden definirse de antemano de manera rígida.


La recolección de datos y ciertos análisis preliminares pueden revelar
problemas y dificultades que desactualizarán la planificación inicial del
análisis de los datos.

Sin embargo es importante planificar los principales aspectos del plan de


análisis en función de la verificación de cada una de las hipótesis formuladas
ya que estas definiciones condicionarán a su vez la fase de recolección de
datos.
Análisis de los Datos

Existen dos grandes familias de técnicas de análisis de datos:

• Técnicas cualitativas: en las que los datos son presentados de manera verbal
(o gráfica) - como los textos de entrevistas, las notas, los documentos…-
• Técnicas cuantitativas: en las que los datos se presentan en forma numérica

Estas dos modalidades son especies radicalmente diferentes y utilizan


conocimientos y técnicas completamente diferenciadas.
Análisis Cualitativo

El proceso cualitativo no es lineal ni lleva una secuencia como el


proceso cuantitativo.

Las etapas constituyen más bien acciones que se efectúan para cumplir con los
objetivos de la investigación y responder a las preguntas del estudio, además
son iterativas o recurrentes.

Al ingresar al campo o ambiente, por el simple hecho de observar lo que


ocurre en él, estamos recolectando y analizando datos, y durante esta labor, la
muestra puede ir ajustándose.

Muestreo, recolección y análisis resultan actividades casi paralelas. Desde


luego, no siempre la muestra inicial cambia.
Análisis Cualitativo

Las etapas constituyen más


bien acciones que se efectúan
para cumplir con los objetivos
de la investigación y responder
a las preguntas del estudio,
además son iterativas o
recurrentes.
Análisis Cualitativo

No existen reglas formales (al estilo de los métodos estadísticos) para


la realización de análisis cualitativos.

Sin embargo estos estudios suelen realizarse en las siguientes cuatro


etapas:

1. Preparación y descripción del material bruto


2. Reducción de los datos
3. Elección y aplicación de los métodos de análisis
4. Análisis transversal de los casos estudiados (si hubiera más de
uno)
Análisis Cualitativo
1. Preparación y descripción del material bruto

Consiste en preparar la base documental completa y fácilmente


accesible.

• La información debe ser detectable (saber que existe) ubicable (dónde se


encuentra) y trazable (dónde y como se obtuvo, cuales son sus fuentes). Existe
software que facilita algo esta tarea.
• La información suele ser voluminosa por lo que en muchos casos se requiere
bastante trabajo de preparación.
• La prueba del éxito de esta etapa sería que un investigador ajeno a la
investigación pudiera ejecutar las fases siguientes del análisis de datos a partir de
la base documental.
Análisis Cualitativo
1. Preparación y descripción del material bruto

Consiste en preparar la base documental completa y fácilmente


accesible.

detectable ubicable trazable


Análisis Cualitativo
2. Reducción de los Datos
Se intenta reducir el volumen de los datos, despejando los componentes (las
variables) de interés para la investigación (puede ser sólo enumerativo como en
el análisis de contenidos o más complejo como en el análisis semiótico)

Existen tres formas de realizar la reducción de datos:

1. La redacción de resúmenes:
reduce la masa de información
pero no utiliza métodos muy
específicos (no es replicable por
otros investigadores). En el
resumen se procura identificar los
conceptos relevantes y cómo
éstos se relacionan entre sí.
Análisis Cualitativo
2. Reducción de los Datos

2. La codificación: es el modo más desarrollado de reducción de datos.


Consiste en atribuir categorías o conceptos a porciones del material bien
circunscriptas y que presentan una alta unidad conceptual. Un buen sistema
de codificación debe ser:

• Inclusivo: exhaustivo (abarcar todas las posibilidades) y permitir que cada


elemento tenga tantos códigos como sea necesario para la investigación
• Adaptativo: debe permitir generar nuevos códigos cuando la investigación lo
requiera
• Abarcar varios niveles de abstracción: permitir categorías descriptivas y analíticas

3. Inducción: consiste en identificar temas a partir de la base de datos y


luego realizar reagrupamientos a partir de estos temas.
Análisis Cualitativo
2. Reducción de los Datos
Análisis Cualitativo
2. Reducción de los Datos
Análisis Cualitativo
2. Reducción de los Datos

Si regresamos a los códigos, debemos recordar que éstos se asignan a las categorías (se
etiquetan), con la finalidad de que el análisis sea más manejable y sencillo de realizar,
además son una forma de distinguir a una categoría de otras.

Pueden ser números, letras, símbolos, palabras, abreviaturas, imágenes o cualquier


tipo de identificador.
Análisis Cualitativo
3. Elección y aplicación de los métodos de análisis

En esta etapa se procede a la interpretación de los datos utilizando tres


posibles métodos de análisis para detectar “patrones” a partir de los datos
previamente organizados :

1. Método de emparejamiento
2. Método iterativo:

3. Método de análisis histórico (series temporales):

Los tres métodos pueden utilizarse conjuntamente.


Análisis Cualitativo
3. Elección y aplicación de los métodos de análisis

1. Método de emparejamiento: compara una configuración teórica predicha con una


configuración empírica observada. (Requiere Teoría previa y elección cuidadosa del
caso o casos adecuados para poner la Teoría a prueba).
Análisis Cualitativo
3. Elección y aplicación de los métodos de análisis

1. Método de emparejamiento: compara una configuración teórica predicha con una


configuración empírica observada. (Requiere Teoría previa y elección cuidadosa del
caso o casos adecuados para poner la Teoría a prueba).
Análisis Cualitativo
3. Elección y aplicación de los métodos de análisis

2.- Método iterativo: Abordaje de los datos con mínima formalización teórica y
construcción progresiva de una explicación. (Requiere conocimiento de las diferentes
teorías que pueden explicar el fenómeno y la realización de un trabajo reiterado sobre
los datos).
Análisis Cualitativo
3. Elección y aplicación de los métodos de análisis

2.- Método iterativo:


Análisis Cualitativo
3. Elección y aplicación de los métodos de análisis
3.- Método de análisis histórico (series temporales): Consiste en formular predicciones
sobre la evolución en el tiempo de un fenómeno. Es un caso particular del método de
emparejamiento en el que la Teoría es la predicción sobre el futuro.
Análisis Cualitativo
3. Elección y aplicación de los métodos de análisis
3.- Método de análisis histórico (series temporales): Consiste en formular predicciones
sobre la evolución en el tiempo de un fenómeno. Es un caso particular del método de
emparejamiento en el que la Teoría es la predicción sobre el futuro.
Análisis Cualitativo

4. Análisis transversal

* El análisis transversal apunta esencialmente a verificar si hay replica


de resultados entre varios casos o situaciones.

Se agrega a las etapas precedentes cuando los datos cualitativos


recolectados se refieren a varios casos del fenómeno
(organizaciones, situaciones, individuos…).

* Procede por comparación dónde cada situación es analizada de


acuerdo al o los modos de análisis descritos precedentemente, de
manera de captar si los modelos o patrones observados se reproducen.
Análisis Cualitativo

4. Análisis transversal

Dolor de No dolor de
rodilla rodilla
Obesos a b a+b
No obesos c d c+d
a+c b+d
Análisis Cualitativo

4. Análisis transversal
Datos de sección transversal y de series de tiempo

Para los propósitos del análisis estadístico la distinción entre datos


transversales y datos de series de tiempo es importante.

Datos de sección transversal son los Los datos de series de tiempo son datos
obtenidos en el mismo o obtenidos a lo largo de varios periodos.
aproximadamente el mismo momento
(punto en el tiempo).
Análisis Cuantitativo

Son los más conocidos. En muchos casos, cuando se requieren


técnicas estadísticas muy complejas es conveniente solicitar el
apoyo de especialistas (que pueden conocer mejor las técnicas,
en particular sus alcances y limitaciones).

Existen dos niveles de análisis cuantitativos:

1. Análisis descriptivos
2. Análisis ligados a las hipótesis
Pruebas Estadísticas

Análisis Cuantitativo
Diagrama de Dispersión y Línea de Tendencia
Diagrama de Dispersión es una representación gráfica de la relación entre dos variables
cuantitativas y una línea de tendencia es una línea que da una aproximación de la relación.

Como ejemplo, considere la relación


publicidad/ventas en una tienda de equipos
de sonido. Durante los últimos tres meses,
en 10 ocasiones la tienda apareció en
comerciales de televisión, en el fin de
semana, para promover sus ventas. Los
directivos quieren investigar si hay relación
entre el número de comerciales emitidos el
fin de semana y las ventas en la semana
siguiente.
Pruebas Estadísticas

Análisis Cuantitativo
Diagrama de Dispersión y Línea de Tendencia
Diagrama de Dispersión es una representación gráfica de la relación entre dos variables
cuantitativas y una línea de tendencia es una línea que da una aproximación de la relación.
Análisis Cuantitativo

Distribución de Frecuencias

Tendencia Central

Medidas de Variabilidad

Análisis Paramétrico

No Paramétrico
Análisis Cuantitativo

Análisis descriptivos

• Consiste en asignar un atributo a cada una de las variables del modelo


teórico.
Los atributos pueden ser estadísticos descriptivos como la media, la mediana, la moda o la
varianza, sobre cuyas propiedades existe gran conocimiento, experiencia y consenso, por lo
que no es necesario realizar análisis de validez y fiabilidad. Pero en estadísticos menos
conocidos (como por ejemplo la covarianza) puede ser necesario realizar este tipo de análisis.

• Es necesario tener definidos los criterios a seguir en caso de porcentajes


elevados de no respuesta y los eventuales sesgos que esto pueda representar.

• El análisis descriptivo suele realizarse mediante la utilización de software


estadístico como el SPSS, Systat, R, etc.
Análisis Cuantitativo

Análisis descriptivos

La codificación (especificada en la parte de las definiciones de las variables o


columnas que corresponden a ítems) sería:

• Género (1 = masculino y 2 = femenino).


• Color de cabello (1 = negro, 2 = castaño, 3 = pelirrojo, 4 = rubio).
• Edad (dato “bruto o crudo” en años).
Análisis Cuantitativo
Objetos
Análisis descriptivos
Distribución de Frecuencias
Es un conjunto de puntuaciones ordenadas en sus respectivas categorías y
generalmente se presenta como una tabla
Análisis descriptivos
Distribución de Frecuencias
Las distribuciones de frecuencias pueden completarse agregando los porcentajes de
casos en cada categoría, los porcentajes válidos (excluyendo los valores perdidos) y los
porcentajes acumulados (porcentaje de lo que se va acumulando en cada categoría,
desde la más baja hasta la más alta).

El porcentaje acumulado constituye lo que aumenta en cada categoría de manera


porcentual y progresiva (en orden descendente de aparición de las categorías),
tomando en cuenta los porcentajes válidos.
Análisis descriptivos
Distribución de Frecuencias
La empresa Colgate-Palmolive aplica la estadística en su
programa de aseguramiento de la calidad en los
detergentes caseros para la ropa. Le interesa la satisfacción
del cliente con la cantidad de detergente en los paquetes.
Todos los paquetes de cierto tamaño se llenan con la misma
cantidad de detergente en peso, aunque el volumen del
detergente varía de acuerdo con la densidad del polvo
detergente.

Por ejemplo, si la densidad del detergente es alta, se


necesita una cantidad menor de detergente para tener el
peso señalado en el paquete. El resultado es que cuando el
cliente abre el paquete le parece que no ha sido bien
llenado.

Para controlar el problema del peso del polvo de


detergente, se han establecido límites en el nivel aceptable
de la densidad del polvo (Densidades mayores a 0.40 son
inaceptablemente altas.). Con periodicidad se toman
muestras estadísticas y se mide la densidad de la muestra
de polvo.
Análisis descriptivos

Distribución de Frecuencias: Gráficas de Barra y pasteles


Una gráfica de barras o un diagrama de barras, es una gráfica para representar la parte
cualitativa de una distribución de frecuencia, de frecuencia relativa o de frecuencia
porcentual.
En uno de los ejes de la gráfica (por lo general en el horizontal), se especifican las etiquetas
emplea das para las clases (categorías). Para el otro eje de la gráfica (el vertical) se usa una
escala para frecuencia, frecuencia relativa o frecuencia porcentual.

Ancho de barra fijo Sobre cada Etiqueta


Análisis descriptivos

Distribución de Frecuencias: Gráficas de Barra y pasteles

Barras deben ir
Sobre cada Etiqueta
separadas
Análisis descriptivos

Distribución de Frecuencias: Gráficas de Barra y pasteles


La gráfica de pastel proporciona otra gráfica para presentar distribuciones de frecuencia relativa
y de frecuencia porcentual de datos. Para elaborar una gráfica de pastel, primero se dibuja un
círculo que representa todos los datos. Por ejemplo, como un círculo tiene 360 grados y Coca
cola clásica presenta una frecuencia relativa de 0.38, el sector de la gráfica de pastel
correspondiente a Coca cola clásica resultará de 0.38(360) 136.8 grados.

Las clases con frecuencia pequeña, se


agrupen en una sola clase a la que se le
llama “otros”. Cualquier clase con 5% o
menos se trata de esta manera.
Análisis descriptivos

Medidas de tendencia central

Son valores medios o centrales de una distribución que sirven para ubicarla dentro de la
escala de medición.

Las principales medidas de tendencia central son tres: moda, mediana y media. El nivel
de medición de la variable determina cuál es la medida de tendencia central apropiada
para interpretar.
Análisis descriptivos

Media Aritmética
La media aritmética es el promedio o medición de tendencia central de uso más
común. Se calcula sumando todas las observaciones de una serie de datos y luego
dividiendo el total entre el número de elementos involucrados.

En las fórmulas estadísticas se acostumbra denotar el valor


de la primera observación de la variable X con X1, el valor de
la segunda observación de la variable X con X2 y así con lo
siguiente. En general, el valor de la i-ésima observación de la
variable X se denota Xi.
Análisis descriptivos

Media Aritmética
Determina el centro de gravedad de un conjunto de datos, es decir es el valor más
representativo

Ejem: Se ha efectuado la medición de cuanto demora la atención a los clientes en un


Call Center. Se ha tomado una muestra de 10 clientes y los resultados obtenidos son :
Análisis descriptivos

Media Aritmética
Si los datos son datos de una muestra, la media se denota ; si los datos son datos de
una población, la media se denota con la letra griega μ.

Para calcular la media de una población use la misma fórmula, pero con una notación
diferente para indicar que trabaja con toda la población. El número de observaciones
en una población se denota N y el símbolo para la media poblacional es μ.
Análisis descriptivos

Media Aritmética: Ejemplo


En un estudio realizado por Norris Electronics. Este fabrica focos de alta intensidad que se emplean en
diversos productos electrónicos. Con objeto de incrementar la vida útil de estos focos, el grupo de diseño
del producto elaboró un filamento nuevo.

En este caso, la población está definida por todos los focos que se produzcan con el filamento nuevo. Para
evaluar las ventajas del filamento, se fabricaron 200 focos. Los datos recolectados de esta muestra dan el
número de horas que duró cada foco hasta que se quemara el filamento.

Suponga que Norris desea usar estos datos


muestrales para hacer una inferencia acerca
del número de horas promedio de vida útil
de todos los focos que se producen con el
filamento nuevo.

Al sumar los 200 valores de la tabla 1.5 y


dividir la suma entre 200 se obtiene el
promedio del tiempo de vida de los focos: 76
horas.
Análisis descriptivos

La Mediana (Me) es el valor que divide la distribución por la mitad

La mediana es el valor medio de una secuencia ordenada de datos (en forma


ascendente).

Si no hay empates, la mitad de las observaciones serán menores y la otra mitad serán
mayores.

La mediana no se ve afectada por ninguna observación extrema de una serie de


datos. Por tanto, siempre que esté presente una observación extrema es apropiado
usar la mediana en vez de la media para describir una serie de datos.
Análisis descriptivos

La Mediana (Me) es el valor que divide la distribución por la mitad

Es la medida de tendencia central que corresponde al valor de la variable que divide a


la frecuencia total en dos partes iguales .
Mediana de datos no agrupados: En este caso se procede de la siguiente manera:

1º Se ordena el conjunto de valores en orden creciente.


2º Se halla el valor que ocupa la posición media .
3º Si el número es impar, el valor central es la mediana .
4º Si el número es par , el promedio de los dos centrales es la mediana.
Análisis descriptivos

La Mediana (Me)

Mediana de datos agrupados

Donde :
Li : limite inferior del intervalo de la clase que contiene a la Me
c : Tamaño del intervalo de clase
n : Total de frecuencias absolutas
Fa : Frecuencia absoluta acumulada anterior a la clase que contiene a la Me
fi : frecuencia absoluta de la clase que contiene a la Me
Análisis descriptivos
La Mediana (Me)
La gerencia de mercadeo de DirecTv ha decidido realizar un estudio acerca de la edad promedio de los
clientes de su servicio de televisión satelital. Se ha elegido una muestra de 300 clientes recogida
durante todo un mes típico . Aplicada la encuesta se han obtenido los siguientes resultados :

Mediana de datos agrupados

El valor de N/2 es = 300/2 = 150, este valor se encuentra ubicado en el 6º intervalo

El 50% de los asistentes al Café Bar “ El Sol ”


está en el intervalo de 19 a 39.55 años y el 50%
restante está en el intervalo de 39.55 a 55
años.
Análisis descriptivos

La Moda ( Mo) La moda es la categoría o puntuación que ocurre con mayor frecuencia.

La moda o modo es el valor de una serie de datos que aparece con más frecuencia. Se
obtiene fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la
moda no se ve afectada por la ocurrencia de los valores extremos.
Análisis descriptivos

La Moda ( Mo) La moda es la categoría o puntuación que ocurre con mayor frecuencia.

La moda o modo es el valor de una serie de datos que aparece con más frecuencia. Se
obtiene fácilmente de una clasificación ordenada. A diferencia de la media aritmética, la
moda no se ve afectada por la ocurrencia de los valores extremos.

El único salario mensual inicial que se


presenta más de una vez es $3480. Como
este valor tiene la frecuencia mayor, es la
moda.
Análisis descriptivos

La Moda ( Mo) La moda es la categoría o puntuación que ocurre con mayor frecuencia.

a. Moda de datos agrupados


Fórmula

Donde :
Li : limite inferior del intervalo de la clase que contiene a la Moda
c : Tamaño del intervalo de clase
n : Total de frecuencias absolutas
fp : Frecuencia absoluta posterior a la clase que contiene a la Moda
fa : frecuencia absoluta anterior de la clase que contiene a la Moda
Análisis descriptivos
La Moda ( Mo)
a. Moda de datos agrupados

Utilizando el ejercicio del Direct TV:


La frecuencia mayor se encuentra ubicada en el 5º
intervalo = 67 clientes

La edad más frecuente de los asistentes al Café


Bar “ El Sol ” es de 37.19 años.
Metodología en el análisis de datos y posterior representación gráfica
Análisis Cuantitativo
La realización de estudios estadísticos implica emitir unos resultados
cuantificables de dicho estudio o experimento.

La claridad de dicha presentación es de vital importancia para la


comprensión de los resultados y la interpretación de los mismos

A la hora de representar los resultados de un análisis estadísticos de un modo


adecuado se presentarán los datos numéricos por medio de tablas, en
ocasiones un diagrama o un gráfico pueden ayudarnos a representar de un
modo más eficiente nuestros datos.
Percentil

Un percentil aporta información acerca de la dispersión de los datos en el intervalo que


va del menor al mayor valor de los datos.

En los conjuntos de datos que no tienen muchos valores repetidos, el percentil p divide
a los datos en dos partes.

Cerca de p por ciento de las observaciones tienen valores menores que el percentil p y
aproximadamente (100 - p) por ciento de las observaciones tienen valores mayores que
el percentil p. El percentil p se define como sigue:

También es una medida de posición usada en estadística que indica, una vez ordenados los datos de menor a mayor, el
valor de la variable por debajo del cual se encuentra un porcentaje dado de observaciones en un grupo de
observaciones. Por ejemplo, el percentil 20º es el valor bajo el cual se encuentran el 20 por ciento de las observaciones.
Percentil

Para calcular el percentil p se emplea el procedimiento siguiente.


Percentil

Por ejemplo: determine el percentil 85 en los sueldos mensuales iniciales de la tabla


Percentil

Por ejemplo: calculará el percentil 50 en los sueldos mensuales iniciales.

Como i es un número entero, de acuerdo con el paso 3 b) el percentil 50 es el promedio


de los valores de los datos que se encuentran en las posiciones seis y siete; de manera
que el percentil 50 es (3490 +3520)/2 = 3505.

Observe que el percentil 50 coincide con la mediana.


Cuartil

Con frecuencia es conveniente dividir los datos en cuatro partes; así, cada parte
contiene una cuarta parte o 25% de las observaciones. En la figura se muestra una
distribución de datos dividida en cuatro partes. A los puntos de división se les conoce
como cuartiles y están definidos como sigue:

Q1 primer cuartil, o percentil 25


Q2 segundo cuartil, o percentil 50
Q3 tercer cuartil, o percentil 75
Cuartil

Del ejemplo de los sueldos, el cuartil Q2, la mediana, ya se tiene identificado, y es 3505.
Análisis Cuantitativo

Análisis ligado a las hipótesis

Cada una de las hipótesis planteadas en el estudio debe ser objeto de una
verificación. Cuando los datos recolectados son de naturaleza cuantitativa, esta
verificación se realiza con la ayuda de herramientas estadísticas que se definen
sobre la base de 3 aspectos principales:

• Las hipótesis que se desea verificar


• Los diseños de investigación (experimental, quasi experimental,
experimental invocado…)
• Distribución estadística de las variables.
Análisis Cuantitativo

Análisis ligado a las hipótesis

Lo primero que debe considerarse al realizar un experimento que posteriormente llevará un


tratamiento estadístico es:

- Plantear la hipótesis de trabajo que se quiere demostrar.


- Definir bien las variables a estudiar.
- Cómo recoger y recopilar los datos (TIPOS DE MUESTREO).
- Elección del método estadístico más apropiado para demostrar la hipótesis de trabajo de la
mejor manera posible.

Es conveniente resaltar que el fin de los muestreos es extraer una muestra lo suficientemente
representativa de una población para que las conclusiones muestrales obtenidas puedan
extrapolarse a nivel poblacional, de ahí que sea de suma importancia la minuciosa elección y
preparación en la recogida de datos.
Bibliografía
Pruebas Estadísticas

Análisis ligado a las hipótesis


Regresión lineal simple

Descripción
Permite predecir el comportamiento de una variable a partir de otra.

Presunciones o requisitos
Se asume que ambas variables son representadas en escalas de intervalo o radio.
Adicionalmente, la variable dependiente debe estar normalmente distribuida
alrededor de la línea de predicción.
Para esto se asume que las variables están relacionadas linealmente. Usualmente,
ambas variables deben estar normalmente distribuidas. Se pueden aceptar
también a variables dicótomas (de solo dos niveles) como variables
independientes.
Para el análisis de regresión lineal simple nos interesan 3 componentes en los resultados. El primero se
llama “Resumen del modelo” en el que aparece el cálculo del R cuadrado (llamado coeficiente de
determinación). El R cuadrado nos indica la proporción de varianza de la variable dependiente que se
puede explicar a través de la variación de la variable independiente. El segundo la significancia un valor
menor a 0,05 indica una regresión linear significativa. Y Al final el cálculo de los coeficientes como: Y =
a + bX
Pruebas Estadísticas

Análisis ligado a las hipótesis


Ejercicio: Utilizar el archivo “Salarios” para predecir el salario en base a los años de educación. Sacar
conclusiones sobre el resumen del modelo y significación de la regresión. Adicionalmente responder:
Qué salario se podría predecir para alguien que tiene 12 años de educación? Qué salario se predeciría
para alguien con 16 años de educación? (valor hipotético para este ejercicio).

Ecuación: Y = a + bX
Salario: -18970,501 + 3699,115(años de educación)
* Para 12 años de servicio: -18970,501 + 3699,115(12)
= 25419,38
* Para 16 años de servicio: -18970,501 + 3699,115(16)
= 40215,84
Pruebas Estadísticas

Análisis ligado a las hipótesis


Prueba t para una muestra
Descripción
La prueba t para una sola muestra compara la media de una muestra simple con
una población conocida. Es útil para determinar si un conjunto de datos ha
cambiado en relación a un valor histórico (por ejemplo, comparar la temperatura
del presente año con el porcentaje histórico).

Presunciones o requisitos
Las distribuciones de las cuales se han tomado los valores deben ser normales. No
obstante, la prueba t es un test robusto que puede soportar violaciones de la
presunción de normalidad en las distribuciones. La variable dependiente debe
estar medida en escalas de intervalo o radio.
La prueba t asume una igualdad en las medias

Por lo tanto, un resultado con significación indica que la media de la muestra no es equivalente a la
media de la población (de allí viene el término “diferencia significativa”). Un resultado que no es
significativo se refiere a que no existe una diferencia significativa entre las medias. No significa que son
iguales.
Pruebas Estadísticas

Análisis ligado a las hipótesis


Ejercicio: Utilizando el archivo de SPSS denominado “Primer archivo datos”, vamos a comparar la media
de las calificaciones de nuestra pequeña muestra con la media de la población que en este caso sería
“70” (valor hipotético para este ejercicio).

En nuestro ejemplo se presenta un valor t de 3,903, con 3 grados de libertad, y un nivel de significación de
0,030. La diferencia entre las dos medias (la de nuestra muestra y la de la población) es de 10,25 puntos.

el ejemplo anterior se ha encontrado una diferencia significativa entre la media de la población y la de la


muestra. Por lo tanto, se podrían reportar los resultados de la siguiente manera:

Una prueba t de una muestra se utilizó para comparar la media de la muestra con la media de la
población que tiene un valor de 70,00. Se encontró una diferencia significativa (t(3) = 2,377, p < 0,05). La
media de la muestra de 80,25 (ds = 5,25) fue significativamente superior a la media de la población.
Escritura

Los dos pasteles de la figura representan al consumo promedio de dos


familias, donde se podría escribir como:

La figura 1 muestra el diagrama de Dispersión de la


relación del salario con los años de experiencia
obtenidos del registro de talento humano de la
Empresa XXX. Se puede evidenciar que existe una
tendencia positiva, donde la línea de mejor ajuste se
representa por la ecuación Y = a + bX, Siendo “Y” la
variable dependiente Salario, “X” la independiente
Años de experiencia, “a” es la constante, y “b” es la
pendiente.
Figura 1: Diagrama de Dispersión
Salario Vs Años de Experiencia
Escritura

Los dos pasteles de la figura representan al consumo promedio de dos


familias, donde se podría escribir como:

La figura 1 muestra que el mayor gasto mensual de


las dos familias es la hipoteca. La Familia A gasta
más en la hipoteca que alguna otra cosas (32%), el
gasto en entretenimiento es la mitad del rubro
anterior (16%), pero menor que el gasto en
alimentación (19%) y mayor que el gasto de
vestimenta. Otro porcentajes son el pago de cuentas
(14%), costos del auto (9%) entre otros (2%).

Por otro lado en la Familia B, a pesar de que el gasto


en hipoteca es alto (24%), es igual al pago de
cuentas, además esta familia invierte más en
alimentación (21%) y mantenimiento del auto
(14%), dejando de lado el entretenimiento (9%) y la
vestimenta (5%).

Figura 1: Gastos por Ingreso Mensual


Escritura

Los dos pasteles de la figura representan al consumo promedio de


dos familias, donde se podría escribir como:

Figura 1: Computadores Vendidos 1990-1999

La figura 1 muestra como la venta de


computadores de escritorio despuntó entre 1990 y
1992, lo cual puede responder a la incorporación
de las TICs a la industria. Entre 1992 y 1994 existió
una caída en compra de computadores debido a
una saturación del mercado que afectó a las ventas,
sin embargo en 1994 inició una recuperación del
mercado, que duró hasta 1997, año a partir del cual
la venta de computadores de escritorio descendió
constantemente hasta 1999.
Bibliografía

[1] Hernández Sampieri, Metodología de la investigación, Ed.


Mc Graw Will, México 2005.
[2] Flores Cebrián, Análisis Estadístico Desriptivo, Universidad
Inca Garcilaso de la Vega Facultad de Ciencias de la
Comunicación

También podría gustarte