Está en la página 1de 25

ANÁLISIS DE DATOS

Carlos Andrés Yanes Guerra

EJE 1
Conceptualicemos

Fuente: Shutterstock/625561898
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Los datos en las organizaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

Fuentes de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Tipo de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

Sistemas de información . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

Importancia de los datos en la empresa . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Uso y aplicación de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

Análisis de datos como una herramienta para pensar las empresas . . . . . 14

¿Qué es análisis de datos? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

Análisis descriptivo (forma de análisis cuantitativo) . . . . . . . . . . . . . . . 17

Análisis de inferencia estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

Análisis de datos cualitativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
ÍNDICE
Introducción

La analítica es un proceso fundamental para la toma de decisiones en las empre-


sas, requiere hoy en día que los asuntos o relaciones entre empresarios y clientes
sean de alguna forma sistematizados, de modo que resulta de vital importancia
conocer las características del comportamiento de las personas frente a los nego-
cios que con estos se entablan.

Los datos no son más que la forma o manera como las empresas conocen lo que
hacen, dicen o hacen sus clientes. Para hacer un registro de estos datos, regular-
mente se usan encuestas o reportes de facturas que llevan a identificar un dato.
INTRODUCCIÓN

Sistematizados
Organizado en un archivo de siste-
mas, tal como las bases de datos.
Los datos en las
organizaciones
Dentro de toda organización, sin importar su tipo, siempre encontraremos datos de
interés para cada área funcional, y es por ello que se hace necesaria su clasificación,
administración, gestión y análisis. Observemos en el ejemplo algunos datos que nos
permitirán el desarrollo de bases de datos.

Ejemplo:

- Número de factura.
Cliente Empresa - Compra.
- Método de pago.

Figura 1.
Fuente: propia

         
 Negocio Andina S.A.
     
 Rut: 

Fecha: 8/12/2035     Factura número:________


       
Cliente:    
Dirección    
         
Cantidad Código producto Producto Descripción Precio unitario
         
         
         
         
         
         
         
      Subtotal  
      IVA  
      Total:  
         

Figura 2. Factura de ejemplo


Fuente: propia

Análisis de datos - eje 1 conceptualicemos 5


Encontramos varios datos importantes, en la figura anterior, estos son:

• Cliente, de la cual podemos determinar quién es el que compra los productos.

• Dirección, donde se ubica y posiblemente donde realizar el despacho.

• Producto, que compra el cliente como tal.

• Precio, valor que se le cobra usualmente, etc.

De lo anterior si se tiene cierto número de clientes se podrá obtener la prioridad, lo


que comúnmente compran o consumen y con esto tener previsión de inventarios y posi-
blemente ahorro en costos de almacenaje. De esto se podrá establecer lo que se conoce
como base de datos.

Las bases donde comúnmente se hacen reportes de


datos, puede definirse como un compilado de variables que Compilado
permiten medir información que arrojan los clientes de las Convertir un programa en lenguaje
máquina a partir de otro programa de
empresas, y se encargan de organizar y darle estructura a computadora escrito en otro lenguaje.
la información de forma simplificada.

Tomando como referencia la figura 2, se plantea una de las formas que podría tener
una base de datos:

Cliente Dirección Ciudad Producto Cantidad Precio unitario


12366457 Cra 32 #F40 Bogotá Termos 2Cms 23 $5.320.000

Transv 28 Bombillas
21245866 Cali 150 $4.500
78K-F 150Kw

Calle 152 Ladrillos


32154865 Bucaramanga 9500 $3.200
#15-15 Macizo
… … … … … …
… … … … … …
… … … … … …
… … … … … …

Tabla 1. Base de datos


Fuente: propia

Instrucción
Los invito a desarrollar la primera actividad
práctica para mejor comprensión del tema
que estamos desarrollando.

Análisis de datos - eje 1 conceptualicemos 6


Fuentes de datos

Los datos pueden ser obtenidos de manera precisa si estos


son propios y que se denominan fuente primaria, o asumiendo Falencia
cualquier falencia en la obtención de otras fuentes no propias o Engaño o error, falla o carencia.

conocidas como fuentes secundarias.

La ventaja de la fuente de datos primaria con respecto a las fuentes secundarias


radica en el acceso y en lo que el administrador de la base de datos estipula que se debe
abordar dentro de este proceso. Las fuentes primarias regularmente la realizan las propias
empresas a partir de sus áreas de informática y/o estadísticas. En cambio, aquellas que
provienen de los datos del estado o gobierno e incluso instituciones de propiedad pública
o privada (y que son usadas por las empresas), son las catalogadas como secundarias.

Ejemplo

Las fuente primarias pueden ser: entrevistas, reportes, sondeos de opinión


de la empresa, minutas, etc. Y las fuentes secundarias: datos del Depar-
tamento Administrativo Nacional de Estadísticas (DANE), Departamento
de Planeación Nacional (DNP), Ministerio de Hacienda y crédito público
(Minhacienda), encuestas de otras empresas privadas, etc.

Lo recomendable es siempre poseer información propia y que


cada una de las empresas elabore su propio reporte. Ya cuando
Minutas
es demasiado difícil obtener información, se puede contratar Extracto o borrador que se hace
con alguna empresa consultora especializada en la materia o de un contrato u otra cosa,
anotando las cláusulas o partes
cuando sea el caso de que resulta costoso contratar u obtener esenciales, para copiarlo des-
datos, se recomienda usar información o datos de las institu- pués y extenderlo con todas las
formalidades necesarias para
ciones estatales, teniendo en cuenta que posiblemente algunas su perfección.
veces no tengan información que requiera la empresa en cues-
tión de la necesidad del dato.

Análisis de datos - eje 1 conceptualicemos 7


Tipo de datos

Los datos según su proveniencia pueden ser clasificados como:

Geográficos

Ciencias
Culturales naturales

Tipos
de datos
Ambientales
Financieros

Estadísticos Transporte

Figura 3. Tipo de datos según su naturaleza


Fuente: propia

Los datos regularmente provienen o son bolsa, la tasa de interés efectiva y nominal
obtenidos por sectores que en cualquier del mercado, etc.
momento obtienen información de un
ciudadano común. Aquellos que provienen
del sector transporte pueden ser como, por
ejemplo: el número de accidentes, la can-
tidad de vehículos que hay en el parque
automotor, número de vías pavimentadas. ¿Qué tipo de datos considera-
En otro sector como el financiero se puede ría el estudiante que proveería
tener: el precio de las acciones y/o deri- el sector ambiental?
vados financieros, el índice general de la

Análisis de datos - eje 1 conceptualicemos 8


Por otro lado, más en el sentido de la programación los datos regularmente se clasi-
fican en:

• Numérico.
Es de saber que en muchos
programas la clasificación
• Carácter o texto. puede variar, pero en esen-
cia la funcionalidad y des-
cripción suele ser la misma.
• Lógicos.

• Nulos.

Los datos de tipo numérico suelen representarse tal como su nombre de clasificación
así lo identifica.

Ejemplo
Enteros: 34560 o -34560. Puede ser también continuos o de forma deci-
mal, es decir, 2.36; 4.78, etc. Los primeros lenguajes de programación lo
toman como “int (integer)” y los segundos como “float”.

Debe tenerse en cuenta que los datos numéricos regularmente se usan para descrip-
ciones como precios, ingresos, gastos, numero de contacto, edad, etc.

Los de formato carácter o texto son aquellos que vienen estable-


cidos como cadenas de datos o simplemente estructura de escri- Booleano
tos, algunos programas los referencian como: “A”, hacen referencia Hace referencia al mate-
mático George Boole quien
a variables que describen características de los individuos como: con sus avances e investi-
estado civil “casado”; “divorciado”; “soltero”. Siempre se escriben gaciones en algebra se hace
una alusión a este.
entre comillas. En otros softwares simplemente los resaltan ya sea
en negrilla o en color azul.

Los lógicos hacen referencia al lenguaje booleano, es decir, res-


ponden de forma binaria, tienen como respuesta las opciones de
El lenguaje universal de los
verdadero o falso. datos regularmente es en el
idioma de inglés, por tanto,
toman a lo lógico como true
o false.

Ejemplo

7 > 5, True.
3 = 4, False.

Análisis de datos - eje 1 conceptualicemos 9


En las bases de datos se opera con ellos para formular referen-
cias condicionantes o lo que un analista hace o establece para Secuencia
Serie o sucesión de cosas
hacer que una relación de un par de variables nos dé como res- que guardan entre sí cierta
puesta una secuencia lógica. relación.

Analicemos un caso en Excel de Microsoft: tenemos un par de variables que son de tipo
numérico, para este caso se usan números enteros y a partir de estos queremos obtener
una respuesta lógica:

¡Recordemos !

Los operadores lógicos en matemática son:


Mayor estrictamente (>)
Mayor o Igual (≥)
Igual (=)
Menor estrictamente (<)
Menor o igual (≤)

Video

En este punto les invito a observar atentamente el


video de operadores lógicos, para tener una mejor
apreciación del ejemplo.

Videorelato

Así los ubicaríamos en Excel, para tener una aproximación columna de respuesta.

Variable 1 Operador lógico Variable 2 Respuesta


10 > 5 Verdadero
15 > 23 Falso
13 < 16 Verdadero
11 < 10 Falso
10 = 9 Falso

Tabla 2. Ejemplo en Excel


Fuente: propia

Análisis de datos - eje 1 conceptualicemos 10


La tabla quiere demostrar en qué sen- la respuesta a la programación específica
tido funciona el operador lógico cuando se para hallar la respuesta.
establece una comparación con la variable
(2). Una visualización del comando o pro- Para otros casos como el de la fila 3 que
gramación a usar es el comando (SI) con contiene los valores de 13, el operador “<”
cada una de las filas en que se aplica la menor estrictamente y el valor de 16 se usa-
fórmula de uso. ría en Excel:

Para la fila 1, donde se encuentran los = SI (E9 < G9; “Verdadero”; “Falso”)
valores de 10, si es mayor estrictamente a 5
la celda respuesta debe ser condicionada a: Si en algún aspecto el estudiante se ve
confundido con la programación puede
= SI (E7 > G7; “Verdadero”; “Falso”) hacerlo de forma manual cambiando las
letras de la ubicación de la celda con los
Donde E7 corresponde a la celda que respectivos valores.
contiene el valor de 10, se usa el operador
“>” mayor estrictamente, G7 hace referen- = SI (13 < 16; “Verdadero”; “Falso”)
cia a la celda donde está el valor de 5 y
La respuesta será “Verdadero”.

Figura 4. Operativizar en Excel de tipo dato lógico


Fuente: propia

Análisis de datos - eje 1 conceptualicemos 11


El tipo de dato nulo o “NULL” hace referencia que para la observación específica no se
manifiesta ningún tipo de información en la base de datos. Regularmente no se tienen
en cuenta porque no aportan ningún dato o información.

Ejemplo

Precio
Cliente Dirección Ciudad Producto Cantidad
unitario
12366457 Cra 32 #F40 Bogotá Termos 2Cms NULL $5.320.000
Transv 28
21245866 Cali NULL 150 $4.500
78K-F

Ejemplo:Tabla 3. Datos nulos


Fuente: propia

Se puede observar que en la base para el primer cliente no se conoce la cantidad


de producto que se obtuvo y con el segundo cliente no se cuenta con información
del producto adquirido. Es de entrever que las bases de datos no deberían contener
demasiadas variables con objeto nulo, porque se pierde la esencia de la base de datos.

Lectura recomendada

Para complementar el tema de la clasificación de datos, rea-


lice la lectura del capítulo 6, específicamente las páginas 41 a
la 44, y después desarrolle la actividad de control de lectura.

Estadística descriptiva e inferencial y una introducción al


método científico

Carlos de la Puente Viedma, leer de la página 41 a la 44

Análisis de datos - eje 1 conceptualicemos 12


Sistemas de información

Los sistemas de información actuales


varían a partir de la estructura de la orga- Individuos
nización que maneja o conduce la informa-
ción de los agentes que interactúan en los
negocios. Los sistemas ayudan a organizar
la forma en que se alimentan las bases de Información
datos de la compañía.

Ejemplo
Recursos
Los elementos proveídos por los indivi-
duos generan información y con esta se
establecen recursos de operación. Figura 5. Sistema.
Fuente: propia

Los sistemas pueden ser más complejos en la medida que se adhieran más fases o
áreas dentro de las organizaciones, como se observa en la figura 6.

Sistema de información

Lenguaje. Localización.

Negocio.
Procesos de
Obtención información
de
información Estadística
Medios descriptiva.
informativos. Base
de datos
Análisis de
datos Estadística
Medios de Difusión inferencial.
difusión (diarios,
revistas,
Soluciones
internet).
técnicas
Modelos
de datos.
Presentación
a las Toma de
directivas. Acciones. decisiones.
Figura 6. Sistema de información
Fuente: propia

Análisis de datos - eje 1 conceptualicemos 13


Importancia de los datos en la empresa

La información en las empresas permite reducir incertidumbre a


la hora de tomar decisiones de cualquier tipo y sobre todo aquellas
Incertidumbre
que tengan efectos en los costos y gastos operativos. También Ausencia o falta de tener
permiten tener ventaja sobre la competencia, ya que, al tener certeza de algo.
información privilegiada de los clientes, se podrá ofrecer un mejor
producto o servicio en particular e incluso innovar en los procesos de la empresa. Las
decisiones que se tomen a partir de un buen análisis de datos serán mucho mejor que
aquellas que no cuenten con este análisis.

Uso y aplicación de los datos

Al usar información que puede ser recopilada de forma diaria, semanal, quincenal,
mensual, semestral o anual, se puede establecer una jerarquía de perfiles de los clientes
o proveedores que participan en el entorno de la empresa. El buen uso de la información
genera una disciplina más precisa en la compañía en lo que tiene que ver con una mejor
oferta de servicios.

Las áreas de aplicación de los datos pueden ser:

• Área financiera y contable: balance de resultados, costos, ingresos.

• Área administrativa: portafolio de servicios.

• Área de logística: inventarios, despachos.

• Área de Talento humano: contrataciones, flexibilización laboral.

Análisis de datos como una herramienta para pensar las empresas

El estado de pensamiento de las empresas no solo reposa en la parte más alta que
asume la jerarquía de la compañía, al contrario, parte de las bases que le brinda el área de
analítica, regularmente compuesta con personal con talento en lectura e interpretación
de datos, a pesar de la necesidad de poseer conocimientos de las matemáticas, algebra
y estadística, la analítica intenta hacer una lectura correcta de la información y usarla a
favor de los desafíos del mercado.

Análisis de datos - eje 1 conceptualicemos 14


El análisis de datos soporta el nivel de reputación que puede tener una empresa,
cuando la empresa se desenvuelve en el mercado es porque conoce de algo y eso sin
duda provino de un dato.

Figura 7. Análisis de datos empresariales


Fuente: Shutterstock/256804045

¿Qué es análisis de datos?

Una definición muy formal podría darse más informadas, también suelen ser usa-
como el proceso de inspeccionar conjun- das por científicos e investigadores para
tos de datos e información que brindan verificar o refutar modelos científicos,
los agentes del mercado con el único fin teorías e hipótesis sobre condiciones que
de sacar conclusiones que lleven a mejo- establecen los mercados.
rar la calidad de la oferta de servicios, hoy
en día se hace con la ayuda de sistemas El simple análisis de datos parte desde
especializados y de software (muchos de el conocimiento de las métricas, saber en
estos con licencia de pago y otros muy qué forma o manera se
pocos de licencia abierta o gratuita). Las mide la información es
Conjeturas
tecnologías y técnicas de análisis de datos el punto de partida para Juicio que se forma de
se utilizan ampliamente en las industrias y establecer conjeturas con algo por indicios u ob-
empresas para permitir tomar decisiones la información disponible. servaciones.

Análisis de datos - eje 1 conceptualicemos 15


Variable Etiqueta Valores o medidas
Precio Precio del producto "X" Pesos colombianos
Cantidad Cantidad o número de objetos Número
Dir Dirección de correspondencia Código postal
Estrato Estratificación de la persona Número
Ingr Ingresos de la persona Pesos colombianos
Edad Número de años de la persona Número
Cuentas Posee o no cuentas corrientes Número

Tabla 4. Información de variables en métricas


Fuente: propia

Regularmente en las bases de datos las manual de etiquetas para cuando la base
variables se escriben con pocas letras, sim- de datos es gigante o usa demasiados datos
plemente se forman como una sola pala- como lo es la Gran encuesta manufactu-
bra, incluso a veces solo con iniciales, esto rera. Todo lo anterior puede ser denominado
depende -claro está- del administrador de la como la caracterización de la base de datos
base de datos que se familiariza con la infor- y se considera la primera etapa de la ana-
mación que entra para la digitación de esta. lítica. Muchas veces habrá que crear, codi-
Hay un establecimiento de etiquetas, que es ficar y sistematizar la información que es
donde regularmente se hace la descripción obtenida a diario y a partir de esto armar el
de todo tipo que puede tener la variable. En montaje en el software específico de utiliza-
los organismos estatales incluso se crea un ción, las bases de datos.

Tabla 5. Salida de base en el software SPSS


Fuente: Spss tutorials diseño de Ruben Geert Van der Berg

Análisis de datos - eje 1 conceptualicemos 16


Hay otro software de licencia como stata para análisis de datos y su forma de mostrar
bases de datos es:

Tabla 6. Salida de Base de datos en el software STATA


Fuente: Stata.org.uk

Hay muchos softwares más como R, Python, Tableau, SAS, que cada uno maneja a
disposición de su interfaz un gran grupo de variables e información. Cada uno tiene sus
ventajas y desventajas con respecto a otro, pero la analítica es la misma.

Otra de las fases del análisis de datos viene de los conceptos aplicados de la estadística,
los primeros son de orden descriptivo y los segundos ya de manera más formal como lo
son los inferenciales.

Análisis descriptivo (forma de análisis cuantitativo)

Tal como lo manifiesta el título, hace referencia a la descripción


como tal del dato. Tiene en cuenta los estadísticos más usados o de SE
Se usa la sigla por la conno-
origen, tal como el número de observaciones o tamaño de la mues- tación del software del uso
tra, muchas veces toma el código de (N), el siguiente es el promedio del lenguaje inglés. S.E sig-
nifica Standar Error o error
(Ῡ), su desviación estándar (SE), los valores máximos y mínimos que estándar del dato.
toma el dato y algunas veces la suma total de las observaciones.

Análisis de datos - eje 1 conceptualicemos 17


Ejemplo:

Identificación Ingresos manifestaron tener unos ingresos medidos


en dólares, se solicita establecer un análisis
1 $15.365,00 descriptivo de estos.
2 $18.455,00
El número de observaciones se deter-
3 $19.477,00
mina en este caso muy fácilmente, N es
4 $21.200,00 simplemente 5, porque son las cinco perso-
5 $17.432,00 nas que tenemos registro. El promedio de
ingreso de estas personas es de $ 18.385,80.
Tabla 7. Datos de ejemplo de métricas
Fuente: propia Para obtener el promedio simplemente
se calcula la suma total de valores dividido
Con los datos de la tabla, tome a con- por el número de observaciones que se
sideración que tenemos 5 personas, estas tiene en el registro:

La desviación estándar (SE), es un poco más complejo, pero podemos obtenerla de


forma manual si aplicamos:

Para este caso será específicamente de 2.188.047, lo que nos indica que habrá ingre-
sos por encima de la media con valor de 2188 y por debajo del promedio en la misma
proporción. La desviación nos dice que tanto se desvían las observaciones con respecto
al promedio. Si la desviación fuera baja, sabríamos que los datos u observaciones serán
muy comunes entre personas, lo que quiere decir que casi todos tienen un mismo nivel
de ingreso promedio, pero si esta es demasiado alta, podríamos encontrarnos con dife-
rentes ingresos de las personas de la base de datos y hablaríamos de mucha variabilidad
o varianza.

El valor máximo y mínimo nos indica qué nivel de ingreso en esta ocasión fue el más
alto y el más bajo dentro de las 5 personas que nos emitieron información. Simplemente
se organizan los datos, primero de mayor a menor y después sí de menor a mayor. Se
toma el primer dato de cada uno de estos.

Análisis de datos - eje 1 conceptualicemos 18


Ejemplo de mayor a menor:

$ 21,200.00 $ 19,477.00 $ 18,455.00 $ 17,432.00 $ 15,365.00

El ingreso más alto es el de $ 21.200, por tanto, el individuo número 4 es el que más
gana de todas las observaciones.

Ejemplo de menor a mayor:

$ 15,365.00 $ 17,432.00 $ 18,455.00 $ 19,477.00 $ 21,200.00

En este caso el menor es $ 15.365 que corresponde al individuo número 1. Muchas


veces, con tan solo una ordenación, si se miran los extremos de la organización de los
datos,puede establecerse quién es el menor y quién el mayor.

Por último, si queremos conocer la suma de todos los ingresos de las personas, eso
es simplemente sumando todos los datos proporcionados en la columna que para este
caso el valor es de $ 91.929.

En muchas ocasiones los softwares nos evitan los cálculos manuales, que pueden llegar
a convertirse en dispendiosos si la base ya contiene más del millón de observaciones, en
este caso hay que recurrir a la programación y salida de órdenes que se les da, para el
cálculo y resumen de métricas.

Ingresos
Media $ 18.385,80
Mediana $ 18.455,00
Moda NULL
Desviación estándar 2188,046777
Varianza de la muestra 4787548,7
Curtosis 0,084275904
Coeficiente de asimetría -0,192748948
Mínimo 15365
Máximo 21200
Suma 91929
N 5

Tabla 8. Resumen de estadísticas y métricas del ingreso


Fuente: propia

Análisis de datos - eje 1 conceptualicemos 19


El análisis de datos es más directo y com- brindan. Ante esto, es bueno presentar una
pacto y frente a las salidas de los programas hipótesis nula y una hipótesis alternativa.
y softwares se puede obtener un análisis
completo de forma automática. El trabajo Establezcamos que la hipótesis nula con-
del analista es interpretar las estadísticas. templa que el promedio de los ingresos de
las 5 personas es de $ 25.000. La hipótesis
alternativa contempla simplemente que en
realidad el promedio es distinto a esos $
25.000.

¿Cómo interpretaría el estu- Una forma matemática de establecer la


diante la tabla 8 a partir de las prueba es la siguiente:
estadísticas reportadas?

Las otras métricas tales como la


varianza, curtosis, moda y coeficiente de
asimetría, serán explicadas más adelante
en el desarrollo del curso, son complemento
del análisis descriptivo básico, pero de
forma más avanzada. Como queremos probar lo anterior y
dado que ya se conoce que el promedio
de ingresos estuvo cerca a los $ 18.335, se
Instrucción puede ir intuyendo que en realidad la hipó-
tesis nula va a ser rechazada. Para tener
certeza de esta apreciación, es necesario
Refuerza los conceptos aprendi-
saber cuándo usar las herramientas que la
dos con la actividad de aprendi-
estadística inferencial provee. En este caso
zaje “Memonota”, que encuen-
tras en la página principal del eje.
se utilizan las funciones de distribución y
las tablas estadísticas que soportan los
márgenes para poder rechazar o aceptar
la hipótesis nula de una forma más técnica.
Análisis de inferencia estadística
Una de estas formas es utilizar la
En los datos cuantitativos se pueden siguiente formula:
establecer pruebas de hipótesis, un ejem-
plo de esto suele pasar cuando queremos
mirar si un parámetro es o no significativo
con respecto a las observaciones que se

Parámetro En el análisis de estadística inferencial hay un gran uso avanzado


Dato o factor que se toma como necesario para analizar o va- de fórmulas para consultar libros como: métodos estadísticos
lorar una situación. aplicados a las ciencias sociales.

Análisis de datos - eje 1 conceptualicemos 20


Que nos arroja un estadístico específico Las zonas de color rojo corresponden a
por valor de -3199; que usaremos para con- las zonas donde hay que considerar recha-
trastar la hipótesis de que el promedio de zar la hipótesis nula, corresponderá a la
ingresos sea de 25.000. zona donde se empieza a decir que la media
de los ingresos no corresponde a $ 25.000, si
Para esto usamos una distribución t-Stu- esto ocurriera, estaríamos en la zona blanca
dent, la muestra es pequeña y nos ayuda a donde aparece (1 - alfa1) y por tanto esta-
testear la prueba. ríamos aceptando la hipótesis nula que el
promedio si es de $ 25.000. Construir o decir
desde donde empiezan las zonas, es refe-
renciar desde la tabla t-Student dado los
niveles de significancia del 95 % y que para
nuestra muestra lo haremos a continua-
ción en la siguiente figura, donde se hace
necesario establecer los grados de libertad
para esta parte es de (4), ya que esto es el
tamaño de las observaciones (5) restadas
de la unidad (1) nos arroja el valor de (4).

Resolviendo esta parte es de considerar


que la zona de rechazo empieza desde el
valor de (-2.13) hasta infinito negativo (-∞),
y desde (2.13) hasta infinito positivo (∞).
Para este punto conocemos que el valor de
prueba da (-3.199) siendo menor que el valor
Figura 8. Distribución t-Student en prueba critico de (-2.13) y por tanto cae en la zona
de inferencia de rechazo. Concluyendo que la media de
Fuente: propia los ingresos no corresponde a los $ 25.000.

Figura 9. Como obtener los límites de la prueba


Fuente: Moran (2015)

1
Alfa hace referencia al nivel de confianza de la prueba, regularmente en estadística los parámetros se rigen al 95 %
y para la construcción de la zona como es (1 - alfa) el valor de probabilidad es de 5 % o 0.05.

Análisis de datos - eje 1 conceptualicemos 21


Análisis de datos cualitativos

Los datos cualitativos como no son usados de forma numérica, deben ser analizados
de forma distinta con el uso de las métricas descriptivas. Tal como son muchas veces
caracteres o cadena de textos se suelen codificar de forma binaria para poder ser toma-
dos como números.

Ejemplo

Para la pregunta: análisis de este tipo de datos o información


se usa una herramienta en estadística que se
¿Usted fuma?
denomina frecuencia. Para hallar la frecuen-
Sí ____ No____ cia de respuesta de la observación simple-
mente hay que contar cuantos “SI” o “NO”
Para poder valorar las alternativas hay que fueron reportados en la base de datos.
darle valores a las codificaciones y a las res-
puestas obtenidas de las encuestas. En este Análisis: son 5 personas que tenemos en el
caso le daremos valor de (1) si la persona reporte, tan solo 3 de ellas respondieron que
fuma y de (0) si no lo hace. En una base de si fumaban y 2 que no lo hacían. Los softwa-
datos quedaría: res analizan la cuenta continua del número
en que se representa la información. Un
Fuma ejemplo de esto es:
Identificacion Fuma
codificado
1 SI 1 Fuma SI NO Total
2 SI 1 3 2 5
3 SI 1 Porcentaje 60% 40% 100%
4 NO 0 Tabla 10. Reporte en porcentajes de respuestas
5 NO 0 Fuente: propia

Tabla 9. Codificación de la variable Con lo que se concluye que el 60 % de


cualitativa fumar los individuos fuman y el 40 % no lo hace.
Fuente: propia Cuando se tienen más características de
respuesta u opciones, se puede codificar
Tome a consideración el primer dato de la de la forma de 1 hasta 5 o dependiendo
tabla 9, nos indica que el primer individuo la cantidad de respuestas que reporte el
fuma, dado que este individuo responde “SI”, informe y se calculan sus porcentajes de
lo valoramos como 1 en su respuesta. Para el ocurrencia.

Análisis de datos - eje 1 conceptualicemos 22


Video

Observemos el siguiente video como


referencia ampliada del tema que
estamos discutiendo.

Videorelato

Lectura recomendada

Para complementar, le invito a realizar la lectura


del apartado 7,2 del capítulo 7 de la lectura:

Métodos cuantitativos: herramientas para la


investigación en salud

Mariela Borda Pérez, leer el capítulo de La


estimación

Continuaremos con el eje 2 denominado Técnica del análisis de datos.

Análisis de datos - eje 1 conceptualicemos 23


Bibliografía

Borda, M. (2013). Métodos cuantitativos: herramientas para la investigación en


salud. Colombia: Universidad del Norte.

Connolly, T. y Begg, C. (2007). Sistemas de bases de datos. Estados Unidos:


Addison-Wesley.

Dalen, V., Deobold, B., y Meyer, W. (1996). Manual de técnicas de la investigación


educacional. Buenos Aires, Argentina: Editorial Paidós.

Elmasri, R., y Shamkant, B. (2001). Introducción a los sistemas de bases de datos.


Estados Unidos: Prentice Hall.
BIBLIOGRAFÍA

Festinger, L., y Katz, D. (1993). Los métodos de investigación en ciencias sociales.


México: Paidós.

Galindo, J. (1998). Técnicas de investigación en sociedad, cultura y comunicación.


México: Addison Wesley Longman.

Galindo, L. (1998). Sabor a ti: metodología cualitativa en investigación social.


Xalapa, México: Universidad veracruzana.

Gibbs, A. (1997). Focus groups. Estados Unidos: Social Research Update.

Hernández, F., García, M., y Maquilón, J. (2013). Metodologías de la investigación


en educación infantil y primaria. Recuperado de http://ocw.um.es/cc.-sociales /
metodologias-de-la-investigacion-en-educacion /material-de-clase-1/
t1.1.proceso.pdf

Puente, V. (2010). Estadística descriptiva e inferencial y una introducción al método


científico. Madrid, España: Editorial Complutense.

Render, B., Stair, R, y Hanna, M. (2009). Métodos cuantitativos para los negocios.
México: Pearson Prentice Hall.

Scribano, A. (2008). El proceso de investigación social cualitativo. Buenos Aires,


Argentina: Editorial Prometeo Libros.

Silberschatz, A., y Sudarshan, S. (2006). Fundamentos de bases de datos. México:


McGraw-Hill.

Taylor, S., y Bogdan, R. (1996). Introducción a los métodos cualitativos de


investigación. Barcelona, España: Paidos.

Taylor J., y Kinear T. (1996). Investigación de mercados. Informes sobre la


investigación. Estados Unidos: Mc Graw Hill.
Vallejo, J. (2001). El grupo de discusión: introducción a una práctica de investigación.
España: Editorial Ariel.

Zapata, A. (2003). Técnicas de márketing. Quito, Ecuador: Editorial Pearson.


BIBLIOGRAFÍA