Estadística
Forense ll
Ciencia Forense
Ejecutivo
Ing. Ricardo Ronquillo.
Alicia Melendez Guerrero.
M. 303139.
Temario
Unidad 1 Bases matemáticas
1.1Definir las bases cuantitativas de las ciencias forenses
1.1.1 Representación y escalas de medición (unidades y transformaciones).
1.1.2 Medidas de la incertidumbre
1.2 Definir las funciones matemáticas
1.2.1 Manipulación algebraica de funciones y sistema de ecuaciones
1.2.2 Función polinomial, función cuadrática, función logarítmica, función exponencial
1.2.3 Aplicación: la escala del pH y refrigeración de cuerpos postmortem.
1.3 Aplicar los métodos trigonométricos en ciencias forenses.
1.3.1 Teorema de Pitágoras, funciones y reglas trigonométricas.
1.3.2 Aplicación: tamaños y distancias.
1.3.3 Análisis de Ricochet.
1.3.4 Aplicación: aspectos balísticos.
1.3.5 Aplicación: suicidio, accidente o muerte.
1.3.6 Aplicación: formas y patrones de manchas.
Unidad 2 Creación de bases de datos y ambientes informáticos
2.1 Crear y editar bases de datos implementando variables de naturaleza cuantitativa y
cualitativa.
2.1.1 Tipos de variables y bases de datos.
Unidad 3 Estadística descriptiva
3.1 Conocer el tratamiento para el análisis descriptivo de variables cualitativas (nominales y
ordinales) y cuantitativas (discretas y continuas).
3.1.1 Tablas de frecuencia, tablas de contingencia y gráficas.
3.1.2 Medidas de tendencia central, dispersión y gráfica.
Unidad 4 Probabilidad
4.1 Conocer las diferentes funciones de probabilidad.
4.1.1 Distribución de probabilidades y funciones de densidad.
4.1.2 Aplicación: cotejo de evidencia y unicidad de la evidencia.
4.1.3 Aplicación: genética forense.
Unidad 5 Contrastes de hipótesis para una población
5.1 Verificar hipótesis para la comparación de variables en una población.
5.1.1 Pruebas t-de student, signo y Wilcoxon
Unidad 6 Contrastes de hipótesis para dos poblaciones
6.1 Verificar hipótesis para la comparación de variables de dos poblaciones.
6.1.1 Pruebas t de student, U-de MannWhitney y Wilcoxon.
Unidad 7 Contrastes de hipótesis para más de dos poblaciones
7.1 Verificar hipótesis para la comparación de variables de más de dos poblaciones.
7.1.1 Pruebas de Análisis de Varianza y pruebas Post-Hoc, Kruskal-Wallis y Friedman.
Unidad 8 Análisis de correlación
8.1 Probar la independencia y/o asociación entre variables
8.1.1 Correlación lineal simple de Pearson.
8.1.2 Prueba Ji-cuadrado de Pearson, V de Cramer y Coeficiente Phi.
Unidad 9 Estadística y significancia de la evidencia
9.1 Aplicar la estadística inferencial a la ciencia forense.
9.1.1 Un estudio de caso en la interpretación y el significado de las pruebas forenses.
9.1.2 Bases probabilísticas para interpretar evidencia.
9.1.3 La probabilidad de aceptar la acusación dada la evidencia.
9.1.4 Transferencia de evidencia.
9.1.5 Aplicación: doble muerte de cuna o asesinato doble.
Unidad 10 Conceptos Básicos en demografía
10.1 Establecer las diferencias y relaciones entre los conceptos demografía y población, así
como conocer las principales teorías sobre población.
10.1.1 Concepto de Demografía.
10.1.2 Concepto de Población.
10.1.3 Teorías sobre Población.
10.1.3.1 Malthus.
10.1.3.2 Marx.
10.1.3.3 Transición demográfica.
10.1.3.4 Relación de la demografía con otras disciplinas.
10.1.3.5 Relación de la demografía con la Ciencia Forense.
Unidad 11 Fuentes Demográficas
11.1 Describir las principales fuentes de información demográfica y aplicar técnicas de
evaluación de la calidad de los datos.
11.1.1 Censos y conteos de población.
11.1.1.1 Índice de Whipple.
11.1.1.2 Índice de Naciones Unidas.
11.1.2 Encuestas. Estadísticas Vitales.
11.1.3 Otras fuentes de información.
Unidad 12 Crecimiento de población
12.1 Identificar los principales modelos de crecimiento de la población y aplicarlos en la
proyección de datos poblacionales.
12.1.1 La ecuación fundamental del cambio de población.
12.2 Describir el crecimiento de la población.
12.2.1 Crecimiento de la población.
12.2.1.1 Modelo aritmético.
12.2.1.2 Modelo geométrico.
12.2.1.3 Modelo exponencial.
12.2.1.4 Modelo logístico.
12.3 Establecer la estructura de la población.
12.3.1 Estructura de la población.
12.3.1.1 Pirámide poblacional.
12.3.1.2 Proyecciones.
Unidad 13 Indicadores demográficos básicos
13.1 Describir la manera en que se construyen y calculan los principales indicadores
demográficos y su aplicación en ciencia forense.
13.1.1 Cocientes.
13.1.1.1 Proporción.
13.1.1.2 Razón.
13.1.1.3 Tasa.
13.1.1.4 Probabilidad.
13.1.2 Aplicaciones de cálculo de cocientes demográficos.
13.1.2.1 Proporciones: sexo, edad, causa de muerte, tipo de crimen, localidad.
13.1.2.2 Razones: por sexo, edad, estrato social, tipo de crimen.
13.1.2.3 Tasas: natalidad, mortalidad, criminalidad, por tipo de delito, accidente.
13.1.2.4 Probabilidad: muerte a edad específica, de ocurrencia de delitos.
Unidad 14 Análisis de Mortalidad
14.1 Identificar, calcular y analizar los principales indicadores del fenómeno de la mortalidad y
su aplicación a ciencias forenses para medir el impacto de muertes relacionadas con aspectos
criminales.
14.1.1 Introducción y conceptos.
14.1.2 Fuentes de datos para medir la mortalidad.
14.1.3 Medidas de Mortalidad.
14.1.3.1 Tasa bruta de mortalidad.
14.1.3.2 Tasas de mortalidad por edad y sexo.
14.1.4 Mortalidad por causas.
14.1.5 Mortalidad infantil.
14.1.6 Tabla de mortalidad.
14.1.6.1 ¿Qué es una tabla de mortalidad?
14.1.6.2 Cálculo de probabilidad de muerte.
14.1.6.3 Relación entre tasas de mortalidad y probabilidad de muerte.
14.1.6.4 Años persona vividos.
14.1.6.5 Esperanza de vida.
14.1.6.6 Interpretación y uso de la tabla de mortalidad.
14.1.7 Uso de tabla de mortalidad para cálculo de años perdidos por causas relacionadas
con crímenes, accidentes, suicidios.
14.1.8 Morbilidad.
14.1.9 Teoría de la transición epidemiológica.
Unidad 1
Bases matemáticas
1.1 definir las bases cuantitativas de las ciencias forenses.
La investigación cuantitativa es esencial, otros métodos de investigación también pueden ser
muy beneficiosos.
La investigación cuantitativa suele conllevar análisis estadísticos de información en forma de
valores numéricamente mensurables.
Existen dos paradigmas predominantes en los ámbitos epistemológico (el conocimiento y cómo
se obtiene) y ontológico (el ser en sí). Estos son: el positivismo (investigación cuantitativa)
La ontología positivista sostiene que existe una única realidad objetiva que es externa al
investigador. Así, esta no estaría influenciada de ninguna manera por la perspectiva individual
del investigador. El positivismo solo considera mensurables los fenómenos observables.
Consecuentemente, la investigación cuantitativa tiene como objetivo ejecutar análisis
estadísticos de una realidad única, objetiva y estática.
Este paradigma busca construir socialmente el conocimiento, indagando en cómo las personas
dan cuenta del mundo en el que viven. La investigación cualitativa tiene una estructura menos
rígida, pudiendo ser reactiva y flexible para responder y adaptarse a los hallazgos según avanza
la investigación.
Así pues, varios factores contribuyen potencialmente al predominio de la investigación
cuantitativa, al considerarla más objetiva y precisa. Entre estos encontramos, por ejemplo, el
énfasis en el rigor científico de la investigación y las decisiones.
Entonces ¿por qué más investigaciones cualitativas serían beneficiosas para las ciencias
forenses?
Uno de los beneficios radicaría en que, al tratarse de una disciplina relativamente nueva, las
investigaciones cualitativas pueden usarse para preguntarnos “qué” necesita ser estudiado.
La teoría fundamentada propone que todas las hipótesis se derivan del análisis de los datos
recopilados en sí, en contraste con el enfoque cuantitativo, donde la hipótesis es descrita antes
de la investigación.
1.1.1 representación y escalas de medición (unidades y transformaciones).
La medición es un proceso inherente y consustancial a toda investigación, sea ésta cualitativa
o cuantitativa. Medimos principalmente variables y ello demanda considerar tres elementos
básicos: el instrumento de medición, la escala de medición y el sistema de unidades de
medición. La validez, consistencia y confiabilidad de los datos medidos dependen, en buena
parte, de la escala de medición que se adopte. La medición es el proceso de asignar, según
reglas bien definidas, números a propiedades de objetos.
Podría decirse también que medir es estimar la magnitud de cierta propiedad de uno o más
objetos con ayuda de un sistema métrico específico (instrumento de medición, escala de
medición y unidades de medición). Las propiedades a que se hace referencia, son aspectos
observables o características propias del mundo empírico.
Una propiedad puede ser expresada en términos cualitativos o cuantitativos, o en ambos, si
hacemos reducción de los segundos a los primeros. Por ejemplo, rural y urbano, alfabeto y
analfabeto, son propiedades expresadas al modo cualitativo, en categorías no ordenadas; la
mortalidad infantil se expresa cuantitativamente por medio de los valores de la tasa
correspondiente, por ejemplo 60 x 1000, y estos valores a su vez pueden reducirse a expresión
cualitativa si los transformamos en las categorías de baja, moderada o alta mortalidad infantil.
Las mediciones, en términos de rangos ordenados, están a medio camino entre los dos tipos
anteriores, el cualitativo y el cuantitativo, y los expresamos en términos de ‘mayor que’ y
‘menor que’.
Escalas o niveles de medición
La medición incluye la evaluación, un proceso mediante el cual las cosas se diferencian. No está
limitada al uso de instrumentos altamente desarrollados y refinados. Desde luego,
termómetros, metros y cronómetros pueden utilizarse para medir de manera precisa
temperatura, distancia y tiempo. Sin embargo, esas variables pueden también medirse de
manera informal mediante la observación –por el «ojo entrenado» u «ojo clínico»–.
Las escalas o niveles de medición se utilizan para medir variables o atributos. Por lo general, se
distinguen cuatro escalas o niveles de medición: nominal, ordinal, intervalos y escalas de
proporción, cociente o razón. Las dos primeras (nominal y ordinal) se conocen como escalas
categóricas, y las dos últimas (intervalo y razón) como escalas numéricas. Las escalas
categóricas se usan comúnmente para variables cualitativas, mientras que las numéricas son
adecuadas para la medición de variables cuantitativas.
Escala nominal
Es la escala más elemental y la forma más rudimentaria de medir. En una escala como estas se
clasifica a las unidades de estudio (objetos, personas, etc.) en categorías, basándose en una o
más características, atributos o propiedades distintivas y observadas, dándole a cada categoría
un nombre (de ahí lo de «nominal»).
Ejemplo:
• El genero
• Lugar de nacimiento
• Numero de seguridad social
• Números asignados a corredores
Escala ordinal
Una escala de medición ordinal se logra cuando las observaciones pueden colocarse en un
orden relativo con respecto a la característica que se evalúa, es decir, las categorías de datos
están clasificadas u ordenadas de acuerdo con la característica especial que poseen. Aquí, las
etiquetas o símbolos de las categorías sí indican jerarquía. Si utilizamos números, la magnitud
de estos no es arbitraria, sino que representa el orden del rango del atributo observado.
Ejemplo:
• Calificaciones de un profesor de finanzas.
• Ordenamiento por rango de los ganadores.
• Clasificación de la calidad Preparación académica.
• Su número de lista en clase Clase social.
Escala de proporción o razón
Llamadas también escalas de cocientes. Estas escalas tienen las propiedades de las ordinales y
de intervalo (intervalos iguales entre categorías y aplicación de las operaciones aritméticas
básicas y sus
derivaciones), pero, además, el cero es real, es absoluto, no es arbitrario. Es decir, el cero
representa la ausencia de la característica en cuestión; en consecuencia, los números pueden
compararse como proporciones y nos permite indicar cuántas veces es más grande un objeto
que otro, además de señalar la cantidad en que difieren.
Ejemplo:
• Talla de ropa para dama.
Escala de intervalos
Las escalas de intervalo o cardinales son más refinadas puesto que además del orden o
jerarquía entre categorías, las etiquetas o números consecutivos establecen intervalos iguales
en la medición (las distancias entre categorías son las mismas a lo largo de toda la escala). La
medición en una escala de intervalos se basa en suponer que puede conocerse exactamente
la diferencia entre los objetos medidos según esta escala. Esto es, debe ser posible asignar un
número a cada objeto de modo tal que la diferencia entre los objetos quede reflejada por la
diferencia entre los números asignados.
Ejemplo:
• Temperatura en grados C
Rendimiento de 0 a 10.
1.1.2 medidas de la incertidumbre.
El término incertidumbre aparece asociado siempre a la medida de magnitudes. La
incertidumbre es una medida cuantitativa de la calidad del resultado de medición, que permite
que los resultados de medida sean comparados con otros resultados, referencias,
especificaciones o normas.
La incertidumbre del resultado de un ensayo debe tenerse en cuenta al interpretar los
resultados del mismo, es necesario dar intervalos de confianza para ciertas magnitudes, siendo
los métodos de evaluación de incertidumbre capaces de calcular esos intervalos de confianza.
Cuestionario 1
1.- cual es el enfoque en una investigación cuantitativa?
Es usar la recolección de datos para probar hipótesis con bases en la medición numérica
y el análisis estadístico.
2.- Cuales son los tres elementos básicos en la medición de toda investigación?
Instrumento de medición, la escala de medición, el sistema de unidad de medición.
3.- Cuales son las escalas de medición que por lo general se utilizan?
Escala nominal, Escala de razón, Escala ordinaria, Escala de intervalos.
4.- Como se conoce a la escala nominal y a la escala ordinal?
Se conocen como escalas categóricas.
5.- Son conocidas como escalas numéricas?
La escala de intervalo y la escala de razón
6.- Cuales escalas se utilizan en la medición de variables cuantitativas?
Son conocidas como numéricas
7.- Para que sirven las escalas categóricas?
Para la medición de valores cuantitativos.
8.- Que es la escala nominal?
Es la escala mas elemental y la forma más común de medir porque clasifica las unidades
de estudio en categorías basándose en una o más características.
9.- Esta escala tiene propiedades de las ordinales y de intervalos y también es llamada
escala de conocimientos?
Escala de razón
10.-Como se define la incertidumbre de una medida?
Como el parámetro asociado al resultado de una medición.
Unidad 2
Creación de bases de datos y ambientes informáticos
Uno de los objetivos fundamentales de un sistema de información es contar no sólo con
recursos de información, sino también con los mecanismos necesarios para poder encontrar y
recuperar estos recursos.
De esta forma, las bases de datos se han convertido en un elemento indispensable no sólo para
el funcionamiento de los grandes motores de búsqueda y la recuperación de información a lo
largo y ancho de la Web, sino también para la creación de sedes web, Intranets y otros sistemas
de información en los que se precisa manejar grandes o pequeños volúmenes de información.
La creación de una base de datos a la que puedan acudir los usuarios para hacer
consultas y acceder a la información que les interese, lo convierte en una herramienta
imprescindible de cualquier sistema informativo sea en red o fuera de ella.
Una base de datos es una colección de datos organizados y estructurados según un
determinado modelo de información que refleja no sólo los datos en sí mismos, sino también
las relaciones que existen entre ellos.
Una base de datos se diseña con un propósito especifico y debe ser organizada con una lógica
coherente. Los datos podrán ser compartidos por distintos usuarios y aplicaciones, pero deben
conservar su integridad y seguridad al margen de las interacciones de ambos.
La definición y descripción de los datos han de ser únicas para minimizar la redundancia y
maximizar la independencia en su utilización.
En una base de datos, las entidades y atributos del mundo real, se convierten en registros y
campos. Estas entidades pueden ser tanto objetos materiales como libros o fotografías, pero
también personas e incluso, conceptos e ideas abstractas. Las entidades poseen atributos y
mantienen relaciones entre ellas.
2.1 Crear y editar bases de datos implementando variables de naturaleza cuantitativa y
cualitativa.
Base de datos cuantitativos.
1.- Estas enterado sobre el virus del covid-19
Si
No
2.- sabes sobre los síntomas del covid-19
Si
No
3.- piensa que está bien vacunarnos sobre el covid-19
Si
No
Respuesta Si Respuesta No
Pregunta 1 18 2
Pregunta 2 10 10
Pregunta 3 14 6
PREGUNTA PREGUNTA PREGUNTA
1 2 3
si no si no si no
10%
30%
50% 50%
70%
90%
Base de datos cuantitativos.
1.- cual crees que es el mayor motivo de muertes en México
A} por el narcotráfico
B} por la obesidad
C} por la razón de género.
2.- porque crees que existe el narcotráfico en México
A} por la corrupción
B} porque los salarios son mal pagados.
C} no hay trabajo.
3.- porque hay tanto feminicidio en el estado de chihuahua.
A} por falta de educación
B} porque las mujeres no se cuidan
C} por culpa del gobierno.
Respuesta A Respuesta B Respuesta C
Pregunta 1 1 2 7
Pregunta 2 6 8 6
Pregunta 3 13 1 6
PREGUNTA 1 PREGUNTA 2 PREGUNTA 3
A B C A B C A B C
2.1.1 Tipos de variables y bases de datos.
Una variable estadística es una característica que puede fluctuar y cuya variación es susceptible
de adoptar diferentes valores, los cuales pueden medirse u observarse. Las variables adquieren
valor cuando se relacionan con otras variables, es decir, si forman parte de una hipótesis o de
una teoría. En este caso se las denomina constructos o construcciones hipotéticas.
Tipos de variables
Existen diferentes tipos de variables: cualitativa nominal, cualitativa ordinal, cuantitativa
continua, cuantitativa discreta
Según el nivel de medición o también según el criterio metodológico, 1 pueden ser:
Variables cualitativas
Son el tipo de variables que como su nombre lo indica expresan distintas cualidades,
características o modalidad. Cada modalidad que se presenta se denomina atributo o categoría,
y la medición consiste en una clasificación de dichos atributos. Las variables cualitativas pueden
ser dicotómicas cuando sólo pueden tomar dos valores posibles, como sí y no, hombre y mujer
o ser politómicas cuando pueden adquirir tres o más valores. Dentro de ellas podemos
distinguir: Variable cualitativa ordinal o variable cuasicuantitativa: La variable puede tomar
distintos valores ordenados siguiendo una escala establecida, aunque no es necesario que el
intervalo entre mediciones sea uniforme, por ejemplo: leve, moderado, fuerte. Variable
cualitativa nominal: En esta variable los valores no pueden ser sometidos a un criterio de orden,
como por ejemplo los colores o el lugar de registro
Por ejemplo: realizas preguntas abiertas, estarás generando datos cualitativos puesto
que estás pidiendo a los encuestados una descripción del tema en cuestión:
Variables cuantitativas
Son las variables que toman como argumento cantidades numéricas, son variables
matemáticas. Las variables cuantitativas además pueden ser: Variable discreta: Es la variable
que presenta separaciones o interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores entre los distintos valores
específicos que la variable pueda asumir. Ejemplo: El número de hijos (1, 2, 3, 4, 5). Variable
continua: Es la variable que puede adquirir cualquier valor dentro de un intervalo especificado
de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o la altura (1,64 m, 1,65 m, 1,66 m,...),
o el salario. Solamente se está limitado por la precisión del aparato medidor, en teoría permiten
que exista indefinidos valores entre dos variables.
Según la influencia que le asignemos a unas variables sobre otras, estas podrán ser:
Por ejemplo, obtén datos cuantitativos en una pregunta donde los encuestados tengan como
opción para contestar "SI" o "NO" o las clásicas preguntas cerradas.
Variables independientes:
Una variable independiente es aquella cuyo valor no depende de otra variable. Es aquella
característica o propiedad que se supone es la causa del fenómeno estudiado. En investigación
experimental se llama así a la variable que el investigador manipula. Las variables
independientes son las que el investigador escoge para establecer agrupaciones en el estudio,
clasificando intrínsecamente a los casos del mismo. Un tipo especial son las variables de control,
que modifican al resto de las variables independientes y que de no tenerse en cuenta
adecuadamente pueden alterar los resultados por medio de un sesgo. La variable
independiente se suele representar en el eje de abscisas. La variable independiente es la que
se le asignan valores arbitrarios
Variable dependiente:
Una variable dependiente es aquella cuyos valores dependen de los que tomen otra variable.
La variable dependiente es una función que se suele representar por la y. La variable
dependiente se representa en el eje ordenadas. Son las variables de respuesta que se observan
en el estudio, y que podrían estar influidas por los valores de las variables independientes.
Hayman (1974 : 69) la define como propiedad o característica que se trata de cambiar mediante
la manipulación de la variable independiente. La variable dependiente es el factor que es
observado y medido para determinar el efecto de la variable independiente.
Variable interviniente:
Son aquellas características o propiedades que, de una manera u otra, afectan el resultado que
se espera y están vinculadas con las variables independientes y dependientes. Y es muy similar
a la variable moderadora aunque no son iguales solo son muy similares a la forma de
relacionarlas.
Variable moderadora:
Según Tuckman: Representan un tipo especial de variable independiente, que es secundaria, y
se selecciona con la finalidad de determinar si afecta la relación entre la variable independiente
primaria y las variables dependientes.
Tipos de bases de datos
Existen muchos tipos diferentes de bases de datos. La mejor base de datos para una
organización específica depende de cómo pretenda la organización utilizar los datos.
Bases de datos relacionales.
Las bases de datos se hicieron predominantes en la década de 1980. Los elementos de una
base de datos relacional se organizan como un conjunto de tablas con columnas y filas. La
tecnología de bases de datos relacionales proporciona la forma más eficiente y flexible de
acceder a información estructurada.
Bases de datos orientadas a objetos.
La información de una base de datos orientada a objetos se representa en forma de objetos,
como en la programación orientada a objetos.
Bases de datos distribuidas.
Una base de datos distribuida consta de dos o más archivos que se encuentran en sitios
diferentes. La base de datos puede almacenarse en varios ordenadores, ubicarse en la misma
ubicación física o repartirse en diferentes redes.
Almacenes de datos. Un repositorio central de datos, un data warehouse es un tipo de base
de datos diseñado específicamente para consultas y análisis rápidos.
Bases de datos orientadas a grafos.
Una base de datos orientada a grafos almacena datos relacionados con entidades y las
relaciones entre entidades.
Unidad 3 Estadística descriptiva
Estadística descriptiva
La estadística descriptiva es, junto con la inferencia estadística o estadística inferencial, una de las dos
grandes ramas de la estadística. Su propio nombre lo indica, trata de describir algo. Pero no describirlo de
cualquiera forma, sino de manera cuantitativa. Pensemos en el peso de una caja de verduras, en la altura
de una persona o en la cantidad de dinero que gana una empresa. De estas variables podríamos decir
muchas cosas. Por ejemplo, podríamos indicar que esta o aquella caja de tomates pesan mucho o pesan
menos que otras. Siguiendo con otro ejemplo, podríamos decir que el ingreso de una empresa varía
mucho a lo largo del tiempo o que una persona tiene una altura promedio.
Para dictar las afirmaciones anteriores, sobre mucho, poco, alto, bajo, muy variable o poco variable
necesitamos variables de medidas. Esto es, necesitamos cuantificarlas, ofrecer un número. Con esto en
mente, podríamos utilizar los gramos o los kilogramos como unidad de medida para saber el peso de
tantas cajas de tomates como consideremos. Una vez pesemos treinta cajas, sabremos cuales pesan más,
cuales pesan menos, que cuantía es la que más se repite o si existe mucha disparidad entre los pesos de
las diferentes cajas.
Con esta idea nace la estadística descriptiva, con la de recoger datos, almacenarlos, realizar tablas o
incluso gráficos que nos ofrezcan información sobre un determinado asunto. Adicionalmente, nos ofrecen
medidas que resumen la información de una gran cantidad de datos.
Ejemplos de estadística descriptiva
Un ejemplo de estadística descriptiva sería cuando queremos calcular la media de goles por partido de un
futbolista. Se trata de estadística descriptiva, ya que tratamos de describir una variable (número de goles).
En este caso, mediante el cálculo de una métrica.
Así pues, decir que Ronaldo metió 1,05 goles por partido durante los últimos 30 partidos, es una frase
propia de estadística descriptiva.
También podríamos decir, por ejemplo, que el 30% de los compañeros de clase de Juan tienen los ojos
azules, el 60% castaños y el 10% restante negros. Se trataría de una variable cualitativa (color de ojos),
pero estamos describiendo la frecuencia con la que aparece.
3.1 Conocer el tratamiento para el análisis descriptivo de variables cualitativas (nominales y ordinales) y
cuantitativas (discretas y continuas).
Según los valores que tomen las variables aleatorias se clasifican en cualitativas o cuantitativas. Las
variables cualitativas, categóricas o atributos son aquellas que no se pueden asociar de forma natural a
un número, por lo que no es apropiado realizar operaciones algebraicas con ellas. Sin embargo, no es
infrecuente que se asignen códigos numéricos a los valores de una variable cualitativa cuando se vuelcan
en una base de datos, aunque la magnitud de tales números no es relevante. Tal maniobra de codificación
puede contribuir a minimizar los errores de tecleo, facilitar el manejo de los datos y favorecer en general
la manipulación de la información. Las variables categóricas, a su vez, se dividen en nominales y ordinales
en función de la escala de medida. La escala nominal es aquella que permite distinguir categorías,
definiendo si una es igual o distinta de otra, pero sin establecer un orden entre ellas; es el caso del grupo
sanguíneo de una persona, la raza o su país de residencia. Una variable nominal con sólo dos categorías
se llama dicotómica, y concierne generalmente a la presencia o no de una determinada característica (e.g.,
fuma-no fuma). La escala ordinal permite, además de distinguir categorías, establecer un orden entre
ellas, aunque sin entrañar diferencias métricas entre las categorías. Ejemplos de este tipo son: la
intensidad de dolor (ausente, leve, moderado y fuerte) o los grados militares (soldado, sargento, teniente,
etc). Este último ejemplo permite ver con claridad un rasgo caracterizador de las variables ordinales: si
todos los sujetos pasaran a estar en la siguiente categoría contigua, las relaciones de subordinación se
mantendrían sin cambios. Las variables cuantitativas o numéricas son aquellas que adoptan valores
numéricos. Según los valores que pueden tomar, se clasifican a su vez en discretas y continuas. Si un
conjunto de observaciones numéricas, cuando se dibujan en una escala numérica, pueden situarse sólo
en ciertos puntos aislados y no en los puntos intermedios, entonces se dice que es un conjunto de datos
discretos; estas variables suelen tomar valores enteros como consecuencia de la acción de contar; un
ejemplo es el número de cigarrillos fumados al día. Si un conjunto de observaciones puede caer,
teóricamente, en cualquier lugar de un intervalo de una escala numérica, entonces se dice que es un
conjunto de datos continuos, tal y como ocurre con la estatura de una persona. Una manera de distinguir
las variables continuas de las restantes consiste en lo siguiente: si x1 y x2 son dos valores posibles para la
variable, entonces cualquier valor real intermedio que se ubique entre dichos valores, también es posible.
Una persona puede tener 4 hijos y otra puede tener 5; pero nadie puede tener 4,3 hijos por ejemplo (se
trata de una variable discreta). Es posible transformar las variables cuantitativas en cualitativas mediante
un proceso de categorización; es decir, creando categorías a partir de los valores que toma la variable. Por
ejemplo, la edad de una persona en años se podría categorizar en los siguientes grupos de edad: menores
de 20 años, de 20 a 39, de 40 a 59 y 60 años o más; de esta forma, en este ejemplo, se pasa de una variable
cuantitativa discreta a una cualitativa ordinal. Las variables medidas en un conjunto de individuos se
pueden describir mediante tablas que resumen sus valores, bien empleando técnicas gráficas, bien
calculando medidas numéricas de resumen.
• Variable cualitativa: Hace referencia a una cualidad. Ejemplos: el color de ojos de una
persona o el color de pelo.
• Variable cuantitativa: Hace referencia a una medida cuantitativa. Ejemplos: la altura de
una persona en centímetros o el peso de una persona en kilogramos.
3.1.1 Tablas de frecuencia, tablas de contingencia y gráficas.
La tabla de frecuencias (o distribución de frecuencias) es una tabla que
muestra la distribución de los datos mediante sus frecuencias. Se utiliza
para variables cuantitativas o cualitativas ordinales.
La tabla de frecuencias es una herramienta que permite ordenar los datos
de manera que se presentan numéricamente las características de la
distribución de un conjunto de datos o muestra.
Tipos de frecuencias
Frecuencia absoluta: Es el número total de veces que se repite una observación. En
ocasiones las observaciones se pueden presentar en intervalos
• Frecuencia relativa: Es el número en porcentaje que se repite una observación o
un conjunto de ellas.
• Frecuencia acumulada: Puede ser relativa acumulada o absoluta acumulada.
Indica la cantidad acumulada hasta cierta observación.
¿Qué es una tabla de contingencia?
Una tabla de contingencia es una tabla que cuenta las observaciones por múltiples
variables categóricas. Las filas y columnas de las tablas corresponden a estas variables
categóricas.
Por ejemplo, después de una elección reciente entre dos candidatos, una encuesta de
salida registró el sexo y el voto de 100 electores seleccionados de manera aleatoria y
los datos se tabularon de la siguiente manera:
Un gráfico es una representación visual figurativa que describe conceptos y relaciones.
Los gráficos estadísticos plasman datos conceptuales o numéricos y muestran la
relación que estos datos poseen entre sí.
Por ejemplo: gráficos de barras, gráficos circulares, gráficos de dispersión.
Gráfica de barras
La gráfica de barras organiza los datos en barras rectangulares, lo que hace que sea
fácil comparar datos relacionados. Las barras son un tipo de gráficas muy popular
porque la mayoría de la gente está familiarizada con la manera de escanearlas
rápidamente.
Conoce los tipos de gráficas de barras.
Gráfica de Mapas
Las visualizaciones de mapas organizan los datos geográficamente. Si tu dashboard de
ventas está mostrando las ventas mensuales, podría ser útil ver las ubicaciones
geográficas de tus clientes.
Sin embargo, si el dashboard está mostrando las ventas diarias, el gráfico de
mapa puede ofrecer menos valor para el día a día del usuario.
Gráficos de líneas
Entre los tipos de gráficas también están las llamadas gráficas de líneas, los
cuales visualizan los datos en un formato compacto y preciso que hace que sea fácil
para los usuarios escanear rápidamente la información para comprender las tendencias.
También es necesario utilizar adecuadamente el color en esta visualización porque las
líneas de diferentes colores pueden hacer que analizar la información sea aún más fácil
para los usuarios.
Diagrama de dispersión
Las gráficas de dispersión generalmente no son la forma más clara para escanear la
información, por lo tanto, si los datos visualizados se muestran en un dashboard en una
pantalla de televisión, será difícil comprender rápidamente las medidas cuantitativas
presentadas.Los tipos de gráficas de dispersión son más útiles para visualizar datos que
contengan medidas cuantitativas que cambian con frecuencia, ya que el usuario se
beneficiará al observar estos cambios diariamente.
Sparklines (minigráficos)
Los minigráficos o sparklines son sin duda de los mejores tipos de gráficas para mostrar
las tendencias en un dashboard con muchas métricas, debido a lo compacto que
son. Es importante que te asegures de que tu audiencia sepa cómo leer los minigráficos
para optimizar su uso. Para facilitar la comprensión, considera agregar indicadores a
un costado que le den una perspectiva más profunda a los datos.
Aquí algunos consejos para una mejor visualización de datos.
Gráfica de pastel o circular
Todos tenemos una relación de amor-odio con la gráfica de pastel ya que son fáciles
de leer y entender porque la relación de las partes de un todo es evidente. Pero los
expertos en visualización de datos dicen que no deberían usarse porque el porcentaje
de cada sección no es obvio si no se le agregan valores numéricos.
Gráfica de bala o indicadores
La gráfica de balas es distinta a otras visualizaciones de datos porque
generalmente solo comparan dos valores: un valor actual y sus escala para determinar
si es bueno o malo (generalmente indicado mediante un valor
objetivo).Independientemente de lo que mida, siempre sabrás podrás conocer tu
rendimiento actual y saber si estás cumpliendo el objetivo. En estos tipos de gráficas
puedes utilizar indicadores y texto en el gráfico.
Gráfica de tablas
Las tablas organizan los datos en filas y columnas. Son excelentes tipos de gráficas para
visualizar datos porque puedes mostrar tanto puntos de datos como gráficos, por
ejemplo, gráficos de balas, iconos y sparklines. Las gráficas de tablas algunas veces
pueden ser abrumadoras dependiendo de la cantidad de datos que elijas mostrar en
tu dashboard. Es importante encontrar un buen equilibrio entre los datos para que no
sea confuso, y tampoco utilizar muy pocos datos, para evitar que se desperdicie espacio
en el dashboard.
Gráfica de embudo
El gráfico de embudo muestra los valores en proporciones gradualmente decrecientes.
En este tipo de gráficas los datos se muestran como un valor para cada etapa, o como
un porcentaje de conversión, o ambos. El uso de esta gráfica es ideal para los datos
de Marketing y Ventas, como la conversión de clientes potenciales, o cualquier otro
valor que pueda ser desglosado categóricamente y comparado con el panorama
general.
Gráfica de gauge
La gráfica de gauge o medidor radial te ayuda a representar si un valor de datos está
dentro de un rango aceptable o no. La ventaja de este gráfico reside en que es fácil
de interpretar. Utiliza varios colores para dividir una escala en segmentos que
representan diferentes valores de la misma métrica, y utiliza una aguja para señalar un
determinado valor. En la mayoría de los casos, estos colores suelen mostrar el valor
máximo, el medio y el mínimo de los datos para visualizar rápidamente su rendimiento
en función de una tendencia
Gráfica de burbuja
Una gráfica de burbujas es una variación de un gráfico de dispersión en el que los
puntos de datos se sustituyen por burbujas. Por ejemplo, se puede utilizar un gráfico
de burbujas en lugar de un gráfico de dispersión si los datos tienen tres conjuntos de
datos; cada conjunto contiene un conjunto de valores. El tamaño de las burbujas indica
los valores del tercer conjunto de datos.
Gráfico de mapa de calor
Un gráfico de mapa de calor es una representación gráfica de datos en la que los
valores individuales contenidos en una matriz se representan como colores. Los
puntos de datos están definidos por la intersección de los ejes X (eje de abscisas) e Y
(eje de ordenadas) y un tercer valor que determina el color del punto de datos.
Los valores de los datos aparecen como recuadros en el mapa de calor. El tamaño y
el color de cada cuadro están determinados por los datos de ese elemento.
Aquí más información sobre cómo hacer una representación gráfica de datos.
3.1.2 Medidas de tendencia central, dispersión y gráfica.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en
un solo valor a un conjunto de valores. Representan un centro en torno al cual se
encuentra ubicado el conjunto de los datos. Las medidas de tendencia central más
utilizadas son: media, mediana y moda. Las medidas de dispersión en cambio miden el
grado de dispersión de los valores de la variable. Dicho en otros términos las medidas
de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta
forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de
datos entregando información acerca de su posición y su dispersión.
Los procedimientos para obtener las medidas estadísticas difieren levemente
dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran
ordenados en una tabla estadística diremos que se encuentran “agrupados” y si los
datos no están en una tabla hablaremos de datos “no agrupados”.
Según este criterio, haremos primero el estudio de las medidas estadísticas para datos
no agrupados y luego para datos agrupados.
Medidas de tendencia central
Promedio o media
La medida de tendencia central más conocida y utilizada es la media aritmética o
promedio aritmético. Se representa por la letra griega µ cuando se trata del promedio
del universo o población y por Ȳ (léase Y barra) cuando se trata del promedio de la
muestra. Es importante destacar que µ es una cantidad fija mientras que el promedio
de la muestra es variable puesto que diferentes muestras extraídas de la misma
población tienden a tener diferentes medias. La media se expresa en la misma unidad
que los datos originales: centímetros, horas, gramos, etc.
Mediana
Otra medida de tendencia central es la mediana. La mediana es el valor de la variable
que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es
decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el
otro 50% tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al promedio de los dos
valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Moda
La moda de una distribución se define como el valor de la variable que más se repite.
En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo
el punto más alto del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de la variable.
Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las
medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación
estándar, Coeficiente de variación.
Medidas de tendencia central y de dispersión en datos agrupados
Se identifica como datos agrupados a los datos dispuestos en una distribución de
frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, modo,
varianza y desviación estándar deben incluir una leve modificación. A continuación se
entregan los detalles para cada una de las medidas.
Cuestionario unidad 2 y 3
1.- Que es una base de datos?
Es una recopilación organizada de información o datos estructurados, que
normalmente se almacena de forma electrónica en un sistema informático.
2.- Define variable estadística?
Es una característica de una muestra o población de datos que puede adoptar
diferentes valores.
3.- Como obtienes datos cuantitativos?
en una pregunta donde los encuestados tengan como opción para contestar "SI" o
"NO" o las clásicas preguntas cerradas.
4.-explica como obtienes los datos cualitativos?
sí realizas preguntas abiertas
5.-menciona mínimo tres diferentes tipos de bases de datos?
Relacionales, Documentales, Distribuida, Bibliográficas
6.- Define estadística descriptiva?
Es una disciplina que se encarga de recoger, almacenar, ordenar, realizar tablas o
gráficos y calcular parámetros básicos sobre el conjunto de datos.
7.- Explica que es la tabla de frecuencia y para que se utiliza?
es una tabla que muestra la distribución de los datos mediante sus frecuencias. Se utiliza
para variables cuantitativas o cualitativas
8.- Menciona los tipos de frecuencia?
Absoluta, relativa y acumulada.
9.- Que es la tabla de contingencia
es una herramienta utilizada en la rama de la estadística, la cual consiste en crear al
menos dos filas y dos columnas para representar datos categóricos en términos de
conteos de frecuencia. Esta herramienta, que también se conoce como tabla cruzada
10.- cuales son las medidas de tendencia central?
Las mas utilizadas son la media aritmética, la mediana y la moda.