Está en la página 1de 32

Introducción

Estadística Descriptiva y
Probabilidad
Prof. Haider O. Ballesteros M.
Definición La Estadística es la Ciencia de la
• Sistematización, recogida, ordenación y
Descriptiva presentación de los datos referentes a un
fenómeno que presenta variabilidad o
incertidumbre para su estudio metódico, con
objeto de
Probabilidad • deducir las leyes que rigen esos fenómenos,
• y poder de esa forma hacer previsiones sobre
Inferencial los mismos, tomar decisiones u obtener
conclusiones.
¿Para qué sirve la estadística?
• La Ciencia se ocupa en general de fenómenos observables

• La Ciencia se desarrolla observando hechos, formulando


leyes que los explican y realizando experimentos para
validar o rechazar dichas leyes

• Los modelos que crea la ciencia son de tipo determinista o


aleatorio (estocástico)

• La Estadística se utiliza como tecnología al servicio de las


ciencias donde la variabilidad y la incertidumbre forman
parte de su naturaleza
¿En qué áreas se aplica la estadística?
• Administración de Empresas: la estadística se utiliza para evaluar
un producto antes de comercializarlo.

• Economía: para medir la evolución de los precios mediante


números índice o para estudiar los hábitos de los consumidores a
través de encuestas de presupuestos familiares.

• Ciencias Políticas: para conocer las preferencias de los electores


antes de una votación mediante sondeos y así orientar las
estrategias de los candidatos.

• Sociología: para estudiar las opiniones de los colectivos


sociales sobre temas de actualidad.
• Psicología: para elaborar las escalas
de los test y cuantificar aspectos del
comportamiento humano (por
ejemplo los test que se aplican a los
candidatos para un cargo en una
empresa).

• Medicina: uno entre muchos usos


de la estadística, es para determinar
el estado de salud de la población.

• Ciencias Sociales: la estadística se


emplea para medir las relaciones
entre variables y hacer predicciones
sobre ellas.
Aplicaciones de la estadística en Ingeniería
• La teoría de fiabilidad permite estimar tiempos de falla o
duración entre fallas de algún producto.
• Los modelos de regresión se usan para predecir la magnitud de
alguna característica mediante el conocimiento de otras.
• Las series de tiempo les permite conocer el comportamiento de
una variable en el pasado para hacer un pronóstico y estimar su
fiabilidad.
• Los intervalos de confianza sirven para estimar cantidades.
• El diseño estadístico de experimentos les facilita hacer ensayos
en pequeña escala para predecir el comportamiento de un
sistema.
• La estadística se puede aplicar al diseño de nuevos productos y
a su desarrollo, así como al control, a la optimización y a la
mejora de la calidad de procesos de fabricación de bienes y
servicios.
• La estadística es el método práctico, para describir datos
económicos, políticos, sociales, psicológicos, médicos, biológicos
y físicos, y la herramienta, para relacionar y analizar dichos
datos.
• En la Ingeniería tenemos situaciones de carácter probabilístico
que requieren de la estadística para toma de decisiones.

• TAREA: Describir diferentes aplicaciones de la estadística en el


campo de desempeño de su carrera.
Aspectos donde la estadística juega un papel importante:
Conocer la realidad de una observación o fenómeno
Determinar lo típico o normal de aquella observación
Determinar los cambios que representa el fenómeno
Relacionar dos o mas fenómenos
Determinar las causas que originan el fenómeno
Hacer estimativas sobre el comportamiento futuro del fenómeno
Obtener conclusiones de un grupo menor (muestra para hacerlas
extensivas a un grupo mayor)
Permite determinar el grado de validez y confiabilidad de las
conclusiones o predicciones obtenidas a partir de la muestra
Conocer la realidad de una observación o fenómeno: Al cuantificar un
fenómeno estamos conociendo su situación actual.
Determinar lo típico o normal de aquella observación: Al
cuantificar las características de un fenómeno es posible identificar
valores o comportamientos diferentes a los que la muestra o el
grupo presentan.
Determinar los cambios que representa el fenómeno: Los
fenómenos de carácter estadístico presentan variaciones a través
del tiempo. Para este análisis se requiere de una observación
continua. (Key West Florida – Adak Alaska) – (mm)

https://io9.gizmodo.com/why-are-sea-levels-dropping-in-places-closest-to-the-me-1684599241
Relacionar dos o mas fenómenos: Desde el punto de vista de
correlación, se puede establecer si existe una relación valida entre
dos o mas características de una mismas observación o entre dos o
mas fenómenos.
Determinar las causas que originan el fenómeno: Los cambios
que se observan en un fenómeno deben tener una o mas causas
de origen.
Hacer estimativas sobre el comportamiento futuro del fenómeno:
Obtener conclusiones de un grupo menor: Los resultados de la
medición en la muestra pueden ser considerados como si se
hubiese trabajado con toda la población (esto considerando que el
tamaño de la muestra es representativo).
Permite determinar el grado de validez y confiabilidad de las
conclusiones o predicciones obtenidas a partir de la muestra: La
estadísticas nos proporciona una serie de instrumentos para
verificar la validez y confiabilidad.

Fiabilidad y Validez

Fiable No Fiable Poco Fiable Fiable


No válido No válido Poco válido Válido
Errores que se cometen en la estadística
Existen varios tipos de errores estadísticos que muchas veces uno
comete de manera consciente para manipular la opinión de la
gente. Según Kimble (1978) hay diversas formas de errar el uso de
la estadística o son manipuladas para promover el engaño o la
confusión:
No conocer los datos
Comparar datos que no siempre son comparables
Derivar conclusiones de datos no representativos
Esconder parte de las evidencias
Manipular representaciones graficas
Confundir asociación con causalidad
oNO distinguir la tipología de tus variables: Para poder
analizar estadísticamente la información es necesario
identificar la clase de variables presentes en la base de
datos. Distinguir su tipología permite elegir el método
más adecuado para evaluarlas y visualizarlas
correctamente.
oNO distinguir la tipología de tus variables: Para ayudar a
diferenciarlas, existe la clasificación de variables
“Cuantitativas (numéricas) y Cualitativas (categóricas)”:

Variables

Cualitativas Cuantitativas
Categóricas Numéricas

Binaria
Ordinales Nominales Discretas Continua
Dicotómica

Lateralidad Lanzar moneda Hijos Tiempo


Medallas
Estado Civil Apuestas Edad cumplida Estatura
Año escolar
Grupo Sanguineo Fumar Pétalos Flor Peso
No distinguir la escala de medida de tus
variables
Escala de Intervalo Escala de Razón
La distancia entre las unidades Similar a la de intervalo, con la
de medida es uniforme. Por única diferencia que el cero en
ello, permite realizar esta escala sí indica la
operaciones matemáticas, ausencia de atributo, es cero
como suma, resta,
multiplicación o división. El absoluto. Como ejemplo
cero es arbitrario, no indica podemos señalar la altura en
la ausencia de atributo. centímetros, o el peso en
Como ejemplo puede servir la gramos. En ambos casos 4 es
escala de tiempo que doble que 2 (2+2=4), o 4 es la
utilizamos: el cero es arbitrario, mitad que 8, por ejemplo,
puesto en el nacimiento de debido a que la distancia entre
Cristo, o la escala para medir la sus unidades de medida es
temperatura en grados uniforme.
Celsius, en la que el cero es
también relativo.
Taller 1 Estadística Descriptiva y Probabilidad
a) Variable Categórica o Numérica.
b) Si es Ordinal, Nominal, Binaria, Discreta, Continua
c) Escala de Intervalo, Razón

. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .

. . . . . .

. . . . . .

. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
oUso del promedio: “En
Europa se consumen
109 miles de millones de
litros de cerveza al año”.
Calculemos entonces
cuanta cerveza toma un
europeo por día.
oEn estadística el tamaño si importa:
Una muestra no representativa
“Cantidad” puede no describir las
características de la población.
oVisualización de los datos: El de la izquierda se podría
llamar “El gasto en Salud Pública en Finlandia incrementa“
y en cambio el de la derecha también.

En la izquierda, los datos no empiezan en cero; comienzan en


$3000. Esto hace que los datos parezcan mucho más grandes. Por
ejemplo: los gastos del 2001-2002 al parecer se triplicaron, pero no
es el caso.
En la derecha empieza con $0, pero tiene un rango de 30,000. Los
datos sólo llegan hasta $9000. Muestra un poco variación.
oVisualización de los datos: Las líneas del tiempo también
son elementales para mostrar datos. Mira el esquema a
continuación.
¿Existe un claro incremento de
los gastos en salud pública
desde el 2002? No. Date cuenta
de que, antes de 2004, la
gráfica se representa de forma
anual. Pero existe un salto de 3
años del 2004 al 2007, y de dos
años del 2007 al 2009. Esta
gráfica nos hace creer que,
desde 2002, los gastos en salud
pública crecieron a partir de ese
año, pero no es así
Cuando se estudian relaciones entre variables, la
estadística muestra relaciones estadísticas y no
relaciones causales, por ejemplo el siguiente
gráfico muestra el número de nacimientos en
ciudades respecto del número nidos de cigüeña
que hay en los mismos. El gráfico parece indicar
que existe una clara relación entre los nidos de
cigüeña y el número de nacimientos, ¿será
porque a los niños les traen las cigüeñas? Falso,
en realidad el número de nidos de cigüeña
depende entre otros factores de la extensión de
la localidad, lo mismo sucede con el número de
nacimientos.

o La correlación de datos no implica causalidad: Por el simple


hecho de que dos puntos cambien, no quiere decir que
estén relacionados. Uno no es necesariamente la causa de
otro.
oPor ciento vs. Porcentaje: Éste es un error muy común
para la mayoría de nosotros. Si un valor cambia de 5% a
10%, ¿cuánto por ciento cambió? Pon atención a este tipo
de errores; son cometidos todo el tiempo.
o Contexto: El contexto es esencial cuando hablamos de datos. Los
números no significan nada si no les das contexto. Debes explicar
lo que se ve, cómo se leen, de dónde lo sacaste y qué trato le
diste. Si le das un contexto apropiado a tus datos, las conclusiones
salen solas.
o Sesgo de frecuencia: Consiste en que si se le presenta a la mente información de la
frecuencia de base (i.e. información genérica o general) e información específica
(información de un caso particular), la mente tiende a ignorar la información general y
enfocarse en la particular Ejemplo:

Imagínate que tienes una tienda y acabas de instalar una alarma que tiene una eficacia del
99%. Pensarías que, si la alarma suena, casi con seguridad podrías decir que la persona
robó un artículo. Sin embargo, en tu tienda habrá muchos más clientes honestos que
ladrones:
Supongamos que hay 10,000 clientes honestos y únicamente 1 ladrón. Si todas estas
personas pasaran frente a la alarma, esta sonaría 101 veces. Es decir, dado que se equivoca
el 1% de las veces con clientes honestos y son 10,000, 100 de los clientes honestos (es
decir, el 1% de 10,000) serán clasificados por la alarma como ladrones. Entonces, en
general, de las 101 veces que suene tu alarma, sólo 1 de estas veces la persona clasificada
por la alarma como ladrón sería realmente un ladrón, por lo que la efectividad real de la
alarma es inferior al 1% (0.99%, para ser exactos).
Introducción
Estadística Descriptiva y
Probabilidad
Prof. Haider O. Ballesteros M.

También podría gustarte