Está en la página 1de 38

STAT 201

PROGRAMA AHORA
Universidad del Turabo
Profa. Luz I. Orellana
lorellana@iclaropr.com
lorellana@suagm.edu
Estadística- se define como un conjunto de
métodos apoyados en las matemáticas que
facilitan obtener conocimiento de las referencias
numéricas; permitiendo recopilar, organizar,
analizar e interpretar información numérica.
UTILIDAD:
* descubrir la existencia o no existencia de
problemas
* descubrir las posibles causas de los
problemas
USO ILEGITIMO

 la evidencia de datos que no siempre son


comparables
 derivar conclusiones de datos no
representativos
 esconder parte de las evidencias
 manipular representaciones gráficas
 confundir asociación con causalidad
 derivar conclusiones
 Medir cambio a partir de bases inadecuadas
 Interpretar los resultados en forma acomodada
por conveniencia.

TIPOS DE ESTADISTICAS
 DESCRIPTIVA- se conoce como el proceso de
recopilar, organizar e interpretar datos numéricos
o cualitativos.
 INFERENCIAL- la interpretación de los datos de
manera que pueda llevar a conclusiones válidas
a sus respetivas poblaciones.
RECOLECCION DE DATOS

 Administrar un negocio de forma efectiva


requiere la recolección de los datos apropiados.
Existen diversas circunstancias que requieren la
recolección de datos:
 La necesidad de evaluar la efectividad de una nueva
compañía publicitaria.
 Determinar si un nuevo producto es más efectivo que
los actualmente se utiliza.
 Monitoriar el proceso de producción para comprobar si
la calidad de cierto producto satisface los estándares de
la compañía.
 Determinar si se cumple o no con los principios
contables aceptables.

 Determinar cual industria tiene mayor


probabilidad de crecer de forma acelerada en un
periodo de recuperación económica.
Fuentes de datos

 Los que proporciona una organización o un


individuo.
 Un experimento diseñado.
 Una encuesta.
 Un estudio observacional.
Clasificación

 Las fuentes de datos se clasifican:

 PRIMARIAS- cuando el recolector de datos es


quen los usa para el análisis.
 SECUNDARIAS- cuando una organización o
individuo han recopilado los datos que utiliza otra
organización o individuo.
TIPOS DE DATOS

 Def.
 variable- cualquier características bajo estudio
que toma diferentes valores.
 VARIABLES CATEGORICAS- respuestas directas, tales
como si o no.
 VARIABLES NUMERICAS- respuestas con números.
 DISCRETAS- respuestas numéricas que surgen de un
proceso de conteo, es un número finito.
 CONTINUAS- respuestas que surgen de un proceso de
medición, considerando cualquier valor dentro de un
continuo o intervalo.
 Población- conjunto completo de individuos,
objetos o datos que el investigador está
interesado en estudiar.
 Muestra- subconjunto de la población.
 Datos- cifras, números o índices que han
sido recopilados.
 Parámetro- cuando se estudia la totalidad de
casos en el universo, las medidas que se
obtienen para las variables bajo
consideración.
ESCALAS

 NOMINAL- identifica las distintas formas de


los datos.
 ej 1 2 3 4
 PPD PNP PIP NO AFILIADO

 1 FEMENINO
 2 MASCULINO
 ORDINAL- cualitativa o de categoría

 ej 7 alto
 6 medio alto
 5 medio
 4 medio bajo
 3 bajo alto
 2 bajo medio
 1 bajo
INTERVALO- algunas características que se
presentan agrupadas.
ej College Board

DE RAZON- todas las características de los


números reales.
 DISTRIBUCION TABLA DE FRECUENCIA
ESCALAS POR INTERVALOS

i= n1 - n2 + 1
k
i = intervalo
n1 = numeral mayor
n2 = numeral menor
k = constante ( usualmente
igual a 10, 12 ó 15 )
 obs.

Si los numerales son enteros y el resultado de la ecuación anterior es


menor de 1.5, podemos concluir que existe poca variación en el
conjunto de medidas bajo consideración. En tales casos se procede a
construir distribuciones con clases no agrupadas.
Por el contrario, cuando el resultado es igual o mayor de 1.5, lo más
recomendable es optar por distribuciones agrupadas.
Ejemplo: Realiza una tabla con 4 clase o
intervalo
 Una muestra de 40 sujetos en un
experimento, donde se interesa determinar
los segundos en reaccionar ante estímulo.
Digamos que se obtuvieron los siguientes
resultados:

2, 7, 10, 9, 5, 9, 6, 6, 5, 6, 5, 4, 3, 4,
4, 5, 5, 4, 3, 8, 9, 8, 7, 7, 6, 6, 6, 5, 5,
7, 6, 6, 8, 8, 7, 7, 6, 5, 6, 8
 Punto medio- valor en la clase agrupada que
se ha de tomar como representativo de dicha
clase, ej

 Cocientes de Inteligencia Punto medio


 150-159 154.5
 140-149 144.5
 130-139
 120-129
 Límites o fronteras reales de las clases –
se definen como los puntos donde
comienzan y terminan las clases.
Ej. Peso ( libras) Límites real inferior Límites real superior
150-154 149.5 154.5
145-149
140-144

150-154.9 149.95 154.95


145-149.9
140-144.9
Tendencia Central
¿Qué expresa la propiedad de tendencia central?

Analizamos la forma de organizar y presentar los datos de


manera significativa; pero en sí mismas, no nos permiten
realizar afirmaciones cuantitativas que caractericen a la
distribución como un todo; ni hacer comparaciones. La forma
que más en que esto se realiza, con más frecuencia, es
calculando la calificación promedio del grupo. La cantidad
calculala se llama tendencia central de cada distribución.

Texto: ESTADISTICA PARA CIENCIAS DEL COMPORTAMIENTO, 5TA ED..PAGANO


Distribución Normal

μ
Md
Mo
La Media Aritmética
 Se define como el valor que calcula al promediar en una
distribución.
La media para un arreglo de valores
_
X = ∑x
n donde
∑ = suma de …
X= valores que toma la
variable.
n = total de casos en la

muestra
La media para una distribución de frecuencia
con clase no agrupadas

__
X = ∑x·f
n donde
∑ = suma de …
X = valores que toma la
variable.
f = frecuencia de cada
clase
n = total de casos en la

muestra
Ej.

x f x·f
La media para una distribución de frecuencias
con clases agrupadas

__
X = ∑ xi · f
n donde
∑ = suma de …
X I = valores que toma la
variable.
f = frecuencia de cada
clase
n = total de casos en la

muestra
Ej.

x f xi xI · f
Mediana
Se define al valor que divide la distribución en dos partes
iguales; debajo del cual está el 50% de los datos.

Proceso:
1. Con los datos en bruto, ordenamos los datos.
2. La mediana es el dato central, si el número de
datos es impar.
3. Si el número es par, la mediana se considera
como el promedio de los datos centrales.
Moda
 Es el dato más frecuente en la distribución.

 Práctica
 Calcula la tendencia central de los siguientes conjuntos
de datos.

a. 8, 10, 4, 3, 1, 15, 1, 8
b. 100, 102, 108, 104, 112
c. 1.2, 1.3, 1.5, 1.8, 2.3, 1.2, 1.2
Medidas de variabilidad
Tiene que ver con qué tan alejados están los datos de la media.
* rango- se define como la diferencia entre los datos
máximo y mínimo de una distribución.

Rango = dato máximo - dato mínimo

* rango medio se utiliza como medida de resumen tanto para


análisis financieros como reportes meterológicos, porque puede
proporcionar una medida adecuada, rápida y sencilla.

RANGO MEDIO = X más pequeño + X más grande


2
Los cuartiles son las medidas de posición no central que se
utilizan con mayor frecuecnia y se emplean sobre todo para
resumir o describir laqs propiedades de un conjunto.

Primer cuartil Q 1, es el valor tal que 25% de las


observaciones son menores y 75% son mayores.
 Q1= (n+1)
 4

 Tercel cuartil Q 3 es un valor tal que 75% de las


observaciones son menores de 25% son mayores.

 Q3 = 3(n+1)
 4
La Desviación Estándar y Varianza

Tanto en las escalas por intervalos, como en


las de razones, la varianza y la desviación
estándar son las mejores medidas de
dispersión. Estas tomas en consideración
todos los puntajes y controlan por el efecto
de valores extremos
Desvación estándar para un arreglo
de valores

_________
 s = ∑(x -x)2
n - 1
x (x -x) (x -x)2

Totales
Otra alternativa:
x x2 s= ∑x2 - ( ∑ x )2
n
____________
n - 1

Totales
Desviación para distribuciones con clases no agrupadas

 s= ∑ x2 f -∑ (x f)2
n
____________
n - 1
Tabla

x f xf x2 f

Totales
Distribución para clases agrupadas

s = ∑ x i2 - ( ∑ x i f )2
n
____________
n - 1
Tabla:

x f xi xIf x i2 f

Totales
Coeficiente de Variacíon

 Nos provee una medida de variación relativa. A mayor


la proporción, más variación; y viceversa.

__s__
 C.V. = x
Ej
Suponga que nos interesa determinar si los niños al nacer
varían más en peso que en estatura. Digamos que se
toma una muestra de 200 sujetos y se obtienen los
siguientes resultados:
peso estatura
x = 3.0 kilos x = 50.5 centímetros
s = 0.5 kilos s = 2.5 centímetros

Entonces
Peso Estatura
C.V. = 0.5 /3.0 = .17 C.V. = 2.5 / 50.5 = .05
Estos resultados suguieren, en términos relativos, los niños
son más homogéneos en estatura que en peso.

También podría gustarte