Está en la página 1de 10

República Bolivariana De Venezuela

Ministerio del Poder popular para la Educación

Universidad Rafael Belloso Chacín

Cátedra: Estadística

Facultad de Ingeniería

ESTADÍSTICA

Profesora: angela galban

Integrante:

Sasha Pinto

C.I. 20.821.486

Maracaibo, Enero 2020


La Estadística es la ciencia de los datos, la cual implica su recolección, clasificación,
síntesis, organización, análisis e interpretación, para la toma de decisiones frente a la
incertidumbre.

Se clasifican en:

Estadística descriptiva

Es aquella que consiste en la evaluación de un fenómeno por medio de la


observación y su posterior presentación en datos y gráficos con el fin de detallar el
mismo fenómeno y su comportamiento.

Los pasos por medio de los cuales procede la estadística descriptiva son los siguientes:

Recolectar: en efecto los datos deben ser obtenidos de forma consecuente de una
muestra, es decir, los mismos deben proceder de la observación exacta de un
fenómeno y de su comportamiento, solo así es posible recabar toda la información
necesaria.

Analiza: no basta con la simple observación, los datos deben ser sometidos a una serie
de estudios con el fin de evaluarlos y proceder a su respectiva categorización, los datos
deben ser sometidos a procesos analíticos con el fin de proyectar los resultados y si
estos son o no consecuentes para la investigación.

Caracterización o categorización, esto equivale al proceso de agrupación de los datos


en distintos grupos con el fin de que los mismos puedan presentarse de forma
segmentada para una mejor apreciación de los resultados.

Estadística inferencial :

Refiere al estudio particular de una población con el fin de apreciar el


comportamiento determinado de la misma, en efecto, el proceso de estudio procede es
de una muestra, con la finalidad de obtener de la mismas las alternativas o
probabilidades que pudieron ocasionar que el fenómeno se suscitará.

Una población no es más que una cantidad determinada de sujetos, una


universalidad con una característica peculiar que permite agruparlas; mientras que una
muestra es una pequeña toma que se realiza de la población procediendo a la
categorización de forma más estricta.

La estadística inferencial plantea sus postulados por medio de hipótesis que no son
más que planteamientos referenciales que se realizan respecto a una situación en
específica, los mismos pueden contener la conjugación de hechos con posibles
alternativas de ocurrencias. La prioridad de esta rama de la estadística, es fijar
conclusiones eminentes y necesarias.
Población estadística

Es un conjunto de sujetos o elementos que presentan características comunes.


Sobre esta población se realiza el estudio estadístico con el fin de sacar conclusiones.

Un parámetro estadístico es un número que se obtiene a partir de los datos de una


distribución estadística. Los parámetros estadísticos sirven para sintetizar la
información dada por una tabla o por una gráfica.

Muestra aleatoria: es aquel procedimiento de selección de la muestra en el que todos y


cada uno de los elementos de la población tiene una cierta probabilidad de resultar
elegidos . De esta forma, si tenemos una población de N elementos y estamos
interesados en obtener una muestra de n elementos (muestra de tamaño n), cada
subconjunto de n elementos de la población tendrá también una cierta probabilidad de
resultar la muestra elegida.

Estadígrafo es el término utilizado para designar a la persona dedicada a las tareas


propias de la estadística, aunque en ocasiones también es frecuente que se utilice para
designar a la variable que define una distribución estadística.

Una unidad es la abstracción matemática de una "variable aleatoria". Los ejemplos


comunes de una unidad serían una sola persona, animal, planta, artículo
manufacturado o país que pertenece a una colección más grande de dichas entidades
que están siendo estudiadas, por lo cual se llaman unidades estadísticas o individuos a
los componentes de una determinada población de datos centro del estudio estadístico.
Cada uno de los individuos de la población puede describirse según uno o varios
caracteres.

Los datos estadísticos Son números que pueden ser comparados, analizados e
interpretados. El campo del cual son tomados los datos estadísticos se identifica como
población o universo.

En un estudio estadístico los métodos que se aplican son:

A) RECOPILACION: De acuerdo con la localización de la información los datos


estadísticos pueden ser internos y externos.

Los internos son los registros obtenidos dentro de la organización que hace un estudio
estadístico,

Los externos se obtienen de datos publicados y encuestas.

B) ORGANIZACIÓN: En la organización de los datos recopilados, el primer paso es


corregir cada uno de los elementos recopilados.
C) REPRESENTACION: Hay 3 maneras de presentar un conjunto de datos mediante
enunciados tablas estadísticas y gráficas estadísticas.

D) ANALISIS: Después de los datos anteriores los datos estadísticos están listos para
hacer analizados, para lo cual frecuentemente se emplean operaciones matemáticas
durante el proceso de análisis. Si una muestra es representativa de una población se
pueden deducir importantes deducciones acerca de esta a partir del análisis de la
misma. Una muestra es un conjunto de medidas u observaciones tomadas a partir de
una población dada.

Escala de medición es una clasificación acordada con el fin de describir la naturaleza


de la información contenida dentro de los números asignados a los objetos y, por lo
tanto, dentro de una variable.

Medida nominal es Una escala nominal en la cual los números sirven como “etiquetas”
solamente para identificar o clasificar un objeto. Una escala de medición nominal
normalmente trata sólo con variables no numéricas (no cuantitativas).

Por ejemplo, supongamos que se realiza esta pregunta: “¿Podrías seleccionar el grado
de incomodidad de tu enfermedad?”

Las opciones de respuesta utilizadas para este tipo de escala serían:

Leve

Moderado

Severo

En este ejemplo en particular, 1 = leve, 2 = Moderado y 3 = Severo. Aquí los números


simplemente son utilizados como etiquetas y no tienen ni un solo valor.

La escala ordinal es uno de los niveles de medición que nos otorga la clasificación y
el orden de los datos sin que realmente se establezca el grado de variación entre ellos.
Los datos ordinales son básicamente datos estadísticos que tienen la misma
naturalidad pero existe una diferencia entre ellos que es desconocida. Estos datos
pueden ser agrupados o clasificados.

Por ejemplo, una escala ordinal puede responder preguntas como:

¿Qué tan satisfecho estás con nuestros productos?

Totalmente satisfecho
Satisfecho

Neural

Insatisfecho

Totalmente insatisfecho

¿Qué tan feliz estás con el servicio al cliente?

Muy infeliz

Infeliz

Neutral

Feliz

Muy feliz

Lo que hacen los encuestados es elegir entre las opciones de satisfacción, pero claro la
respuesta a la pregunta “¿cuánto exactamente?” permanece sin respuesta.
Comprender las diversas escalas de medición ayuda a los investigadores a obtener
datos que pueden ser aplicados a favor en el futuro.

Por lo tanto, se utiliza una escala ordinal como parámetro para comprender si las
variables son mayores o menores. La tendencia central de la escala ordinal es
mediana.

La escala de intervalo se define como una escala de medición cuantitativa en la que


se mide la diferencia entre dos variables. En otras palabras, las variables se miden en
valores reales y no de forma relativa, donde la presencia de cero es arbitraria. Esto
significa que la diferencia entre dos variables en una escala es una distancia real o
igual.

Por ejemplo, la diferencia entre 40 grados centígrados y 50 grados centígrados es


exactamente la misma que la diferencia entre 50 grados centígrados y 60 grados
centígrados.

Las características de esta escala son las siguientes:

La escala de intervalo es preferible a la escala nominal o la escala ordinal porque las


dos últimas son escalas cualitativas. La escala de intervalo es cuantitativa en el sentido
de que se pueden cuantificar la diferencia entre dos valores.
Puedes restar valores entre dos variables y esto te ayuda a comprender la diferencia
entre dos variables.

Esta escala permite calcular la media de las variables.

Esta es una escala preferida en estadística porque permite que los investigadores le
asignen un valor numérico a cualquier evaluación arbitraria.

Distribución de frecuencias es la agrupación de datos en categorías mutuamente


excluyentes que indican el número de observaciones en cada categoría. Esto
proporciona un valor añadido a la agrupación de datos.

Una vez se obtienen, se puede calcular la frecuencia relativa de cada elemento


como la división de la frecuencia absoluta entre el total de elementos N=30. Se pueden
calcular las frecuencias relativas en porcentaje (%) multiplicándolas por 100.

Construcción de una distribución de frecuencias y gráficos

1. Nos fijamos en el número de datos (n)

2. Buscamos el dato mínimo y máximo y calculamos el rango (r) r = máx. – mín

3. Determinamos el número de intervalos (m) m = 1 + 3,3 log(n)

4. Verificamos la amplitud del intervalo (c) c = r/m.


Histograma: es una representación gráfica de una variable en forma de barras, donde
la superficie de cada barra es proporcional a la frecuencia de los valores
representados.

Polígono: es el nombre que recibe una clase de gráfico que se crea a partir de un
histograma de frecuencia. Estos histogramas emplean columnas verticales para reflejar
frecuencias): el polígono de frecuencia es realizado uniendo los puntos de mayor altura
de estas columnas.

Pastel: se usa para representar variables cualitativas o categóricas, de preferencia


nominales. Se utiliza para mostrar la proporción le corresponde a cada categoría.

Barras: es una forma de representar gráficamente un conjunto de datos o valores, y


está conformado por barras rectangulares de longitudes proporcionales a los valores
representados. Los gráficos de barras son usados para comparar cantidades de
valores en diferentes momentos, o también podría decirse productos. Las barras
pueden orientarse horizontal o verticalmente.

Clase estadística Son divisiones o categorías en las cuales se agrupan un conjunto de


datos ordenados con características comunes. En otras palabras, son fraccionamientos
del rango o recorrido de la serie de valores para reunir los datos que presentan valores
comprendidos entre dos limites.

Marca de clase La marca de clase, también conocida como punto medio, es el valor
que se encuentra en el centro de una clase, el cual representa a todos los valores que
están en dicha categoría. Fundamentalmente, la marca de clase es usada para el
cálculo de ciertos parámetros, como la media aritmética o la desviación estándar.

Frecuencia absoluta

Es el número de veces en que dicho evento se repite durante un experimento o


muestra estadística. Comúnmente, la distribución de la frecuencia suele visualizarse
con el uso de histogramas.

Frecuencia acumulada: es la suma de las frecuencias absolutas de todos los


valores inferiores o iguales al valor considerado, La frecuencia acumulada
se representa por F i

La frecuencia relativa es el cociente entre la frecuencia absoluta de un


determinado valor y el número total de datos .

La frecuencia relativa se puede expresar en tantos por ciento y se representa por


ni.

La suma de las frecuencias relativas es igual a 1.

Una gráfica o representación gráfica es un tipo de representación de datos,


generalmente numéricos, mediante recursos visuales (líneas, vectores, superficies o
símbolos), para que se manifieste visualmente la relación matemática o correlación
estadística que guardan entre sí.

Cuando se muestran los datos estadísticos a través de representaciones gráficas, se


ha de adaptar el contenido a la información visual que se pretende transmitir. Para ello,
se barajan múltiples formas de representación:

Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un


sistema de ejes cartesianos, cuando la variable es discreta o cualitativa.

Histogramas: formas especiales de diagramas de barras para distribuciones


cuantitativas continuas.
Polígonos de frecuencias: formados por líneas poligonales abiertas sobre un sistema
de ejes cartesianos.

Gráficos de sectores: circulares o de tarta, dividen un círculo en porciones


proporcionales según el valor de las frecuencias relativas.

Pictogramas: o representaciones visuales figurativas. En realidad son diagramas de


barras en los que las barras se sustituyen con dibujos alusivos a la variable.

Cartogramas: expresiones gráficas a modo de mapa.

Pirámides de población: para clasificaciones de grupos de población por sexo y edad.

Las medidas de posición relativa se llaman en general cuantiles y se pueden clasificar


en tres grandes grupos: Cuartiles, quintiles, deciles, percentiles. Las medidas de
posición como los cuartiles, quintiles, deciles y percentiles dividen a una distribución
ordenada en partes iguales.

Los Cuartiles (Qn): son los tres valores de la variable de una distribución que la
dividen en cuatro partes iguales, es decir, al 25%, 50% y 75%. Para calcular el valor
de uno de los cuatro Cuartiles, se utiliza la formula:

Qk = k (n/4)

La moda es el valor con mayor frecuencia en una de las distribuciones de datos.


Esto va en forma de una columna cuando encontremos dos modas, es decir, dos datos
que tengan la misma frecuencia absoluta máxima. Una distribución trimodal de los
datos es en la que encontramos tres modas.

La media (promedio) de un conjunto de datos se encuentra al sumar todos los números


en el conjunto de datos y luego al dividir entre el número de valores en el conjunto. La
mediana es el valor medio cuando un conjunto de datos se ordena de menor a mayor.

La media aritmética es el valor promedio de las muestras y es independiente de las


amplitudes de los intervalos. Se simboliza como y se encuentra sólo para variables
cuantitativas. Se encuentra sumando todos los valores y dividiendo por el número total
de datos.
Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo de
puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o
valores están próximas entre sí o si por el contrario están o muy dispersas.

Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene
restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil
de calcular y sus unidades son las mismas que las de la variable, aunque posee varios
inconvenientes:

No utiliza todas las observaciones (sólo dos de ellas);

Se puede ver muy afectada por alguna observación extrema;

El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier


caso nunca disminuye.

En el transcurso de esta sección, veremos medidas de dispersión mejores que la


anterior. Estas se determinan en función de la distancia entre las observaciones y algún
estadístico de tendencia central.

Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre
el valor más elevado y el valor más bajo.

Varianza: Mide la distancia existente entre los valores de la serie y la media. Por el
contrario, mientras mayor sea la varianza, más dispersos están.

La desviación estándar es la medida de dispersión más común, que indica qué tan
dispersos están los datos con respecto a la media. ... El símbolo σ (sigma) se utiliza
frecuentemente para representar la desviación estándar de una población, mientras
que s se utiliza para representar la desviación estándar de una muestra.

También podría gustarte