Que es estadística
La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.
La estadística se divide en dos grandes áreas:
- La estadística descriptiva, se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clústers, entre otros.
- La estadística inferencial, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión). Otras técnicas de modelamiento incluyen anova, series de tiempo y minería de datos.
Que es estadística inferencial
La inferencia estadística o estadística inferencial es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra).
Que es estadística descriptiva
La estadística descriptiva es una gran parte de la estadística que se dedica a analizar y representar los datos. Este análisis es muy básico. Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones obtenidas tras un análisis descriptivo, es un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.
Que es muestra
En estadística una muestra estadística (también llamada muestra complicada o simplificada muestra) es un subconjunto de casos o individuos de una población estadística.Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo).
Por otra parte, en ocasiones, el muestreo puede ser más exacto que el estudio de toda la población porque el manejo de un menor número de datos provoca también menos errores en su manipulación. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente estudiados.
El número de sujetos que componen la muestra suele ser inferior que el de la población, pero suficiente para que la estimación de los parámetros determinados tenga un nivel de confianza adecuado. Para que el tamaño de la muestra sea idóneo es preciso recurrir a su cálculo.
Que es población
Población, en sociología y biología, es un grupo de personas u organismos de una especie particular, que vive en un área o espacio, y cuyo número de habitantes se determina normalmente por un censo.Para la demografía, centrada en el estudio estadístico de las poblaciones humanas, la población es un conjunto renovado en el que entran nuevos individuos -por nacimiento o inmigración- y salen otros -por muerte o emigración-.[1]
Pero la evolución de la población y por tanto su crecimiento demográfico no solamente están regidos por el balance de nacimientos y muertes, sino por el balance migratorio, es decir, la diferencia entre emigración e inmigración, datos que, a suvez están influidos por el aumento de la esperanza de vida, sobre todo, al descender con el tiempo, la tasa de mortalidad, con lo que disminuye la natalidad y aumenta la proporción de la población de mayor edad. ([2] )
Otros aspectos comportamiento humano en las poblaciones se estudian en sociología, economía y geografía, en especial en la geografía de la población y en la geografía humana.
Medidas de tendencia central
Al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución, independientemente de que ésta esté más o menos centrada, se habla de estas medidas como medidas de posición.[1] En este caso se incluyen también los cuantiles entre estas medidas.
Histograma de frecuencias
En muchos casos, si los datos han sido tomados de forma correcta, las conclusiones que se pueden obtener a partir de los mismos son inmediatas. Si no es así, raramente se precisan análisis estadísticos complicados, suele bastar con una adecuada representación gráfica.Cuando se trata de analizar la dispersión que presentan unos datos, la representación gráfica más adecuada es el histograma. Para realizar un histograma se marcan una serie de intervalos sobre un eje horizontal, y sobre cada intervalo se coloca un rectángulo de altura proporcional al número de observaciones (frecuencia absoluta) que caen dentro de dicho intervalo. De esta manera el histograma de frecuencias resulta muy útil para representar gráficamente la distribución de frecuencias
Si se pretende comparar varios histogramas construidos con distinto número de datos, es preferible que las alturas de los rectángulos sean proporcionales al porcentaje de observaciones en cada intervalo o al tanto uno por uno (frecuencia relativa). Utilizando la frecuencia relativa en el eje de ordenadas también se facilita la comparación entre el histograma obtenido y un determinado modelo teórico representado por una función densidad de probabilidad. En este caso se considera que la frecuencia relativa es proporcional al área definida por cada columna. Puede interpretarse la función densidad de probabilidad como la representación del histograma cuando el número de observaciones tiende a infinito y la anchura de los rectángulos tiende a cero.