jueves, 22 de mayo de 2014

Vocabulario Inferencia Estadistica

A continuación se presenta el vocabulario importante a considerar para el tema de Inferencia Estadística.

Población:  también llamada universo o colectivo, es el conjunto de elementos de referencia sobre el que se realizan unas de las observaciones. Es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo.

Muestra: es un subconjunto de casos o individuos de una población estadística.

Parámetro: Es una cantidad numerica calculada sobre una pobilación y resume ls valores que esta toma en algún atributo.

Estadístico: Es una función de las variables aleatorias que se pueden observar en una muestra y que no depende de parámetros desconocidos

Estimador: Es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de la población. Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido) se recogerán observaciones del precio de dicho artículo en diversos establecimientos (la muestra) y la media aritmética de las observaciones puede utilizarse como estimador del precio medio.


Estimación: Es el conjunto de técnicas que permiten dar un valor aproximado de un parámetro de una población a partir de los datos proporcionados por una muestra. Por ejemplo, una estimación de la media de una determinada característica de una población de tamaño N podría ser la media de esa misma característica para una muestra de tamaño n.

jueves, 15 de mayo de 2014

Glosario: Tema 5

  • Variable aleatoria Conjunta: son variables definidas sobre un mismo espacio muestral, nos permiten estudiar dos o más características de un experimento.


  • Variable aleatoria Conjunta discreta: es aquella que se encuentra conformada necesariamente por variables de tipo discreta.


  • Función de Probabilidad Marginal: Función de probabilidad de una variable al margen de la otra.


  • Función de Probabilidad Condicional: es aquella que está dada debido a una cierta condición o valor que toma una de las variables aleatorias.


  • Variable Aleatoria Conjunta Continua: es aquella la cual se encuentra formada por variables de tipo continuas.


  • Función de Distribución Conjunta: Proporciona el comportamiento probabilístico acumulado conjunto de una serie de variables aleatorias.


  • Variables aleatorias conjuntas independientes: las variables aleatorias se dice que son independientes si la Covariancia es cero.


  • Covariancia: Es una medida de dispersión que indica, en promedio, que tanto se alejan conjuntamente los valores de sus medias respectivas.


  • Coeficiente de Correlación: Es una cantidad adimensional que mide la asociación lineal existente entre las dos variables aleatorias, se denota con rho(p) y su intervalo es [-1,1].

  • Coeficiente de Determinación: nos proporciona el grado de explicación de una variable respecto a la otra, es decir que tanto se explica “y” conociendo “x”.

Glosario: Tema 4

•             Distribuciones de probabilidad: Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento si éste se llevase a cabo.  Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos naturales.

•             Parámetros: Número que resume la gran cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.
•             Éxito: Consecución satisfactoria de una tarea o actividad
•             Fracaso: Resultado adverso en una cosa que se esperaba que saliera bien
•             Independencia probabilística: El número de ocurrencia en cualquier intervalo de tiempo es no depende del número de ocurrencias en cualquier otro intervalo
•             Distribución Discreta Uniforme: Una de las distribuciones más simples. Es aquella en la cual la v.a. asume cada uno de sus valores con la misma probabilidad.
•             Distribución de Bernoulli: Es el caso más sencillo para modelar un experimento. Esta distribución cuenta únicamente con dos resultados posibles; éxito (e) o fracaso (f), con probabilidades p y q=1-p respectivamente. En esta distribución el experimento sólo se realiza una vez.
•             Proceso de Bernoulli: Repetición del ensayo de Bernoulli, el cual consiste de n ensayos de Bernoulli, en donde los resultados de cada ensayo se pueden clasificarse como éxito o fracaso. La probabilidad de éxito p, permanece constante para todos los ensayos, en donde cabe aclarar que todos los ensayos son independientes. Este proceso permite definir otras variables aleatorias como la binomial, la geométrica y la de pascal.
•             Distribución Binomial: Aquella distribución, en donde la variable aleatoria representa el número de éxitos que se observan al realizar un proceso de Bernoulli. Se considera a una población infinita (o finita con reemplazo).Distribución dedicada a variable discreta.
•             Distribución Geométrica: Aquella distribución, en donde la variable aleatoria representa el número de ensayos de Bernoulli que se requieren para observar por primera vez un éxito. Distribución dedicada a variable discreta.
•             Distribución de Pascal (Distribución Binomial Negativa): Generalización de la distribución geométrica. En esta, la variable aleatoria representa el número de ensayos de Bernoulli que se requieren para observar el r-ésimo éxito, si en cada uno de los ensayos de tiene una probabilidad de éxito p. Distribución dedicada a variable discreta.
•             Distribución Hipergeométrica: Aquella distribución en donde se considera a la población como finita de tamaño N (y sin reemplazo). En esta, la variable aleatoria representa el número de éxitos en n ensayos extraídos de una población, con r elementos que tienen la característica de interés. Distribución dedicada a variable discreta.
•             Distribución de Poisson: Una de las distribuciones discretas que tienen más aplicación. Sirve cuando se desea calcular la probabilidad de ocurrencias de un evento en un intervalo continuo determinado. En particular, se puede modelar el número de llegadas por unidad de tiempo. Distribución dedicada a variable discreta.
•             Estacionaridad: La probabilidad de que ocurra un evento en un intervalo de tiempo de longitud t es t, con constante. Recibe el nombre de intensidad del proceso.
•             Unicidad o No multiplicidad: La probabilidad de que ocurra más de un evento en un intervalo (de tiempo) de longitud h(h0) es despreciable comparada con la probabilidad de que ocurra solamente uno.
•             Distribución continua uniforme: Es aquella distribución que al igual que la distribución discreta uniforme, la probabilidad se mantiene constante, la diferencia recae en que en esta distribución se utiliza una variable aleatoria continua.
•             Distribución exponencial: Aquella en donde la variable aleatoria (T), representa el intervalo (generalmente tiempo) que transcurre entre dos ocurrencias sucesivas de un evento. Distribución dedicada a variable contínua.
•             Distribución Normal: Es la distribución más utilizada en la práctica. Muchos problemas reales tienen un comportamiento que se puede aproximar al de la distribución normal. Fue descubierta por DeMoivre en 1733 como una forma límite de la distribución binomial, después la estudió Laplace, aproximadamente en el año de 1775y en ocasiones se le conoce como distribución Gaussiana debido a que Gauss la citó en un artículo en 1809. Durante los siglos XVIII y XIX se hicieron esfuerzos para establecer el modelo normal como la ley básica que rige las variables aleatorias continuas, de ahí su nombre. Estos esfuerzos fracasaron. En esta distribución, al ser simétrica, la media, la mediana y la moda coinciden en el mismo valor. Por otro lado, la curtosis de la distribución normal es 3, y es por eso que la curtosis se compara contra dicho valor. Para obtener la probabilidad de que la variable aleatoria X se encuentre entre a y b, es necesario obtener el área bajo la curva normal, pero la solución analítica exacta para la integral no existe, por lo que se utilizan métodos numéricos o tablas de la distribución normal estándar.
•             Distribución Normal Estándar: La distribución normal estándar es un caso particular de la distribución normal, la cual tiene como parámetros 0 y 1, es decir, tiene una media de cero y una varianza de 1.

Glosario Tema 3

Variable aleatoria: Una variable aleatoria es una función que asigna números reales a cada posible resultado de un experimento aleatorio. Se pueden clasificar en continuas, discretas o mixtas.
Variable aleatoria discreta: Este tipo de variable aleatoria solo puede tomar valores de un conjunto numerable de valores.
Función masa de probabilidad: Se llama a así a la función de probabilidad de una variable aleatoria discreta.
Variable aleatoria continua: Este tipo de variable aleatoria puede tomar valores de un conjunto infinito no numerable de valores.
Función densidad de probabilidad: Se llama a así a la función de probabilidad de una variable aleatoria continua.
Función de distribución: La función de distribución de una variable aleatoria X se define con una función que asocia a cada valor real, la probabilidad de que la variable aleatoria asuma valores menores o iguales a él.
Valor esperado: También llamada esperanza matemática, es el valor que se espera obtener en un experimento aleatorio. Es decir el valor esperado es la media de un conjunto de datos estadísticos.


MEDIDAS DE TENDENCIA CENTRAL.
Media: Se definió anteriormente como valor esperado.
Moda: Es aquel valor para el cual la función masa de probabilidad o densidad de probabilidad, toma su valor máximo.
Mediana: Es aquel valor para el cual la probabilidad de que la variable aleatoria tome valores iguales o menores a dicho valor es 0.5.
MEDIDAS DE DISPERSIÓN.
Rango: El rango se define como la diferencia entre el valor mayor que puede asumir la variable y el menor valor.
Desviación media: La desviación media de una variable aleatoria es el valor esperado de la diferencia en valor absoluto entre los valores de X y su media.
Varianza: Se define como el promedio del cuadrado de la diferencia de la variable aleatoria y su media. Es el segundo momento respecto a la media. Nos indica que tan lejos o tan cerca se encuentra algún valor de la media (del valor esperado).
Desviación estándar: Se define como la raíz cuadrada positiva de la varianza.