lunes, 8 de septiembre de 2008

PROBABILIDAD Y ESTADISTICA

PROBABILIDAD Y ESTADISTICA




PROBABILIDAD: La probabilidad mide la frecuencia con la que ocurre un resultado en un experimento bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la matemática, la ciencia y la filosofía para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecánica subyacente de sistemas complejos.


MEDIDAS DE TENDENCIA CENTRAL:

Sea x (1) en orden creciente de cómo la parte media o la (([n+1])/2) enésima observación si n es impar o el promedio entre las dos observaciones intermedias si n es par.

(X (6/2)+x ((6/2) + 1))/2= (1675+1750)/2

=1712.5


Estadística inferencial
La inferencia estadística es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra).

La bondad de estas deducciones se mide en términos probabilísticos, es decir, toda inferencia se acompaña de su probabilidad de acierto.

Estadística descriptivaLa estadística descriptiva es una parte de la estadística que se dedica a analizar y representar los datos. Este análisis es muy básico, pero fundamental en todo estudio. Aunque hay tendencia a generalizar a toda la población las primeras conclusiones obtenidas tras un análisis descriptivo, su poder inferencial es mínimo y debería evitarse tal proceder. Otras ramas de la estadística se centran en el contraste de hipótesis y su generalización a la población.

Algunas de las técnicas empleadas en este primer análisis de los datos se enumeran más abajo en el listado de conceptos básicos. Básicamente, se lleva a cabo un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.

Estadística descriptiva
La estadística descriptiva es una parte de la estadística que se dedica a analizar y representar los datos. Este análisis es muy básico, pero fundamental en todo estudio. Aunque hay tendencia a generalizar a toda la población las primeras conclusiones obtenidas tras un análisis descriptivo, su poder inferencial es mínimo y debería evitarse tal proceder. Otras ramas de la estadística se centran en el contraste de hipótesis y su generalización a la población.
Algunas de las técnicas empleadas en este primer análisis de los datos se enumeran más abajo en el listado de conceptos básicos. Básicamente, se lleva a cabo un estudio calculando una serie de medidas de tendencia central, para ver en qué medida los datos se agrupan o dispersan en torno a un valor central.


Medidas de tendenci central


*media
*moda
* mediana

Medidas de dispersión

Rango vmax-vmin
Varianza

Desviación estándar

Población
El tamaño de la población depende de los fines de la investigación.






Notación:

MediaMuestral

ESTADISTICA: Manejo de los datos y graficas, agrupados, para en base a los resultados tomar una descion .


Varianza


DESVIACION ESTANDAR
HISTOGRAMA
Un histograma es un resumen gráfico de la variación de un conjunto de datos. La naturaleza gráfica del histograma nos permite ver pautas que son difíciles de observar en una simple tabla numérica. Esta herramienta se utiliza especialmente en la Comprobación de teorías y Pruebas de validez.



A CONTINUACION MUESTRO ALGUNOS CONSEJOS PARA GRAFICAR UN HISTOGRAMA:


Cómo interpretar los histogramas:
Sabemos que los valores varían en todo conjunto de datos. Esta variación sigue cierta pauta. El propósito del análisis de un histograma es, por un lado, identificar y clasificar la pauta de variación, y por otro desarrollar una explicación razonable y relevante de la pauta. La explicación debe basarse en los conocimientos generales y en la observación de las situaciones específicas y debe ser confirmada mediante un análisis adicional. Las pautas habituales de variación más comunes son la distribución en campana, con dos picos, plana, en peine, sesgada, truncada, con un pico aislado, o con un pico en el extremo.
Construcción de un histograma:

PASO 1
Determinar el rango de los datos: RANGO es igual al dato mayor menos el dato menor; R = > - < href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEhKcJKJqjfIj4bIRbFjEL46VD-eC_TEG1ZfyyMAT7t1CJ14Th058X78p7pWNnKXTtC4gCJwcuwblJgQ6y8pUap0rFytpZWQ7eKDRnHhRCQ_woKclZr3OEG-ziG6esl5nxWdhxml91Ldq9fe/s1600-h/HISTOGRAMA.bmp">











Ejemplos de otros tipos de representaciones gráficas:
Hay histogramas donde se agrupan los datos en clases, y se cuenta cuántas observaciones (frecuencia absoluta) hay en cada una de ellas. En algunas variables (variables cualitativas) las clases están definidas de modo natural, p.e sexo con dos clases: mujer, varón o grupo sanguíneo con cuatro: A, B, AB, O. En las variables cuantitativas, las clases hay que definirlas explícitamente (intervalos de clase).













Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).

Tabla de representación de los datos
Típica :
• Variable característica o suceso en la primera columna y sus frecuencias y porcentajes y acumulativas en las sucesivas columnas.
• Representación gráfica: en los ejes de coordenadas: eje vertical para la variable y eje horizontal para frecuencias.
Todos estos elementos son opcionales. Las variables, características o sucesos, con sus correspondientes valores no están siempre presentes, aunque pueden expresarse como intervalos, tiempos, escalas, etc.

Desviación estándar


Desviaciones estándar en una distribución normal.
La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.
Formulación
La varianza representa la media aritmética de las desviaciones con respecto a la media elevadas al cuadrado. Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuación.
Expresión de la varianza muestral:

Expresión de la varianza poblacional:


Por la formulación de la varianza podemos pasar a obtener la desviación estándar, tomando la raíz cuadrada positiva de la varianza. Así, si efectuamos la raíz de la varianza muestral, obtenemos la desviación típica muestral; y si por el contrario, efectuamos la raíz sobre la varianza poblacional, obtendremos la desviación típica poblacional.
Expresión de la desviación estándar muestral:
También puede ser tomada como

con a como y s como



Interpretación y aplicación
La desviación estándar es una medida del grado de dispersión de los datos del valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto de la media aritmética.
Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca a la media.
Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.
La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. La desviación estándar es uno de tres parámetros de ubicación central; muestra la agrupación de los datos alrededor de un valor central (la media o promedio).


EXPLICACION
La desviación estándar (DS/DE), también llamada como desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución. De hecho, específicamente, la desviación estándar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma, .
La desviación estándar de un conjunto de datos es una medida de cuánto se desvían los datos de su media. Esta medida es más estable que el recorrido y toma en consideración el valor de cada dato.
Es posible calcular la desviación estándar de una variable aleatoria continua como la raíz cuadrada de la integral .




PERICENTILES: porcentaje de los datos que se encuentran por debajo del percentil.

EJEMPLO:

P10: 10% de los datos es menor que el valor posicionado en ese lugar.

P25: 25% de los datos es menor que el valor posicionado en ese lugar.

Mediana: la mediana se encontraria en el P50

CALCULO DE PERCENTILES

ORDENAMOS DE MAYOR A MENOR

PK= (kn)/100



Ejercicio.


PK - K% de datos por debajo de (K%) -
P25 ---» Son 25% de los datos de menor valor al que se encuentra en esta posicion.

Datos:

105,97,245,163,207,134,218,199,160,196,221,154,228,131,180,178,157,151,175,201,183,
153,174,154,190


* Se ordenan ascendentemente los datos

97,105,131,134,151,153,154,154,157,160,163,174,175,178,180,183,190,196,199,201,207,
218,221,228,245

n = 25
K = 25

Formula:

PK =






Obtencion de resultados:


P25 =

= 6.25 = 7 = 154


P50 =((50)(25))/100 = 12.5 = 13 = 175

P75 =((75)(25))/100 = 18.75 = 19 = 199


Cada valor obtenido se ubica en los datos ya ordenados decuerdo a su numero de posicion, para obtener el resultado.



Cuantiles
Los cuantiles son medidas de posición que se determinan mediante un metodos que determina la ubicación de los valores que dividen un conjunto de observaciones en partes iguales.
Los cuantiles son los valores de la distribución que la dividen en partes iguales, es decir, en intervalos que comprenden el mismo número de valores. Cuando la distribución contiene un número alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella, se puede dividir la distribución en cuatro, en diez o en cien partes.
Los más usados son los cuartiles, cuando dividen la distribución en cuatro partes; los deciles, cuando dividen la distribución en diez partes y los centiles o percentiles, cuando dividen la distribución en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma una extensión de la mediana.
Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):



Q(u)

0.5 Mediana
0.25,0.75 Cuartiles
0.1,…0.99 Deciles
0.01,…0.99 Percentiles


Cuartiles

Son tres valores con las siguientes características:
Q1: Primer cuartil, que es el valor de la variable por debajo del cual queda 1/4 de los elementos
de la serie es tudiada.
Q3: Tercer cuartil, que es el valor de la variable por debajo del cual que dan los 3/4 de los
elementos que constituyen la serie.
Evidentemente el segundo cuartil coincide con la mediana. Como puede comprobarse, no tendría
ninguna utilidad definir el cuarto cuartil.

Para datos Agrupados
Normal 0 21 false false false MicrosoftInternetExplorer4
Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una
tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente: