viernes, 22 de mayo de 2009

DIAGRAMA DE CAJA O BLOX---PLOT....






DIAGRAMA DE CAJA:Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la caja, y dos brazos, los bigotes.
Es un gráfico que se suministra información sobre los valores mínimo y máximo, los cuartIles Q1, Q2 o
mediana y Q3, y sobre la existencia de valores atípicos y simetría de la distribución:



COMO SE CONSTRUYE UN DIAGRAMA DE CAJA O BLOX--PLOT:

Ordenar los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3 y el rango intercuartil (IQR)

En el ejemplo: Valor 7: es el Q1 (25% de los datos) Valor 8.5: es el Q2 o mediana (el 50% de los datos) Valor 9: es el Q3 (75% de los datos) Rango intercuartil IQR (Q3-Q1)=2
Dibujar un rectángulo con Q1 y Q3 como extremos e indicar la posición de la mediana (Q2) mediante una línea.

Para dibujar los bigotes, las líneas que se extienden desde la caja, hay que calcular los límites superior e inferior, Li y Ls, que identifiquen a los valores atípicos.

Para ello se calcula cuando se consideran atípicos los valores. Son aquellos inferiores a Q1-1.5*IQR o superiores a Q3+1.5*IQR. En el ejemplo: inferior: 7-1.5*2=4 superior: 9+1.5*2=12 Ahora se buscan los últimos valores que NO son atípicos, que serán los extremos de los bigotes. En el ejemplo: 5 y 10

Marcar como atípicos todos los datos que están fuera del intervalo (Li, Ls).
En el ejemplo: 0.5 y 3.5 Pero además se pueden considerar valores extremadamente atípicos a los que exceden Q1-3*IQR o Q3+3*IQR. De tal modo que, en el ejemplo: inferior: 7-3*2=1 superior: 9+3*2=15 El valor 0.5 seria atípico extremo y 3.5 sería atípico.

Proporcionan una visión general de la simetría de la distribución de los datos, si la media no está en el centro del rectángulo, la distribución no es simétrica.
Son útiles para ver la presencia de
valores atípicos.
COMENTARIO: EL DIAGRAMA DE CAJA O DE BLOX--PLOT ESTE No es más que un grafico a traves del cual podemos representar los cuartiles 1,2,3 , la mediana asi
mismo sirve para para establecer datos a típicos los cuales los podemos encontrar o ubicar en el diagrma de cajas en el tambien neceitamos pasos y formulas a aplicar para asi determinar si las barreras ( interior superio, interior inferior, exterir inferior, exterior superior los establecemos alli o se encuentran fuera y determinamos los datos atípicos
1. barrera interior y barrera exterior: cuando los datos se encuentran alli los datos son a tipicos
2. si se encuentran datos despues de la barrera exterior se les llama datos a atipicos externos.






para determinar el rango intercuartilico necesitamos: restar Q1-Q3. Lo obtendremos para asi calcular las barreras.

la estadistica es base primordial en cual quier ambito a calcular..........

lunes, 4 de mayo de 2009

2do BIMESTRE

REGRESION: opinion:Es una forma estadistica en la cual nos podemos dar cuenta cuanto es la relacion que existe en dos casos a estudiar como por decir X y Y .o estimando datos la cual siempre tener en cuentaque tiene que existir otra variable la regresion se puede representar graficamente a través del diagrama de dispercion o la nube de puntos.

REGRESION: La regresión se emplea para denotar el proceso de estimar el valor de una de las variables en función de la otra, cuyo valor ya es dado.
Galton fue el primero en utilizar el termino en un estudio que hizo para relacionar las estaturas de padres a hijos indicando que la estatura de los hijos respecto de la de sus padres sufre una regresión a la media, es decir que los hijos de los padres con una determinada altura tienen una estatura media más cercana a la media de la población que a la de sus padres.
Cuando se calcula el valor de X en función de Y, se habla de una regresión de 1 en 2 y se estará calculando la primera variable en función de la segunda. La regresión 2 en 1 será cuando calculemos el valor para Y si conocemos el valor de X.
Análisis: La regresión consiste en predecir los valores de una variable Y conociendo los valores de otra variable X o de la misma manera predecir los valores de X conociendo los valores de Y.
Vimos que la fuerza de una correlación entre X y Y aumenta a medida que los puntos del diagrama de dispersión se estrechan formando una línea recta imaginaria. Esta línea la podemos identificar con una línea de regresión, línea recta que dibuja a través del
DIAGRAMA DE DISPERCION.
LA ECUACION: Y=a + b x, que describe la regresión entre las variables X y Y, se llama ecuación de regresión y su gráfica recta de regresión .
EJEMPLO: DIAGRAMA DE DISPRCION














LA FORMULA:forna punto pendiente.

Y2-Y1=m(X2-Y1)

asi como se muestra en la grafica se utilizan las formulas anteriores para determin



  • la regresion encontramos dos tipos: la regresion lineal

regresión cuadratica.

ya que estos fueron bistos en clase EJEMPLO: la inmagen indica que es una regresion lineal



lo mas importante para determinar si es lineal o cuadratica es realizando el diagrama de disperciól

Rectas de regresión, rectas que se asocian a una distribución bidimensional. Los valores de una distribución bidimensional dan lugar a una nube de puntos o diagrama de dispersión. Intuitivamente, una recta de regresión es una recta que se ajusta a esa nube de puntos. Sin embargo, al precisar matemáticamente a qué se llama “ajustarse” a la nube, se obtienen dos posibles rectas:
Recta de regresión de Y sobre X, cuya ecuación es
Recta de regresión de X sobre Y, de ecuación
Si la correlación es fuerte (r próximo a 1), ambas rectas casi se confunden. Si la correlación es débil (r próximo a 0), las dos rectas forman un ángulo muy abierto.
Ambas rectas de regresión pasan por el punto (,), que se llama centro de gravedad de la distribución

Un Diagrama de Dispersión es la forma mas sencilla de definir si existe o no una relación causa efecto entre dos variables y que tan firme es esta relación, como estatura y peso. Una aumenta al mismo tiempo con la otra.El Diagrama de Dispersión es de gran utilidad para la solución de problemas de la calidad en un proceso y producto, ya que nos sirve para comprobar que causas (factores) están influyendo o perturbando la dispersión de una característica de calidad o variable del proceso a controlar.Los motivos mas comunes de este tipo de diagrama son analizar:
La relación entre una causa y un efecto.
La relación entre una causa y otra.
La relación entre una causa y otras dos causas.
Un efecto y otro efecta

REGRESION LINEAL:En estadística la regresión lineal o ajuste lineal es un método matemático que modeliza la relación entre una variable dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede ser expresado como:
Opinión: en la regresión lineal no se encontrara una diferencia grande es decir los datos en el diagrama de dispercion no estarán disperson ya que como se sabe que el diagrama es la que define que tipo de regresion es, simplemente encontraremos la relación que existe en diversas variables


El diagrama de disperción define entonces en la grafica se define que puede existir regresion lineal positiva, negativa o incluso nula.




para determinar la ecuacion necesitamos formulas:








Opinión: con las formulas podemos determinar la ecuación ya que como se muestra en la imagen asi como a0 y a1 siempre y cuando estimar valores con la formula:



FORMULA DE ESTIMACION

Y=A+BX
REGRESION LINEAL(calculadora):
El profesor nos eseño un metodo con el cual podemos calcular la regresion lineal por medio de la calculadora la cual es eficaz y determinar manual mente el resultado.


REGRESION CUADRATICA
REGRESION CUADRATICA:
La regresión cuadrática es el proceso por el cuál encontramos los parámetros de una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean mediciones hechas o de otro tipo. Bueno, pero por que habríamos de querer ajustar nuestros datos precisamente a una parábola y no a otra función? (ver escogiendo la función de ajuste)



oPINION:



lA regresion caudratica como se muestra en la grafica de dipercion los datos no estarar dispersos pero llevaran una curva de desviación .



ya que el la regresion cuadratica utiliza el sistema de ecuaciones de 3 variables las cuales sos sustituidas por ao, a1, y a2 o A, B, C.



LA FORMULA A UTILIZAR:
Y=a0 + a1x + a2x2 y esta sera la ecuacion a utilizar.

en la regresion cuadratica se utiliza las formulas de 3 variables de la misma manera uno puede determinar sus datos a través de la calculadora como ya fue instruido en clase.



CORRELACION: Es la relacionón que se tiene de dos variables al determinar dos casos estudiados , ya que es como la tendencia de dos o más vaiables de un mismo colectivo a variar concomitamente.
GRADOS DE CORRELACION: Como hemos visto entre 2 variables de un mismo colectivo, puede existtir alguna relación o no existir ninguna , de ahí que la correlacion se pueda presentar en distintos grados que van desde una correlacion perfecta hasta una correlación nula.


PRFECTA: que pueda ser positica o negativa.en cuanto al crecer o decrecer una variable, crece o decrece la otra aumentan o disminuyen


IMPERFECTA: que pueda ser excelente, aceptable, regular o mínima. se determina cuando los puntos dados por cada par de valore de las variables, no caen sobre la diagonal sino que se acercan a el.


NULA:es cuando entre las dos varibles no hay ninguna relacion ylos puntos se disminuyen desordenadamente sobre todo el plano.



COVARIANZA:Es la relacion entre variables se puede expresar en forma n{umerica, la covarinza es una medida de asociación lineal entre dos varibles que resume la información existente en un grafico de disperción

OPINION: Ya que se expresa númericamente utilizando la dormula pero utilizando la formula ya que a través de ella podemos determinar el resultado exponiendolo n{umericamente.


El análisis de la covarianza es una técnica estadística que, utilizando un modelo de regresión lineal múltiple, busca comparar los resultados obtenidos en diferentes grupos de una variable cuantitativa pero corrigiendo las posibles diferencias existentes entre los grupos en otras variables que pudieran afectar también al resultado (covariantes).
En el estudio conjunto de dos variables, lo que interesa principalmente es saber si existe algún tipo de relación entre ellas. Esto se ve gráficamente con el
diagrama de dispersión. La covarianza S(X,Y) de dos variables aleatorias X e Y se define como:
FORMULA:






CONCLUSION: para La regresión siempre utilizaremos dos casos o más en la cual encontraremos la cusa y el efecto con la cual ejecuataremos las formulas ya expuestas pero pra determinar que ripo de regresión se estudia si es lineal, cuadratica, esponencial, etc. necesitamos graficar el diagrama de disperción ya que es la raiz para proceser el trabajo, si olvidar que predecir datos es lo más esencial en un trabjo estadistico, ya que todo los que nos rodea lo podemos estudiar a través de medios estadisticos o el mundo cientifico estadístico. To ello nos lleva a la conclusión de que grado se encuntra los datos a estudiar.