PROYECTO SEGUNDO BIMESTRE

Entradas

Mostrando las entradas de agosto, 2023

agosto 31, 2023

SEMANA 4. DIA 3 Agosto 31, 2023 Intervalo de Confianza Se procede a la recolección y cálculo de datos para su posterior análisis. El valor de z se lo buscó en la tabla de Distribución acumulada normal Z, por lo que se tuvo que analizar cuando Z vale 0.975.

agosto 30, 2023

SEMANA 4. DIA 2 agosto 30, 2023 Intervalo de confianza Como anteriormente se determinó, la forma que se va a utilizar para el intervalo es: Debido a que la cantidad de muestra es mayor a 30, más específicamente de 35. De donde se debe tomar en cuenta una pequeña de incertidumbre, puesto que, este tipo cálculos son aproximaciones y no datos 100% verídicos y exactos. Dando que, el intervalo de confianza se lo calcule como: Donde, para el límite inferior del intervalo es la resta del promedio de los valores de x (los ingresos mensuales por familia en dólares) y el error o incertidumbre del análisis. Mientras que el límite superior del intervalo es la suma de ambos datos.

agosto 30, 2023

SEMANA 4. DIA 1 Agosto 30, 2023 Nivel de confianza El nivel de confianza escogido para obtener el intervalo de confianza fue del 95 %. Se determina que el intervalo de confianza es de una varianza desconocida. Se tomó en cuenta que el valor de la variable x, la cual se va a estudiar para el intervalo, será: X: Ingreso mensual por familia en dólares El nivel de confianza (r) escogido es del 95 %. Por tanto, el nivel de significancia ( α ) es de 5 %. Como el tamaño de la muestra es mayor a 30, se puede utilizar la forma de la distribución normal, con Z, para hallar el intervalo de confianza:

SEMANA 3. DIA 4

agosto 25, 2023

Cálculo de coeficiente de determinación. Con los integrantes del grupo y mediante la plataforma excel se determino el coeficiente de determinación. A continuación se aplico la formula del coeficiente de determinación: Un coeficiente de determinación (R²) de 0.4217 indica que la recta de regresión lineal tiene baja confiablilidad y no proporciona un ajuste bueno a los datos. R² varía entre 0 y 1, donde 1 representa un ajuste perfecto, es decir, toda la variabilidad de la variable de respuesta (Y) es explicada por la recta de regresión. Cálculo de coeficiente de correlación.

SEMANA 3. DIA 3

agosto 24, 2023

Cálculo de coeficientes de modelo Con la ayuda de excel se realzó los respectivos cálculos como la sumatoria de x y y, así también como x2 y x*y para la obtención de los coeficientes de modelo de regresión lineal. De igual manera se calculó los valores de b0 y b1 con las siguientes formulas: Finalmente se obtuvo la ecuación de regresión lineal: Gráfica de regresión lineal De la gráfica se puede interpretar que mientras aumenta el ingreso mensual, el gasto de tarifa móvil de las familias también aumentará.

SEMANA 3. DIA 2

agosto 22, 2023

Gráfico de dispersión Se realizo el gráfico de dispersión en base a los datos obtenidos en la encuesta. Se busca analizar el efecto del ingreso por familia sobre los gastos de tarifa móvil. Los puntos tienen una dispersión pequeña, así se puede determinar que existe una relación lineal entre "x" y "y".

SEMANA 3. DIA 1

agosto 21, 2023

Asignación de variables Entre todos los integrantes se definió las variables para el proyecto. x: Ingreso mensual por familia y :Gasto de la tarifa móvil A continuación se realizó una pequeña encuesta a los estudiantes de la facultad de Ingeniería Eléctrica y Electrónica de la Universidad Escuela Politécnica Nacional. Link de la encuesta: https://docs.google.com/forms/d/e/1FAIpQLSc2jqpit1zV6Th_tCp5XOyEUwNSev8BZT8_R1Xc4wbXkF3_hQ/viewform?usp=sf_link Así también, se determinó el nivel de confianza a utilizar, el mismo que será del 95%.

SEMANA 2. DIA 4

agosto 15, 2023

ZONA DE RECHAZO Y P-VALOR A continuación los integrantes del grupo realizaron una investigación sobre la zona de rechazo y p-valor. ZONA DE RECHAZO Es el rango de valores en el que, si cae el estadístico de prueba, se rechaza la hipótesis nula en favor de la hipótesis alternativa. Está determinada por el nivel de significancia y la distribución de probabilidad del estadístico. Es decir, es el área de distribución muestral que corresponde a los valores del estadístico de contraste que se encuentran tan alejados de la afirmación establecida en H0, que es muy poco probable que ocurran si H0 es verdadera. Su probabilidad se denomina nivel de significación o nivel de riesgo y se representa con la letra α . La región crítica o de rechazo es el conjunto de valores muestrales para los cuales se rechaza . Su complementario es la región de aceptación conjunto de valores muestrales para los cuales se acepta . Determinada una de ellas queda determinada la regla de decisión, el contraste....

SEMANA 2. DIA 3

agosto 14, 2023

TIPOS DE ERRORES Y ESTADÍSTICOS DE PRUEBA A continuación los integrantes realizaron una investigación sobre los tipos de errores y estadísticos de prueba. TIPOS DE ERRORES En el estudio de la probabilidad se determinan las posibilidades de lo que puede ocurrir en alguna situación. Sin embargo, puede ocurrir que las conclusiones a las que se llegue no sean del todo correctas, puesto que, no se puede establecer que una prueba de hipótesis sea completamente cierta. Por tanto, es indispensable hallar el error que conlleva la posibilidad. Antes, es correcto identificar el tipo de error. ERROR DE TIPO I Al momento de analizar la hipótesis nula resulta que esta es verdadera, el error es del tipo I y la probabilidad de que ocurra es el nivel de significancia ( α) el cual se fijó al momento de realizar la prueba de hipótesis. En otras palabras, del nivel de significancia es el porcentaje de incertidumbre que está dispuesto a aceptar. Para disminuir el error...

SEMANA 2. DIA 2

agosto 13, 2023

TIPOS DE HIPOTESIS Las hipótesis estadísticas son la transformación de las hipótesis de investigación, nulas y alternativas en símbolos estadísticos. Hipótesis de investigación Las hipótesis de investigación intentan explicar cómo dos o más variables están relacionadas. También se les denomina hipótesis de trabajo, ya que en función de ellas el investigador conduce las actividades procedentes a resolver el problema de investigación. Se simbolizan como Hi. Hipótesis nulas Las hipótesis nulas son la contraparte de la hipótesis de investigación. Sirven para rechazar o rebatir la hipótesis de trabajo. Se simbolizan como Ho. Hipótesis alternativas Son explicaciones opcionales diferentes de las hipótesis de investigación y nula. Se simbolizan como Ha. Hipótesis correlacionales Estas hipótesis buscan asociar o relacionar dos o más variables, sin necesariamente establecer cuál causa la otra. Es decir, cuando una variable está presente, aparece también otra variable. Hi...

SEMANA 2. DIA 1

agosto 11, 2023

INTERVALO DE CONFIANZA Un intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una determinada probabilidad). Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el parámetro poblacional. 1. La distribución de la población es normal. 2. El valor de la desviación estándar de la población es conocido. La forma general de un intervalo de confianza para una media poblacional única, desviación típica conocida, distribución normal, viene dada por: donde: n es el tamaño de la muestra. zα/2 el valor de z que corresponde al área α/2 en el extremo superior de la distribución normal estándar. Intervalo de confianza para la media pobl...

SEMANA 1 DIA 5

agosto 10, 2023

VALORES POR PREDECIR El análisis de regresión lineal se utiliza para predecir el valor de una variable en función del valor de otra variable. La variable que desea predecir se llama variable dependiente. Una variable que se utiliza para predecir el valor de otra variable se llama variable independiente. ERRORES DE ESTIMACIÓN Un error es una variable aleatoria numérica y no puede capturar todo el comportamiento de la variable aleatoria en un conjunto de observaciones. El error es solo una variable aleatoria y, por lo general, es una variable aleatoria muy sesgada. El residual (o error) del modelo es la diferencia entre los datos y el valor predicho del modelo ajustado. Los residuos representan la proporción de variabilidad explicada en el modelo. A medida que R² aumenta, la cantidad restante disminuye. Existe un error en la estimación el cual explica el por qué no se ajustan con exactitud los valores. Donde e (el residuo) representa la diferencia entre el valor real Y y el valor es...

SEMANA 1 DIA 4

agosto 09, 2023

COEFICIENTES DE REGRESIÓN El coeficiente de determinación, R^2 La medida más importante de la bondad del ajuste es el coeficiente de determinación R2. Este coeficiente nos indica el grado de ajuste de la recta de regresión a los valores de la muestra, y se define como la pro- porción de varianza explicada por la recta de regresión, es decir: Así también podemos escribir la definición del coeficiente de determinación de esta manera: Observando estas expresiones, es fácil apreciar las características de este coeficiente. S • R^2=1 cuando el ajuste es perfecto, es decir, cuando todos los puntos se encuentran sobre la recta de regresión. En este caso los residuos son cero y la suma de sus cuadrados también y, por tanto, SCR = SCT. • R^2 = 0 denota la inexistencia de relación entre las variables X e Y. En este caso la suma de residuos es máxima y tenemos que SCE  SCT. • Puesto que R^2 nos explica la proporción de variabilidad de los datos que queda explicada por el modelo de regresión...

SEMANA 1 DIA 3

agosto 08, 2023

COEFICIENTE DE MODELO El modelo de regresión lineal simple analiza cuantitativamente lo que varía la variable dependiente en respuesta a los cambios de una sola variable independiente . Se realiza la representación gráfica mediante una línea recta. ¿Cómo interpretas los coeficientes modelo regresión de una relación lineal? El coeficiente de regresión representa el cambio promedio en la variable de respuesta para un cambio unitario en la variable predictora, manteniendo constantes las otras variables predictoras en el modelo. Crea una relación lineal entre dos variables. De esa forma, sus cálculos saben exactamente cómo se distribuyen los valores de una variable en relación con la media de esa variable.