Antes de leer los datos en R, se pueden ver en Excel o en un editor de texto.
(a) Use la funcin read.csv() para leer los datos en R. Llame al colegio de datos cargado.
Asegrese de tener el directorio configurado en la ubicacin correcta para los datos.
(b) Mire los datos usando la funcin fix(). Debe notar que la primera columna es solo el nombre
de cada universidad. Realmente no queremos que R trate esto como datos. Sin embargo, puede
ser til tener estos nombres para ms adelante. Pruebe los siguientes comandos: 2.4 Ejercicios 55
(c) > rownames(college)=college[,1] > fix(college) Debera ver que ahora hay una columna
row.names con el nombre de cada universidad registrada. Esto significa que R le ha dado a cada
fila un nombre correspondiente a la universidad apropiada. R no intentar realizar clculos en los
nombres de las filas. Sin embargo, todava necesitamos eliminar la primera columna en los datos
donde se almacenan los nombres. Prueba > college=college[,-1] > fix(college) Ahora deberas ver
que la primera columna de datos es Privada. Tenga en cuenta que ahora aparece otra columna
con la etiqueta row.names antes de la columna Private. Sin embargo, esta no es una columna de
datos, sino el nombre que R le da a cada fila.
i. Utilice la funcin summary() para producir un resumen numrico de las variables en el conjunto
de datos.
ii. Use la funcin pairs() para producir una matriz de diagrama de dispersin de las primeras diez
columnas o variables de los datos. Recuerde que puede hacer referencia a las primeras diez
columnas de una matriz A usando A[,1:10].
iii. Use la funcin plot() para producir diagramas de caja uno al lado del otro de Outstate versus
Private.
IV. Cree una nueva variable cualitativa, denominada Elite, agrupando la variable Top10perc.
Vamos a dividir las universidades en dos grupos en funcin de si la proporcin de estudiantes que
provienen del 10% superior de sus clases de secundaria supera o no el 50%. >
Elite=rep("No",nrow(college)) > Elite[college$Top10perc >50]="Yes" > Elite=as.factor(Elite) >
college=data.frame(college ,Elite) Use el resumen () funcin para ver cuntas universidades de lite
hay. Ahora use la funcin plot() para producir diagramas de caja uno al lado del otro de Outstate
versus Elite.
v. Use la funcin hist() para producir algunos histogramas con diferentes nmeros de intervalos
para algunas de las variables cuantitativas. Puede encontrar til el comando par(mfrow=c(2,2)):
dividir la ventana de impresin en cuatro regiones para que se puedan hacer cuatro grficos
simultneamente. Modificar los argumentos de esta funcin dividir la pantalla de otras formas.
vi. Contine explorando los datos y proporcione un breve resumen de lo que descubra..
Concurso de Innovación Pedagógica T2 FONDEP 2024 Ccesa007.pdf
Antes de leer los datos en R, se pueden ver en Excel o en un editor .pdf
1. Antes de leer los datos en R, se pueden ver en Excel o en un editor de texto.
(a) Use la funcin read.csv() para leer los datos en R. Llame al colegio de datos cargado.
Asegrese de tener el directorio configurado en la ubicacin correcta para los datos.
(b) Mire los datos usando la funcin fix(). Debe notar que la primera columna es solo el nombre
de cada universidad. Realmente no queremos que R trate esto como datos. Sin embargo, puede
ser til tener estos nombres para ms adelante. Pruebe los siguientes comandos: 2.4 Ejercicios 55
(c) > rownames(college)=college[,1] > fix(college) Debera ver que ahora hay una columna
row.names con el nombre de cada universidad registrada. Esto significa que R le ha dado a cada
fila un nombre correspondiente a la universidad apropiada. R no intentar realizar clculos en los
nombres de las filas. Sin embargo, todava necesitamos eliminar la primera columna en los datos
donde se almacenan los nombres. Prueba > college=college[,-1] > fix(college) Ahora deberas ver
que la primera columna de datos es Privada. Tenga en cuenta que ahora aparece otra columna
con la etiqueta row.names antes de la columna Private. Sin embargo, esta no es una columna de
datos, sino el nombre que R le da a cada fila.
i. Utilice la funcin summary() para producir un resumen numrico de las variables en el conjunto
de datos.
ii. Use la funcin pairs() para producir una matriz de diagrama de dispersin de las primeras diez
columnas o variables de los datos. Recuerde que puede hacer referencia a las primeras diez
columnas de una matriz A usando A[,1:10].
iii. Use la funcin plot() para producir diagramas de caja uno al lado del otro de Outstate versus
Private.
IV. Cree una nueva variable cualitativa, denominada Elite, agrupando la variable Top10perc.
Vamos a dividir las universidades en dos grupos en funcin de si la proporcin de estudiantes que
provienen del 10% superior de sus clases de secundaria supera o no el 50%. >
Elite=rep("No",nrow(college)) > Elite[college$Top10perc >50]="Yes" > Elite=as.factor(Elite) >
college=data.frame(college ,Elite) Use el resumen () funcin para ver cuntas universidades de lite
hay. Ahora use la funcin plot() para producir diagramas de caja uno al lado del otro de Outstate
versus Elite.
v. Use la funcin hist() para producir algunos histogramas con diferentes nmeros de intervalos
para algunas de las variables cuantitativas. Puede encontrar til el comando par(mfrow=c(2,2)):
dividir la ventana de impresin en cuatro regiones para que se puedan hacer cuatro grficos
simultneamente. Modificar los argumentos de esta funcin dividir la pantalla de otras formas.
vi. Contine explorando los datos y proporcione un breve resumen de lo que descubra.