2. Funciones para leer datos
• Esta es la función para leer un archivo csv
• read.csv()
• Pero hay mas
• read.table() #igual que el csv, pero con la diferencia del
tabulador de coma
• readLines() #para leer líneas de un archivo de texto
• unserialize() #para leer archivos en forma binaria
2
3. Argumentos de la función
read.csv()
• Estos parámetros sirven para indicarle a la función la lectura
de los datos, en forma personalizada
• file #el nombre del archivo
• header #dato booleano que especifica si se leerá el
encabezado
• sep #cadena que indica como están separadas las columnas
• colClasses #indica el tipo de dato que contiene cada
columna
• nrows #indica el número de filas en el archivo
• skip #indica cuántas líneas NO serán leídas desde el inicio
3
4. Configuración del workspace
• Antes de leer el archivo deben asegurarse que esté ubicado en
el workspace.
• El workspace se puede saber con la función getwd().
• Para cambiarlo: Menu File/Chage dir
• Para listar el contenido del directorio se hace con la función
dir().
> getwd()
[1] "C:/"
>
4
5. Archivo de ejemplo
• Este es el archivo de ejemplo que será utilizado
• El archivo tiene 3 encabezados
• El primero es de tipo carácter
• El segundo es de tipo booleano 5
• El tercero es de tipo numérico
6. Ejemplo
• Con ésta línea se accesa al archivo CSV
testcsv <- read.csv(file="test1.csv",head=TRUE,sep=",")
• Se están tomando en cuenta 3 argumentos
• file, el nombre del archivo
• head, con encabezados
• sep, las columnas separadas por coma
6
7. Ejemplo
> testcsv <- read.csv(file="test1.csv",head=TRUE,sep=",")
> testcsv
color trabajo clase
1 amarillo TRUE 1
2 azul FALSE 2
3 rojo FALSE 2
4 amarillo TRUE 1
>
• En el ejemplo anterior se lee un archivo csv y se
muestra el contenido en consola.
7
8. Ejemplo
• Hay veces que es necesario especificar el número de
columnas a leer, esto se hace con el argumento nrows,
como se muestra en el ejemplo.
> testcsv <- read.csv(file="test1.csv",head=TRUE,sep=",",
nrows=2)
> testcsv
color trabajo clase
1 amarillo TRUE 1
2 azul FALSE 2
> #Y solo se muestran 2 filas
8
9. Ejemplo
• La función summary() devuelve las
especificaciones de los datos.
• De acuerdo al ejemplo, se muestran 3 columnas:
• color, indica el número de ocurrencias de cada
instancia
• trabajo, R lo detecta como booleano
• clase, se detecta como tipo numérico
> summary(testcsv)
color trabajo clase
amarillo:2 Mode :logical Min. :1.0
azul :1 FALSE:2 1st Qu.:1.0
rojo :1 TRUE :2 Median :1.5
NA's :0 Mean :1.5
3rd Qu.:2.0 9
Max. :2.0