Tuve la oportunidad dentro del Máster en Business Intelligence de la EAEBusiness School, de desarrollar un pequeño proyecto para probar algunas funciones muy útiles de R.
Describiré los retos que tuve que resolver por medio de R y las funciones utilizadas:
A tener en cuenta:
- No todos los resultados deben ser almacenados en variables, sobre todo si mas adelante no utilizarás los resultados, en mi caso personal, yo asignaba muchos resultados a variables por preferencia personal.
- Depende de cuan limpio quieres que quede el código, puedes separar paso a paso la utilización de las funciones o puedes utilizar función dentro de función directamente
- Yo utilicé el formato de R Markdown
Problemas a resolver
- A partir de un vector de caracteres nuevo con algunas letras en mayúsculas, convertirlas en minúsculas. Primero se debe crear el vector que se quiere convertir
#primero creamos la cadena a convertir
vectorivanna <- c("I", "V", "A", "N", "n", "a", "G", "U", "e", "R","r","E","R","o")
#convertir a minuscula
vectorivannaminuscula<-tolower(vectorivanna)
vectorivannaminuscula
Funciones utilizadas: c (), tolower()
Explicación: En esta instruccion estamos asignandole a una nueva variable que se llama «vectorivanna» el resultado de la operacion que arroje la funcion «c», por medio de los simbolos <- se asigna un resultado a una variable, el resultado de la función c() que es para crear un vector, al cual le asignamos valores inmediatamente de tipo «character». Con la funcion tolower() estamos convirtiéndola en minuscula.
2. Leer el fichero paro del set de datos y cargarlo en una variable llamada «abc»
```{r PREGUNTA 2}
library(readr)
abc <- read_delim("C:/Users/Downloads/datos/abc.csv",
"\t", trim_ws = TRUE)
```
Funciones utilizadas: read_delim (), library().
Explicación: Estamos asignandole a la variable abc el data set que estamos importando a rstudio por medio de la funcion read_delim(), donde le pasamos como argumentos la direccion donde se localiza el archivo csv que queremos importar, le indicamos que estamos utilizando un separador con Tab, trim_ws para recortar los espacios en blanco al inicio o al final de las palabras
3. ¿De que clase es instancia este objeto?
En R al crear un objeto, la mayoría se crea con atributos, a los que pueden ser accedidos por medio de la función class, en el paso anterior creamos el objeto abc que es donde almacenamos el csv con el tipo data_frame
```{r PREGUNTA 2.1}
#2.1
class (abc)
```
#RESULTADO
[1] "tbl_df" "tbl" "data.frame"
Funcion utilizada: class().
Explicación: como argumento le enviamos el objeto que creamos en la pregunta anterior, el resultado nos indica que efectivamente es de tipo data frame.
4. ¿Cómo puedes ver cuáles son las clases de cada columna y una muestra de ejemplo?
Queremos saber por cada columna el tipo de dato que esta almacena
sapply (abc,class) ## Gender Provinces Periodo Situation value ## "character" "character" "character" "character" "numeric"
Funciones utilizadas: sapply(), class()
Explicacion: por medio de sapply estamos indicando que los datos del objeto abc, deben ser pasados como argumentos a la funcion class, columna por columna. LEER MAS DE SAPPLY
5. Ver los primeros 5 registros
head(abc, n=5)
Funciones utilizadas: sapply(), class()
Explicacion: por medio de sapply estamos indicando que los datos del objeto abc, deben ser pasados como argumentos a la funcion class, columna por columna.
6. Ver los últimos 8 registros
tail(abc, n=8)
Funciones utilizadas: tail()
Explicacion: Con la función tail(), le enviamos como argumento el objeto abc y le indicamos que queremos los últimos 8 registros.
7. ¿Como se puede saber la dimensión del dataset?
dim (abc) #RESULTADO [1] 8320 5
Funciones utilizadas: dim()
Explicación: con la función dim se puede saber cuantas filas y columnas tiene un dataset, también se puede llamar cuantas variables y observaciones, las variables vendrían siendo las columnas y las observaciones la cantidad de filas.
8. Como se puede saber el nombre de las columnas
names (abc)
Funciones utilizadas: names()
Explicación: con esta función puedes saber cual es el nombre de cada una de las variables o columnas de un DataSet, que se puede entender como el encabezado de cada una de las columnas.
9. ¿Calcula la suma de una columna?
suma<-sum(abc$nombredecolumna, na.rm = TRUE)
Funciones utilizadas: sum()
Explicación: le pasamos como parámetro el dataset con la columna específica que se quere sumar, le cambiamos el parámetro na.rm a TRUE que significaría ignorar las filas que tengan valores nulos.
10. Calcule la suma de todas las columnas de la tabla
suma<-sum(abc$nombredecolumna, na.rm = TRUE)
Funciones utilizadas: sum()
Explicación: le pasamos como parámetro el dataset con la columna específica que se quere sumar, le cambiamos el parámetro na.rm a TRUE que significaría ignorar las filas que tengan valores nulos.
sumacol<- colSums(Filter(is.numeric, iris)) sumatotal<- sum(sumacol)






Deja un comentario