R em 1 semana – Parte 5 de 7

Compartilhe!

Share on facebook
Share on linkedin
Share on twitter
Share on email
Share on whatsapp

Pacotes

Pacotes nada mais são que códigos prontos de terceiros, criados para solucionar problemas específicos ao implementar novas funções ao seu código R. Temos pacotes para Machine Learning, Matemática, Web Scraping, Desenvolvimento Web e outros milhares e aqui está o grande trunfo do movimento Open-Source: produção de pacotes em massa.

Onde encontrar pacotes? há 3 formas, via RStudio:

1. CRAN
Via linha de comando no próprio console RStudio com:
install.packages(“nome-do-pacote”,dependencies=TRUE)

2. Manualmente, no CRAN formato .zip ou .tar.gz;
no menu do Rstudio selecione Menu Tools > Install Packages > Install packages from pacage arquive file e selecione o pacote escolhido.

3. No R Studio, na tela 4, em “Packages”: busque, selecione e clique em “install”.

MÃO NA MASSA!

#Instala pacote
install.packages("ggplot2", dependencies=TRUE)

# Carrega pacote para ser utilizado no código
library(ggplot2)

Objetivo: instalar e carregar os principais pacotes R, além de executar algumas funções/métodos destes.

DPLYR

Pacote para manipulação de dataframes(estrutura de dados do tipo TABELA): essencial para o pré-processamento dos dados.

install.packages("dplyr") #instala
library(dplyr) #carrega

# carrega dados
dados = read.csv(file.choose(), header=TRUE, sep = ";")
  • filter() filtra linhas
  • arrange() ordena linhas
  • select() seleciona colunas
  • distinct() retira linhas duplicadas
  • mutate() constrói novas colunas
  • group_by() + summarise() sumariza valores por um ou mais fatores

TYDIR

Pacote para transformação de dataframes: pivotam, despivotam, condensam, derretem. Este tipo de tarefa é bastante complexa utilizando, por exemplo, SQL.

install.packages("tydir") #instala
library(tydir) #carrega

# carrega dados
install.packages("xlsx") #instala leitor xlsx
library(xlsx) #carrega leitor xlsx
dados = read.xlsx(file.choose())
  • gather() liga colunas
  • spread() espalha dados de 2 colunas em mais colunas
  • unit() unifica colunas em 1
  • separate() separa dados em novas colunas

STRINGR

Pacote para manipulação de strings, sendo possível incluir regex para tratamento.

install.packages("stringr") #instala
library(stringr) #carrega
  • str_pad() Manipula os espaços em branco em strings
  • str_trim() remove espaços em brancos
  • str_detect() detecta padrões e retorna vetor lógico com regex

Obviamente temos mais dezenas de bibliotecas para inserir, mas isto é assunto para a série BIBLIOTECAS R onde publicamos as melhores bibliotecas e tutoriais de cada uma destas

Receba em seu email o acesso as aulas e materiais

Vá além:

R em 1 semana – Parte 6 de 7

Dataviz Dataviz, ou Data Visualization, são técnicas que utilizamos para visualizar dados através de gráficos. Desta forma podemos trabalhar a intuição sobre os dados e