Capítulo 4 Pensamento computacional

4.1 R

4.1.1 O que é R?

R é um programa de computador de código aberto com linguagem computacional direcionada para análise estatística.^32,33
R version 4.5.2 (2025-10-31) está disponível gratuitamente em Comprehensive R Archive Network (CRAN).³⁴

4.1.2 Por que usar R?

R é o software de maior abrangência de métodos estatísticos, possui sintaxe que permite análises estatísticas reproduzíveis e está disponível gratuitamente no Comprehensive R Archive Network (CRAN).^28,34

4.1.3 O que é R Markdown?

R Markdown³⁵ é uma ferramenta que permite a integração de texto, código e saída em um único documento.^REF?
O R Markdown é uma extensão do Markdown, que é uma linguagem de marcação simples e fácil de aprender, que é usada para formatar texto.^REF?
O R Markdown permite a inclusão de blocos de código R, Python, SQL, C++, entre outros, e a saída desses blocos de código é incorporada ao documento final.^REF?
O R Markdown é uma ferramenta poderosa para a criação de relatórios dinâmicos, que podem ser facilmente atualizados com novos dados ou análises.^REF?
O R Markdown é amplamente utilizado na comunidade científica para a criação de relatórios de pesquisa, artigos científicos, apresentações, livros, entre outros.^REF?
O trabalho com RMarkdown³⁵ permite um fluxo de dados totalmente transparente, desde o conjunto de dados coletados até o manuscrito finalizado. Todos os aspectos do fluxo de dados podem ser incorporados em blocos de R script (chunk), exibindo tanto o R script quando o respectivo texto, tabelas e figuras formatadas no estilo científico de interesse.³⁶
O RMarkdown³⁵ foi projetado especificamente para relatórios dinâmicos onde a análise é realizada em R e oferece uma flexibilidade incrível por meio de uma linguagem de marcação.²⁸

4.1.4 Que programas de computador podem ser usados para análise estatística com R?

JASP.³⁷
jamovi.³⁸

Os pacotes jmv³⁹ e jmvconnect⁴⁰ fornecem funções para análise descritiva e inferencial com interface com jamovi.

4.2 RStudio

4.2.1 O que é RStudio?

RStudio é um ambiente de desenvolvimento integrado (integrated development environment, IDE) desenvolvido visando a reprodutibilidade e a simplicidade para a criação e disseminação de conhecimento.^33,41
O ambiente do RStudio é dividido em paineis:
- Source/Script editor: para edição de R scripts.³³
- Console: para execução de códigos simples.³³
- Environments: para visualização de objetos criados durante a sessão de trabalho.³³
- Output: para visualização de gráficos criados durante a sessão de trabalho.³³

Figura 4.1: Interface do RStudio. Fonte: https://docs.posit.co/ide/user/

As principais características do RStudio incluem um ambiente de edição com abas para acesso rápido a arquivos, comandos e resultados; histórico de comandos previamente utilizados; ferramentas para visualização de bancos de dados e elaboração de scripts e gráficos e tabelas.^33,41
RStudio está disponível gratuitamente em Posit.

O pacote learnr⁴² fornece tutoriais interativos para RStudio.

4.3 Scripts

4.3.1 O que são R scripts?

“Scripts são dados”.²⁹
Scripts permitem ao usuário se concentrar nas tarefas mais importantes da computação e utilizar pacotes ou bibliotecas para executar as funções mais básicas com maior eficiência.²⁹
Um script é um arquivo de texto contendo (quase) os mesmos comandos que você digitaria na linha de comando do R. O “quase” refere-se ao fato de que se você estiver usando sink() para enviar a saída para um arquivo, você terá que incluir alguns comandos em print() para obter a mesma saída da linha de comando.^REF?

Code

# Exemplo de R script

# Este é um comentário

# Esta é uma variável
variavel <- 3.14 # Atribui o valor 3.14 à variável

# Esta é uma função
f <- function(x) {
  return(x^2) # Retorna o quadrado do valor de x
}

# Esta é uma chamada de função
resultado <- f(variavel) # Chama a função f com a variável como argumento

# Exibe o resultado da função
print(resultado) # Exibe o resultado na saída padrão

# Este é um vetor
vetor <- c(1, 2, 3, 4, 5) # Cria um vetor com os valores de 1 a 5
# Exibe o vetor
print(vetor) # Exibe o vetor na saída padrão

# Esta é uma matrix
matriz <- matrix(1:9, nrow=3, ncol=3) # Cria uma matriz 3x3 com os valores de 1 a 9
# Exibe a matriz
print(matriz) # Exibe a matriz na saída padrão

# Esta é uma lista
lista <- list(nome="João", idade=30, altura=1.75) # Cria uma lista com nome, idade e altura
# Exibe a lista
print(lista) # Exibe a lista na saída padrão

# Este é um dataframe
dataframe <- data.frame(nome=c("João", "Maria", "José"), idade=c(30, 25, 40), altura=c(1.75, 1.60, 1.80)) # Cria um dataframe com nome, idade e altura
# Exibe o dataframe
print(dataframe) # Exibe o dataframe na saída padrão

# Este é um loop for
for (i in 1:5) {
  print(i) # Exibe os valores de 1 a 5 na saída padrão
}

# Este é um loop while
j <- 1
while (j <= 5) {
  print(j) # Exibe os valores de 1 a 5 na saída padrão
  j <- j + 1 # Incrementa o valor de j em 1
}

# Este é um condicional if-else
k <- 3
if (k > 0) {
  print("k é positivo") # Exibe "k é positivo" se k for maior que 0
} else if (k < 0) {
  print("k é negativo") # Exibe "k é negativo" se k for menor que 0
} else {
  print("k é zero") # Exibe "k é zero" se k for igual a 0
}

# Fim do exemplo de R script

4.3.2 Quais são as boas práticas na redação de scripts?

Use nomes consistentes para as variáveis.⁴³
Defina os tipos de variáveis adequadamente no banco de dados.⁴³
Defina constantes — isto é, variáveis de valor fixo — ao invés de digitar valores.⁴³
Use e cite os pacotes disponíveis para suas análises.⁴³
Controle as versões do script.^43,44
Teste o script antes de sua utilização.⁴³
Conduza revisão por pares do código durante a redação (digitação em dupla).⁴³

O pacote formatR⁴⁵ fornece a função tidy_source para formatar um R script.

O pacote styler⁴⁶ fornece a função style_file para formatar um R script.

O pacote lintr⁴⁷ fornece a função lint para verificar a adesão de um script a um determinado estilo, identificando erros de sintaxe e possíveis problemas semânticos.

4.4 Pacotes

4.4.1 O que são pacotes?

Pacotes são conjuntos de scripts programados pela comunidade e compartilhados para uso público.³³
Os pacotes ficam armazenados no Comprehensive R Archive Network (CRAN) e podem ser instalados diretamente no RStudio.^33,34
Na mais recente atualização deste livro, o [Comprehensive R Archive Network (CRAN) possui 392513 pacotes disponíveis.^33,34
Os pacotes disponíveis podem ser encontrados em R PACKAGES DOCUMENTATION.⁴⁸

O pacote utils⁴⁹ fornece a função install.packages para instalar os pacotes no computador.

O pacote utils⁴⁹ fornece a função library para carregar os pacotes instalados no computador.

O pacote utils⁴⁹ fornece a função require para indicar se o pacote requisitado está disponível.

O pacote utils⁴⁹ fornece a função installed.packages para listar os pacotes instalados no computador.

O pacote utils⁴⁹ fornece a função update.packages para atualizar os pacotes instalados no computador.

O pacote roxygen2⁵⁰ fornece a função roxygenize para criar arquivos .Rd para documentar pacotes.

4.5 Aplicativos

4.5.1 O que são Shiny Apps?

Shiny Apps são aplicativos web interativos que permitem a criação de interfaces gráficas para visualização e análise de dados em tempo real, utilizando o R como backend.^REF?

4.6 Manuscritos reproduzíveis

4.6.1 O que são manuscritos reproduzíveis?

Manuscritos reproduzíveis — manuscritos executáveis ou relatórios dinâmicos — permitem a produção de um manuscrito completo a partir da integração do banco de dados da(s) amostra(s), do(s) script(s) de análise estatística (incluindo comentários para sua interpretação), dos pacotes ou bibliotecas utilizados, das fontes e referências bibliográficas citadas, além dos demais elementos textuais (tabelas, gráficos) - todos gerados dinamicamente.²⁹

4.6.2 Por que usar manuscritos reproduzíveis?

No processo tradicional de redação científica há muitas etapas de copiar e colar não reproduzíveis envolvidas. Documentos dinâmicos combinam uma ferramenta de processamento de texto com o R script que produz o texto/tabela/figura a ser incorporado no manuscrito.²⁸
Ao trabalhar com relatórios dinâmicos, é possível extrair o mesmo script usado para análise estatística. Os documentos podem ser compilados em vários formatos de saída e salvos como DOCX, PPTX e PDF.²⁸
Muitos erros de análise poderiam ser evitados com a adoção de boas práticas de programação em manuscritos reproduzíveis.⁵¹

O pacote rmarkdown³⁵ fornece as funções render para criar manuscritos reprodutíveis a partir de arquivos .Rmd.

O pacote officedown⁵² fornece as funções rdocx_document e rpptx_document para criar arquivos DOCX e PPTX, respectivamente, com o conteúdo criado no manuscrito reprodutível.

O pacote bookdown⁵³ fornece as funções gitbook, pdf_book, epub_book e html_document2 para criar documentos reprodutíveis em diversos formatos (Git, PDF, EPUB e HTML, respectivamente).

4.6.3 Como manuscritos reprodutíveis contribuem para a ciência?

O compartilhamento de bancos de dados e seus scripts de análise estatística permitem a adoção de práticas reprodutíveis, tais como a reanálise dos dados.⁵⁴

O pacote projects⁵⁵ fornece a função setup_projects para criar um projeto com arquivos organizados em diretórios.

O pacote rmarkdown³⁵ fornece a função render para criar manuscritos reprodutíveis a partir de arquivos .Rmd.

O pacote bookdown⁵³ fornece as funções gitbook, pdf_book, epub_book e html_document2 para criar documentos reprodutíveis em diversos formatos (Git, PDF, EPUB e HTML, respectivamente).

4.7 Compartilhamento

4.7.1 Por que compartilhar scripts?

Compartilhar o script — principalmente junto aos dados — pode facilitar a replicação direta do estudo, a detecção de eventuais erros de análise, a detecção de pesquisas fraudulentas.⁵⁶

4.7.2 O que pode ser compartilhado?

Idealmente, todos os scripts, pacotes/bibliotecas e dados necessários para outros reproduzirem seus dados.⁴⁴
Minimamente, partes importantes incluindo implementações de novos algoritmos e dados que permitam reproduzir um resultado importante.⁴⁴

4.7.3 Como preparar dados para compartilhamento?

.^REF?

4.7.4 Como preparar scripts para compartilhamento?

Providencie a documentação sobre seu script (ex.: arquivo README).⁴⁴
Inclua a versão dos pacotes usados no seu script por meio de um script inicial para instalação de pacotes (ex.: ‘instalar.R’).⁵¹
Documente em um arquivo README os arquivos disponíveis e os pré-requisitos necessários para executar o código (ex.: pacotes e respectivas versões). Uma lista de configurações (hardware e software) que foram usadas para rodar o código pode ajudar na reprodução dos resultados.²⁷
Use endereços de arquivos relativos.⁵¹
Crie links persistentes para versões do seu script.⁴⁴
Defina uma semente para o gerador de números aleatórios em scripts com métodos computacionais que dependem da geração de números pseudoaleatórios.²⁷

O pacote base⁵⁷ fornece a função set.seed para especificar uma semente para reprodutibilidade de computações que envolvem números aleatórios.

Escolha uma licença apropriada para garantir os direitos de criação e como outros poderão usar seus scripts.⁴⁴
Teste o script em uma nova sessão antes de compartilhar.⁵¹
Cite todos os pacotes relacionados à sua análise.⁵⁸

O pacote utils⁴⁹ fornece a função citation para citar o programa R e os pacotes da sessão atual.

O pacote grateful⁵⁹ fornece a função cite_packages para citar os pacotes utilizados em um projeto R.

Inclua a informação da sessão em que os scripts foram rodados.⁵¹

O pacote utils⁴⁹ fornece a função sessionInfo para descrever as características do programa, pacotes e plataforma da sessão atual.

4.7.5 O que incluir no arquivo README?

Título do trabalho.²⁷
Autores do trabalho.²⁷
Principais responsáveis pela escrita do script e quaisquer outras pessoas que fizeram contribuições substanciais para o desenvolvimento do script.²⁷
Endereço de e-mail do autor ou contribuidor a quem devem ser direcionadas dúvidas, comentários, sugestões e bugs sobre o script.²⁷
Lista de configurações nas quais o script foi testado, tais com nome e versão do programa, pacotes e plataforma.²⁷

Citar como:
Ferreira, Arthur de Sá. Ciência com R: Perguntas e respostas para pesquisadores e analistas de dados. Rio de Janeiro: 1a edição,

Referências

27.

Hofner B, Schmid M, Edler L. Reproducible research in statistics: A review and guidelines for the Biometrical Journal. Biometrical Journal. 2015;58(2):416–427. doi:10.1002/bimj.201500156

28.

Mair P. Thou Shalt Be Reproducible! A Technology Perspective. Frontiers in Psychology. 2016;7. doi:10.3389/fpsyg.2016.01079

29.

Hinsen K. A data and code model for reproducible research and executable papers. Procedia Computer Science. 2011;4:579–588. doi:10.1016/j.procs.2011.04.061

32.

Ihaka R, Gentleman R. R: A Language for Data Analysis and Graphics. Journal of Computational and Graphical Statistics. 1996;5(3):299. doi:10.2307/1390807

33.

Nwanganga F, Chapple M. Introduction to R and RStudio. Em: Nwanganga F, Chapple M, orgs. Practical Machine Learning in R. John Wiley & Sons, Ltd; 2020:25–52. doi:10.1002/9781119591542.ch2

34.

R Core Team. The Comprehensive R Archive Network. 2021. https://cran.r-project.org.

35.

Allaire J, Xie Y, Dervieux C, et al. rmarkdown: Dynamic Documents for R.; 2023. https://CRAN.R-project.org/package=rmarkdown.

36.

Holmes DT, Mobini M, McCudden CR. Reproducible manuscript preparation with RMarkdown application to JMSACL and other Elsevier Journals. Journal of Mass Spectrometry and Advances in the Clinical Lab. 2021;22:8–16. doi:10.1016/j.jmsacl.2021.09.002

37.

Love J, Selker R, Marsman M, et al. JASP: Graphical Statistical Software for Common Statistical Designs. Journal of Statistical Software. 2019;88(2). doi:10.18637/jss.v088.i02

38.

ŞAHİN M, AYBEK E. Jamovi: An Easy to Use Statistical Software for the Social Scientists. International Journal of Assessment Tools in Education. 2020;6(4):670–692. doi:10.21449/ijate.661803

39.

Selker R, Love J, Dropmann D. jmv: The jamovi Analyses.; 2023. https://CRAN.R-project.org/package=jmv.

40.

Love J. jmvconnect: Connect to the jamovi Statistical Spreadsheet.; 2022. https://CRAN.R-project.org/package=jmvconnect.

41.

Racine JS. RStudio: A Platform-Independent IDE for R and Sweave. Journal of Applied Econometrics. 2011;27(1):167–172. doi:10.1002/jae.1278

42.

Aden-Buie G, Schloerke B, Allaire J, Rossell Hayes A. learnr: Interactive Tutorials for R.; 2023. https://CRAN.R-project.org/package=learnr.

43.

Schwab, Simon, Held, Leonhard. Statistical programming: Small mistakes, big impacts. Wiley-Blackwell Publishing, Inc. 2021. doi:10.5167/UZH-205154

44.

Eglen SJ, Marwick B, Halchenko YO, et al. Toward standard practices for sharing computer code and programs in neuroscience. Nature Neuroscience. 2017;20(6):770–773. doi:10.1038/nn.4550

45.

Xie Y. formatR: Format R Code Automatically.; 2022. https://CRAN.R-project.org/package=formatR.

46.

Müller K, Walthert L. styler: Non-Invasive Pretty Printing of R Code.; 2023. https://CRAN.R-project.org/package=styler.

47.

Hester J, Angly F, Hyde R, et al. lintr: A Linter for R Code.; 2023. https://CRAN.R-project.org/package=lintr.

48.

All R CRAN packages [Full List]. 2025. https://r-packages.io/packages. Acessado fevereiro 11, 2025.

49.

R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2023. https://www.R-project.org/.

50.

Wickham H, Danenberg P, Csárdi G, Eugster M. roxygen2: In-Line Documentation for R.; 2024. doi:10.32614/CRAN.package.roxygen2

51.

Trisovic A, Lau MK, Pasquier T, Crosas M. A large-scale study on research code quality and execution. Scientific Data. 2022;9(1). doi:10.1038/s41597-022-01143-6

52.

Gohel D, Ross N. officedown: Enhanced R Markdown Format for Word and PowerPoint.; 2023. https://CRAN.R-project.org/package=officedown.

53.

Xie Y. bookdown: Authoring Books and Technical Documents with R Markdown. Chapman; Hall/CRC; 2023. https://bookdown.org/yihui/bookdown/.

54.

Ioannidis JPA. How to Make More Published Research True. PLoS Medicine. 2014;11(10):e1001747. doi:10.1371/journal.pmed.1001747

55.

Krieger N, Perzynski A, Dalton J. projects: A Project Infrastructure for Researchers.; 2021. https://CRAN.R-project.org/package=projects.

56.

Schultze A, Tazare J. The role of programming code sharing in improving the transparency of medical research. BMJ. outubro 2023:p2402. doi:10.1136/bmj.p2402

57.

R Core Team. R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing; 2023. https://www.R-project.org/.

58.

Zhao Y, Xiao N, Anderson K, Zhang Y. Electronic common technical document submission with analysis using R. Clinical Trials. 2022;20(1):89–92. doi:10.1177/17407745221123244

59.

Francisco Rodríguez-Sánchez, Connor P. Jackson, Shaurita D. Hutchins. grateful: Facilitate citation of R packages.; 2023. https://github.com/Pakillo/grateful.