CE302 - Elementos de Programação para Estatística

Autor
Afiliação

Prof. Deisy Morselli Gysi, Ph.D.

Universidade Federal do Paraná

Data de Publicação

30 de outubro de 2024

Informações Úteis

Horário e Local

  • Quarta-feiras das 17h30 às 21h30

Sala: DINF - Laboratórios 1/2

Conteúdo Programático

1. Documentação, Organização e Versionamento

  • Uso do Markdown para criar documentação clara e formatada.
  • Elaboração de arquivos README para guiar os usuários sobre a utilização do código.
  • Introdução ao GitHub para versionamento de projetos.

2. Conceitos Básicos do Ambiente R e Importação e Exportação de Dados e Objetos

  • Conceitos Básicos de R
    • Apresentação do ambiente de programação R.
    • Exploração do CRAN e repositórios de pacotes.
    • Instalação e configuração do R e de softwares relacionados.
    • Utilização de mecanismos de ajuda e documentação oficial.
    • Manipulação de expressões e diferenciação de letras maiúsculas e minúsculas.
    • Compreensão de palavras reservadas e execução, recuperação e correção de comandos.
    • Uso de operadores aritméticos e relacionais.
    • Ordens de execução e comandos de atribuição.
    • Familiarização com funções básicas do R.
  • Importação e Exportação de Dados e Objetos
    • Informações sobre diretórios e arquivos em R.
    • Funções para importação e exportação de dados e objetos.
    • Exploração de conjuntos de dados integrados e edição dos mesmos.

3. Objetos em R

  • Vetores
    • Criação de vetores e manipulação de suas propriedades.
    • Realização de operações aritméticas vetoriais.
    • Aplicação da regra da reciclagem para operações entre vetores de tamanhos diferentes.
    • Exploração de vetores lógicos e tratamento de informações faltantes.
    • Trabalho com vetores de caracteres e índices.
    • Uso de vetores mistos.
  • Matrizes e Arrays
    • Criação e manipulação de matrizes em R.
    • Utilização de funções para operações com matrizes.
    • Realização de operações matriciais, como multiplicação e transposição.
    • Resolução de equações lineares com matrizes.
    • Decomposição espectral, em valores singulares e QR de matrizes.
    • Criação e operações com arrays.
  • Listas e Data Frames
    • Criação, alimentação e modificação de listas.
    • Concatenação e aninhamento de listas.
    • Introdução à criação de Data Frames.
    • Utilização de funções para manipulação de Data Frames.

4. Manipulação de dados

  • Operadores lógicos
  • Criação de variáveis
  • Tipos de join
  • Seleção de colunas
  • Filtro de observações
  • Ordenação de observações
  • Tipos de formato de dados
    • Formatos Wide e Long e conversão de formatos
  • Sumarização de dados

5. Looping & Condicionais

  • Utilização de expressões agrupadas.
  • Declarações de controle em R.
  • Implementação de estruturas condicionais e laços de repetição.
  • Exploração de loopings implícitos.

6. Funções & Expressões

  • Criação e definição de funções em R.
  • Definição de operadores binários personalizados.
  • Uso de argumentos e atribuição de padrões em funções.
  • Trabalho com funções aninhadas e recursivas.

7. Visualização

  • Criação e personalização de gráficos em R.
  • Utilização de argumentos e parâmetros gráficos.
  • Apresentação de dados univariados e multivariados através de gráficos.
  • Interação com interfaces gráficas e configurações gráficas temporárias e permanentes.
  • Exploração de elementos gráficos, eixos, escalas e margens.
  • Trabalho em ambiente com vários gráficos e criação de gráficos dinâmicos.
  • Exportação de gráficos em diversos formatos.

8. Comunicação

  • Introdução aos relatórios dinâmicos com R Markdown e Quarto.
  • Introdução à apresentações de slides utilizando Quarto e RevealJS.
  • Visão geral de aplicações web com R Shiny.

Procedimentos Avaliativos

Prova 01

  • Data: 30/10/2024, Quarta-feira, às 18:30.
  • Conteúdo: Capítulos 1 a 4.
  • Segunda chamada deverá ser solicitada através do email dest@ufpr.br até o dia 06/11/2024 munido de comprovação, de acordo com o Artigo 106, Seção V da Resolução 37/97.

Prova 02

  • Data: 04/12/2024, Quarta-feira, às 18:30.
  • Conteúdo: Capítulos 5 a 8.
  • Segunda chamada deverá ser solicitada através do email dest@ufpr.br até o dia 11/12/2024 munido de comprovação, de acordo com o Artigo 106, Seção V da Resolução 37/97.

9  Trabalho de Estatística: Análise de Dados e Comunicação

  • Data: 10/12/2024, Terça-feira até 23:59.
  • O trabalho será realizado em grupo de até 5 pessoas, sobre um tópico a ser sorteado após a realização da primeira prova.
  • O trabalho deverá ser entregue através de um link para repositório no GitHub, deverá incluir um README e um relatório dinâmico com as análises.

Prova Final

  • Data: 18/12, Quarta-feira, às 18:30.
  • Conteúdo: Capítulos 1 a 8.
  • Segunda chamada deverá ser solicitada através do email dest@ufpr.br até o dia 25/12/2024 munido de comprovação, de acordo com o Artigo 106, Seção V da Resolução 37/97.

Bibliografia Básica

  1. Wickham, Hadley, Mine Çetinkaya-Rundel, and Garrett Grolemund. R for data science. ” O’Reilly Media, Inc.”, 2024 Versão Online
  2. Wickham, Hadley. Advanced r. CRC press, 2019. Versão Online
  3. Davies, T. M. The book of R: A first course in programming and statistics. No Starch Press, 2016.

Cheat-Sheets