Pacotes Estatísticos

Apresentação do curso
Ensino Remoto
Notas de aula
Cap. 0. Motivação
Cap. 1. Introdução
1.1. Exercício de Programação
1.2. Sistemas de Programação
1.3. Algoritmos e Fluxogramas
1.4. Estruturas de Dados
1.5. Modularização
Cap. 2. O R
Cap. 3. Tópicos Avançados
Listas de Exercícios
Trabalho Prático
- TP I
Software
Resultado das Avaliações

Universidade Federal de Minas Gerais
Instituto de Ciências Exatas
Departamento de Estatística

Disciplina: Pacotes Estatísticos (EST-008)
Prof.: Frederico R. B. Cruz Período: 1º Semestre de 2022
Sala: 4069 (ICEx-Pampulha)

Divulgação: 24/06/2022

Entrega: 15/07/2022 (em formato impresso, até o início da prova)

Trabalho Prático (10 pontos)

Resumo

São apresentamos detalhes sobre o trabalho prático e definidos o seu tema, a forma de apresentação escrita e critério de avaliação.

1. Descrição Geral

Este é um trabalho individual. O tema é programação em R.

Uma questão relevante ao se trabalhar com estatísticas é sobre até que ponto os dados observados podem ser explicados como resultado do acaso ou se, pelo contrário, são significativos, do ponto de vista de uma tendência ou de uma característica observada. Este problema é analisado efetuando-se testes estatísticos.

Normalmente existem testes específicos para cada tipo de situação e para alguns existem tabelas que permitem avaliar o nível de significância da estatística observada. Recentemente, os testes de permutação têm sido utilizados, principalmente devido às atuais facilidades computacionais.

O que é um teste de permutação? Um teste de permutação é basicamente a comparação do valor da estatística observada com as que são obtidas por uma simples permutação nos dados originais. O pressuposto básico é que, se uma estatística observada é devida meramente ao acaso, uma permutação dos dados originais, mantendo-se a estrutura, deverá produzir estatísticas com valores semelhantes. Caso isto não ocorra, há indícios de não casualidade nos valores observados.

Seja este exemplo em bioestatística de um teste de permutação:

Comprimento da mandíbula (em mm) de golden jackals (Canis aureus) para cada sexo, coleção de História Natural do Museu Britânico:
Machos: 120, 107, 110, 116, 114, 111, 113, 117, 114, 112
Fêmeas: 110, 111, 107, 108, 110, 105, 107, 106, 111, 111
Há uma diferença entre as médias dos dois grupos de 4,8 mm, mas são realmente "dois grupos"? A idéia básica do teste de permutação neste caso é que se não existe diferença entre as médias dos machos e das fêmeas, então a diferença observada na amostra será tipicamente o valor observado para qualquer conjunto de dados, obtido alocando-se ao acaso os vinte valores em dois grupos de 10.

Neste exemplo, o valor observado nos dados originais é 4,8 mm para a diferença entre as médias do grupo macho e do grupo fêmea. A Figura 1 mostra um histograma obtido após 1000 permutações dos dados. Observe que o valor 4,8 mm é pouco provável de ocorrer, através de permutações. Podemos concluir que há evidências de que a diferença observada nos dados coletados é significativa, ou seja, existe uma diferença de fato entre as duas populações (machos e fêmeas).

Fig. 1:Histograma para a diferença entre as médias dos dois grupos, permutando-se os valores 1000 vezes.

Para este trabalho prático, o(a) aluno(a) deverá:

Escrevar uma função para o R que receba dois grupos, gere k permutações, calcule a diferença entre as médias de cada uma das permutações e imprima o histograma para a diferença entre as médias dos dois grupos.
Apresentar um exemplo de utilização da sua função, com uma discussão dos resultados obtidos.

O aluno deverá apresentar a função desenvolvida e os resultados obtidos, por escrito, na forma de artigo, no modelo de resumo estendido, disponível no site da disciplina, em ModeloResumoExpandido.dot, como um modelo do Word for Windows^©.

O trabalho prático será avaliado com base nos quesitos apresentados na Tabela 1.

**Tabela 1:** Quesitos da Avaliação.
quesito		percentual
conteúdo	(abrangência, correção)	60 %
apresentação	(originalidade, organização)	40 %

Uma observação importante quanto à entrega é que o trabalho prático não será aceito fora do prazo.

Dicas:

#junta vetores 'machos' e 'femeas' no vetor 'todos': todos <- c(machos,femeas) #permuta vetor 'todos' (reamostra *sem* reposição): ream.i <- sample(todos, replace=F) #calcula tamanho do vetor 'machos': tm <- length(machos) #cria vetor 'grupo1' com os primeiros tt elementos do vetor 'ream.i' grupo1 <- ream.i[1:tt] #calcula tamanho do vetor 'femeas': tf <- length(femeas) #cria vetor 'grupo2' com os últimos 'tf' elementos do vetor 'ream.i' grupo2 <- ream.i[(tt+1):(tt+tf)]

Bibliografia

[1] E. A. Reis. Noções Básicas de S-PLUS for Windows^®. RTE-03/1997, EST-ICEx-UFMG, Belo Horizonte, 1997 (disponível através da homepage de Relatórios Técnicos - Série Ensino, Departamento de Estatística, UFMG, ou em RTE-03/97).

[2] F. R. B. Cruz. Notas de Aula - O R. EST-ICEx-UFMG, Belo Horizonte, 2015. (disponível em O R).

Endereços:

Homepage do curso: http://www.est.ufmg.br/~fcruz/disciplinas/pacotes
E-mail do professor: fcruz@est.ufmg.br
Atenção:: O material aqui contido deve ser tomado como um guia bastante confiável do conteúdo do curso. Entretanto, você não poderá reivindicar quaisquer direitos baseado neste material. Em particular, reservo-me o direito de alterar datas, programação ou critério de avaliação. Avisos oficiais serão sempre aqueles feitos em sala de aula.