Pacotes Estatísticos
|
Universidade Federal de Minas Gerais
Instituto de Ciências Exatas
Departamento de Estatística
Disciplina: Pacotes Estatísticos (EST-008)
Prof.: Frederico R. B. Cruz
|
Período: 1º Semestre de 2022
Sala: 4069 (ICEx-Pampulha)
|
Divulgação: 24/06/2022
|
Entrega: 15/07/2022 (em formato impresso, até o início da prova)
|
Trabalho Prático (10 pontos)
-
Resumo
-
São apresentamos detalhes sobre o trabalho prático e
definidos o seu tema, a forma de apresentação escrita e
critério de avaliação.
-
1. Descrição Geral
-
Este é um trabalho individual. O tema é
programação em R.
Uma questão relevante ao se trabalhar com estatísticas é sobre
até que ponto os dados observados podem ser explicados como resultado
do acaso ou se, pelo contrário, são significativos, do ponto de vista
de uma tendência ou de uma característica observada. Este problema
é analisado efetuando-se testes estatísticos.
Normalmente existem testes específicos para cada tipo de
situação e para alguns existem tabelas que permitem avaliar o
nível de significância da estatística observada.
Recentemente, os testes de permutação têm sido utilizados,
principalmente devido às atuais facilidades computacionais.
O que é um teste de permutação? Um teste de permutação
é basicamente a comparação do valor da estatística
observada com as que são obtidas por uma simples permutação
nos dados originais. O pressuposto básico é que, se uma
estatística observada é devida meramente ao acaso, uma
permutação dos dados originais, mantendo-se a estrutura, deverá
produzir estatísticas com valores semelhantes. Caso isto não
ocorra, há indícios de não casualidade nos valores
observados.
Seja este exemplo em bioestatística de um teste de
permutação:
-
Comprimento da mandíbula (em mm) de golden jackals (Canis aureus)
para cada sexo, coleção de História Natural do Museu
Britânico:
Machos: 120, 107, 110, 116, 114, 111, 113, 117, 114, 112
Fêmeas: 110, 111, 107, 108, 110, 105, 107, 106, 111, 111
Há uma diferença entre as médias dos dois grupos de 4,8 mm,
mas são realmente "dois grupos"? A idéia básica do teste de
permutação neste caso é que se não existe diferença
entre as médias dos machos e das fêmeas, então a diferença
observada na amostra será tipicamente o valor observado para
qualquer conjunto de dados, obtido alocando-se ao acaso os vinte
valores em dois grupos de 10.
Neste exemplo, o valor observado nos dados originais é 4,8 mm para
a diferença entre as médias do grupo macho e do grupo fêmea.
A Figura 1 mostra um histograma obtido após 1000 permutações
dos dados. Observe que o valor 4,8 mm é pouco provável de
ocorrer, através de permutações. Podemos concluir que há
evidências de que a diferença observada nos dados coletados é
significativa, ou seja, existe uma diferença de fato entre as duas
populações (machos e fêmeas).
|
Fig. 1:Histograma para a diferença entre as médias dos
dois grupos, permutando-se os valores 1000 vezes.
|
Para este trabalho prático, o(a) aluno(a) deverá:
- Escrevar uma função para o R que receba dois grupos,
gere k permutações, calcule a diferença entre as médias de
cada uma das permutações e imprima o histograma para a
diferença entre as médias dos dois grupos.
- Apresentar um exemplo de utilização da sua função, com
uma discussão dos resultados obtidos.
O aluno deverá apresentar a função desenvolvida e os
resultados obtidos, por escrito, na forma de artigo, no modelo de
resumo estendido, disponível no site da disciplina, em ModeloResumoExpandido.dot, como um modelo do Word for
Windows©.
O trabalho prático será avaliado com base nos quesitos
apresentados na Tabela 1.
Tabela 1: Quesitos da Avaliação.
quesito |
percentual |
conteúdo |
(abrangência, correção) |
60 % |
apresentação |
(originalidade, organização) |
40 % |
Uma observação importante quanto à entrega é que
o trabalho prático não será aceito fora do prazo.
-
Dicas:
-
#junta vetores 'machos' e 'femeas' no vetor 'todos':
todos <- c(machos,femeas)
#permuta vetor 'todos' (reamostra *sem* reposição):
ream.i <- sample(todos, replace=F)
#calcula tamanho do vetor 'machos':
tm <- length(machos)
#cria vetor 'grupo1' com os primeiros tt elementos do vetor 'ream.i'
grupo1 <- ream.i[1:tt]
#calcula tamanho do vetor 'femeas':
tf <- length(femeas)
#cria vetor 'grupo2' com os últimos 'tf' elementos do vetor 'ream.i'
grupo2 <- ream.i[(tt+1):(tt+tf)]
-
Bibliografia
-
[1] E. A. Reis.
Noções Básicas de S-PLUS for
Windows®.
RTE-03/1997, EST-ICEx-UFMG, Belo Horizonte, 1997
(disponível através da homepage de
Relatórios
Técnicos - Série Ensino,
Departamento de Estatística, UFMG, ou em
RTE-03/97).
- [2] F. R. B. Cruz.
Notas de Aula - O R.
EST-ICEx-UFMG, Belo Horizonte, 2015.
(disponível em
O R).
- Endereços:
- Atenção:
- O material aqui contido deve ser tomado como um guia bastante
confiável do conteúdo do curso. Entretanto, você
não poderá reivindicar quaisquer direitos baseado neste
material. Em particular, reservo-me o direito de alterar datas,
programação ou critério de avaliação.
Avisos oficiais serão sempre aqueles feitos em sala de aula.
|