Organização e Formatação dos Dados

ORGANIZAÇÃO dos DADOS:
Com o fim de trabalhar com os seus dados com facilidade, convém integrar todos os dados que podem ter alguma inter-relação numa só planilha "MASTER":

COLUNAS:
TODAS AS VARIÁVEIS (com nomes de variáveis na primeira linha), incl.:

  • preditores (variáveis independentes, p.ex. tratamentos, regiões amostradas, blocos experimentais, anos de re-amostragem, covariáveis, etc), e
  • respostas (variáveis dependentes, i.e. todas as medições que esperamos ser afetados pelos preditores)

LINHAS:
TODAS AS OBSERVAÇÕES (com nomes de linhas, ou seja, códigos reconhecíveis na primeira coluna), incl. todas as combinações únicas de amostras, datas de remedição, etc.
___________________________________________________

FORMATAÇÃO dos DADOS:
p.ex. texto delimitado por tabulações (tab-delimited) ".txt":
em EXCEL/OpenOffice salvar cada planilha com dados a ser
utilizados em R em arquivos "*.txt" separados. Porém, atenção:

  1. Nomes de variáveis (nem preferivelmente seus valores) devem ter espaços " "
  2. nomes de variáveis não devem conter nenhum dos seguintes operadores, nem acentos: (),!?^<>=+-*/
  3. Ajuda usar maiúsculas e minúsculas de letras (R as diferencia), números e pontos (“.”) para dar nomes de variáveis curtas e reconhecíveis, p.ex. “pHsolo.H2O” (pH do solo em água)
  4. Células vazias (sem dados) devem conter os 2 caracteres em maiúscula "NA" (not available = missing values)
Última atualização: Wednesday, 11 Apr 2012, 17:17