Digamos que eu tenho um monte de dados da fazenda, relatados no nível da safra (isto é, dados para cada cultivo). Cada observação de colheita pertence a um campo específico, e cada campo pertence a uma fazenda específica. (As variáveis de identificação do campo e da fazenda estão incluídas no conjunto de dados.) No Stata, eu quero agregar os dados do nível da safra ao nível do campo e, em seguida, agregue os dados do nível de campo ao nível da fazenda. Assim, para a variável x, o comando básico para agregação do nível de corte para campo é: egen xfieldtotal (xcrop), por (farm, campo) Então, para agregar ao nível do farm: egen xfarmtotal (xfield), por (farm) eu tenho muito Das variáveis que eu preciso agregar, então eu gostaria de fazer isso usando um loop foreach, em vez de repetir o mesmo código para cada campo de sufixo, fazenda. Agradeceria se alguém pudesse me ajudar aqui. Se eu entender isso corretamente, não há necessidade de agregação em duas etapas. Você só precisa agregar cada colheita de acordo com os identificadores de fazenda. Um análogo seria observações sobre pessoas dentro de condados dentro dos estados nos EUA. Se você quiser os totais do estado, você só precisa trabalhar por (estado). Para ver isso, imagine que jogue fora o identificador do condado. Você não descartou nenhuma informação que você precisa. Em qualquer caso, esteja ciente de eg eg s tag () função projetada para marcar uma e apenas uma observação em um grupo. Respondeu 3 de dezembro 12 às 0:26 Sua resposta 2017 Stack Exchange, IncNOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Stat ao oferecer um presente Módulos de Aprendizagem Stata Colapso de dados através de observações Às vezes você possui arquivos de dados que precisam ser colapsados para serem úteis para você. Por exemplo, você pode ter dados de alunos, mas você realmente quer dados de sala de aula, ou você pode ter dados semanais, mas você quer dados mensais, etc. Vamos ilustrar isso usando um exemplo mostrando como você pode colapsar dados em crianças para criar dados de nível familiar. Aqui está um arquivo contendo informações sobre as crianças em três famílias. Há um registro por criança. O nascimento é a ordem de nascimento (ou seja, 1 é primeiro), idade e sexo são idade, peso e sexo do filho. Usaremos esse arquivo para mostrar como colapsar dados entre observações. Considere o comando de colapso abaixo. Ele colapsa em todas as observações para fazer um único registro com a idade média das crianças. O comando de colapso acima não foi muito útil, mas você pode combiná-lo com a opção (famid) e, em seguida, cria um registro para cada família que contém a idade média das crianças na família. O seguinte comando de colapso faz exatamente a mesma coisa acima, exceto que a média de idade é chamada de avia e nós dissemos explicitamente o comando do colapso que queremos que ele compute a média. Podemos solicitar médias para mais de uma variável. Aqui, obtemos a média para a idade e para todos com o mesmo comando. Este comando obtém a média de idade e peso como o comando acima e também calcula numkids que é a contagem do número de crianças em cada família (obtida contando o número de observações com valores válidos de nascimento). Suponha que você quisesse contar o número de meninos e meninas na família. Podemos fazer isso com um passo extra. Vamos criar uma variável dummy que é 1 se o garoto é um menino (0 se não), e uma variável dummy que é 1 se o garoto é uma menina (e 0, se não). A soma da variável dummy do menino é o número de meninos e a soma da variável dummy da menina é o número de meninas. Primeiro, vamos usar o arquivo Kids (e limpar os dados existentes). Usamos tabular com a opção gerar para fazer as variáveis dummy. Podemos observar as variáveis dummy. Sexdum1 é a variável dummy para meninas. Sexdum2 é a variável dummy para meninos. A soma de sexdum1 é o número de meninas na família. A soma de sexdum2 é o número de meninos na família. O comando abaixo cria meninas, que é o número de meninas na família, e meninos que é o número de meninos na família. Podemos listar os dados para confirmar que ele funcionou corretamente. Para criar um registro por família (familiar) com a média de idade dentro de cada família. Para criar um registro por família (familiar) com a média de idade (chamada de aviação) e peso médio (chamado avgwt) dentro de cada família. O mesmo que o exemplo acima, mas também conta o número de crianças dentro de cada família que chamam esses numkids. Conta o número de meninos e meninas em cada família, usando tabulações para criar variáveis falsas com base no sexo e, em seguida, somando as variáveis falsas dentro de cada família. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.
No comments:
Post a Comment