Allright, so habe ich einen Datensatz für rund 40k Unternehmen über die Geschäftsjahre 1950-2011 mit etwa 430k Firma-Jahre. Wenn ich mich nicht irre, habe ich Paneldaten. Ich habe eine eindeutige Kennung ticn für jede Firma. Jahre werden durch fyear gekennzeichnet. Für jetzt meine Variablen von Interesse sind jährlich Verkauf. Jährliche Werbung xad. Und jährliche RampD Aufwendungen xrd. Also meine Frage, ich möchte ein Gefühl für die Daten zu bekommen, geben Beschreibungen und vielleicht ein paar Plots, können Sie mir Ideen für einige Analysen Auch wegen der Größe der Daten ist es nicht wirklich einfach, nur durch sie zu scrollen Ein gutes Gefühl dafür. Wegen der Natur der Daten (viele der Beobachtungen) entschied ich, STATA zu verwenden, auch, weil ich ein wenig Erfahrung mit ihm habe (ich habe keine Erfahrung mit R, SAS oder Matlab). Wenn ich durch die Daten blättere sehe ich Lücken und Missings so können wir schließen, dass ich unausgeglichene Panel-Daten haben. Hier habe ich einige Beschreibungen, aber ich kann nicht mehr relevante Beschreibungen, Statistiken, Plots oder Analysen, um ein Gefühl für die Daten zu bekommen denken. Was ich getan habe, um diese zu bekommen. Zuerst fiel ich fehlende Fälle von meinem Panel-Variablen. Dann habe ich gemeldet, aufgelistet, getaggt und entfernt Duplikate in der Panel-Variablen. Dann entfernte ich negative Werte. Schließlich bin ich in der Lage, Panel-Daten zu deklarieren und Panel-Daten-Analysen zu aktivieren Vielen Dank im Voraus für Ihre VorschlägeNOTICE: Die IDRE Statistical Consulting-Gruppe wird die Migration der Website auf die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group durch ein Geschenk Stata FAQ Wie bekomme ich deskriptive Statistiken und die Fünf-Zahlen-Zusammenfassung auf einer Zeile Stata bietet den zusammenfassenden Befehl, der Ihnen erlaubt, den Mittelwert und die Standardabweichung zu sehen , Aber es bietet nicht die Fünf-Nummer Zusammenfassung (min, q25, median, q75, max). Sie können die Detail-Option, aber dann erhalten Sie eine Seite der Ausgabe für jede Variable. Wenn Sie den Mittelwert, die Standardabweichung und die Fünf-Zahlen-Zusammenfassung auf einer Zeile erhalten möchten, dann möchten Sie den Befehl univar erhalten. Der univar Befehl wurde von John R. Gleason geschrieben und erscheint im Stata Technical Bulletin 51. Sie können univar von innerhalb von Stata downloaden, indem Sie findit univar eingeben (sehen Sie, wie ich den findit Befehl benutzte, um nach Programmen zu suchen und zusätzliche Hilfe zu mehr Information zu erhalten Über die Verwendung von findit). Lets illustrieren die Verwendung der Univar-Befehl mit der High School und jenseits der Daten-Datei verwenden wir in unseren Stata-Klassen. Hier sehen Sie die Ausgabe, die Sie zusammenfassen. Hier ist die Ausgabe, die Sie von univar erhalten können. Wenn Sie die Option vlabel einschließen, enthält sie auch die Variablenbeschriftungen in der Tabelle. Die boxplot-Option zeigt eine Mini-Boxplot über jeder Variable. Hier verwenden wir die Option (weiblich), um Tabellen getrennt für Männer und Frauen anzuzeigen. Wir können die by (female) und onehdr Optionen verwenden, um eine Tabelle mit einem Header zu erhalten, der ein bisschen leichter zu lesen ist. Hier verlangen wir für die Variable write ein Boxplot und bitten, dass die Boxplots mit der gleichen Skala (über onescal) geplottet werden, so dass wir das Boxplot der Männchen und Weibchen sinnvoll vergleichen konnten. Sie sehen, dass der Median der Boxplot höher ist für die Weibchen. (Wenn wir die onecal-Option ausgelassen hätten, wäre jede Boxplot auf ihrer eigenen Skala). Weitere Informationen Weitere Informationen finden Sie in der Hilfe oder im Referenzhandbuch. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, ein Buch oder ein Softwareprodukt der Universität von Kalifornien verstanden werden.
No comments:
Post a Comment