HINWEIS: Die IDRE Statistical Consulting Group wird die Migration der Website auf das WordPress CMS im Februar, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht länger erhalten bleiben. Wir werden versuchen, die Weiterleitungen so zu halten, dass die alten URLs weiterhin so gut funktionieren, wie wir können. Willkommen beim Institut für Digitale Forschung und Bildung Helfen Sie der Stat Consulting Group, indem Sie ein Geschenk geben Stata Class Notes Zählen von n bis N Einführung Stata hat zwei eingebaute Variablen namens n und N. N ist die Stata-Notation für die aktuelle Beobachtungsnummer. N in der ersten Beobachtung 1, 2 im zweiten, 3 im dritten und so weiter. N ist die Stata-Notation für die Gesamtzahl der Beobachtungen. Wir können sehen, wie n und N arbeiten. Wie Sie sehen können, enthält die Variable id die Beobachtungsnummer, die von 1 bis 7 läuft, und nt die Gesamtzahl der Beobachtungen, die 7 ist. Mit dem Verwenden von n und N in Verbindung mit dem Befehl by können Sie einige sehr nützliche Ergebnisse erzielen. Natürlich müssen wir, um den by-Befehl zu verwenden, zuerst unsere Daten auf der by-Variablen sortieren. Nun ist n1 die Beobachtungsnummer innerhalb jeder Gruppe und n2 die Gesamtzahl der Beobachtungen für jede Gruppe. Um die niedrigste Punktzahl für jede Gruppe aufzulisten, verwenden Sie folgendes: Um die höchste Punktzahl für jede Gruppe zu verwenden, verwenden Sie Folgendes: Eine weitere Verwendung von n Verwenden Sie n, um herauszufinden, ob es doppelte ID-Nummern in den folgenden Daten gibt: Die Beobachtungen 6 und 7 haben die gleichen ID-Nummern und unterschiedliche Werte. Duplikate finden Mit Hilfe von N können Sie doppelte Beobachtungen finden. In diesem Beispiel sortieren wir die Beobachtungen durch alle Variablen. Dann verwenden wir alle Variablen in der by-Anweisung und set set n gleich der Gesamtzahl der identischen Beobachtungen. Schließlich führen wir die Beobachtungen auf, für die N größer als 1 ist, wodurch die doppelten Beobachtungen identifiziert werden. Wenn Sie eine Menge von Variablen in der Datenmenge haben, könnte es lange dauern, bis sie alle zweimal eingeben. Wir können die Wildcard verwenden, um anzuzeigen, dass wir alle Variablen verwenden möchten. Weiterhin können wir in den letzten Versionen von Stata sortieren und in einer einzigen Aussage zusammenfassen. Unten ist eine vereinfachte Version des Codes, die genau die gleichen Ergebnisse wie oben ergeben wird. Der Inhalt dieser Website sollte nicht als eine Bestätigung für eine bestimmte Website, Buch oder Software-Produkt von der University of California. For schnelle Fragen e-Mail dataprinceton. edu ausgelegt werden. Keine appts. Notwendig während der begehbaren Stunden. Hinweis: Das DSS-Labor ist geöffnet, solange Firestone geöffnet ist, keine Termine erforderlich, um die Labor-Computer für Ihre eigene Analyse zu verwenden. Erstellen und Ändern von Variablen Bevor Sie dies lesen, stellen Sie sicher, dass Sie verstehen, was Stata-Variablen sind und wie sie funktionieren. Unsere Seite auf Daten, Datasets und Variablen ist ein guter Anfang. Variablenerstellungsbefehle Die Grundbefehle zum Erstellen neuer Variablen und zum Ändern von alten in Stata werden generiert (abgekürzt gen), egen und replace. Der Befehl gen variablename etwas erzeugt eine neue Variable namens variablename und setzt sie gleich etwas. Etwas kann eine einfache Zahl, ein String, ein mathematischer Ausdruck oder eine Funktion von anderen Variablen sein. Informationen zu den Funktionen von gen finden Sie in der Statas Online-Hilfe. Informationen zu egen-Funktionen finden Sie in egen. Der Ersetzungsbefehl wird verwendet, um Änderungen an vorhandenen Variablen vorzunehmen: Ersetzen Sie die Arbeit mit allen gen-Funktionen, nicht aber mit egen-Funktionen. Sie können jedoch ersetzen, um die von egen erstellten Variablen sowie die von gen erzeugten Variablen zu ändern. Normalerweise möchten Sie Ersetzen für zweite und spätere Schritte in mehrstufigen Variablenkreationen verwenden, so wie wir es hier verwendet haben. Es ist schlecht, über bestehende Variablen zu schreiben, denn wenn man einen Fehler macht, gibt es keine Möglichkeit, die ursprünglichen Daten wieder zu bekommen. Zum Beispiel, auch wenn Sie beschlossen, dass Sie nur um die Getriebeübersetzung gerundet auf die nächste ganze Zahl gepflegt, ersetzen Sie gearratio Runde (gearratio, 1) wird nicht empfohlen. Es ist immer besser, eine neue Variable zu erstellen. Der if-Qualifier Das if-Qualifier wird verwendet, um einen Satz von Beobachtungen mit Variablen zu isolieren, die bestimmte Kriterien erfüllen. Werte für Variablen in einem Datensatz werden mit Werten anderer Variablen oder mit Zahlen oder Strings mit Hilfe von logischen Vergleichsoperatoren verglichen. Dies wird sehr oft verwendet, um Dummy-Variablen zu erstellen, 0-1 Indikatoren verwendet, um anzuzeigen, ob etwas wahr oder falsch ist.
No comments:
Post a Comment