HINWEIS: Die IDRE Statistische Beratungsgruppe wird die Website im Februar auf das WordPress CMS migrieren, um die Wartung und Erstellung neuer Inhalte zu erleichtern. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht mehr gepflegt werden. Wir werden versuchen, Umleitungen zu pflegen, damit die alten URLs weiterhin so gut funktionieren wie möglich. Willkommen im Institut für digitale Forschung und Bildung Hilfe der Stat Consulting Group durch ein Geschenk Stata FAQ Was ist scheinbar unzusammenhängende Regression und wie kann ich es in Stata ausführen Ein einzelnes Modell kann eine Reihe von linearen Gleichungen enthalten. In solch einem Modell ist es oft unrealistisch zu erwarten, dass die Gleichungsfehler unkorreliert wären. Ein Satz von Gleichungen, der eine gleichzeitige Kreuzgleichungsfehlerkorrelation aufweist (d. h. die Fehlerterme in den Regressionsgleichungen sind korrespondiert) wird als ein scheinbar nicht verwandtes Regressions - (SUR-) System bezeichnet. Auf den ersten Blick scheinen die Gleichungen nicht verwandt zu sein, aber die Gleichungen sind durch die Korrelation in den Fehlern verwandt. Der Stata-Befehl, scheinbar unzusammenhängende Regression zu tun, ist sicher. Wir veranschaulichen sureg mit der Datei hsb2.dta, die 200 Beobachtungen von der High School und Beyond Studie enthält. Hsb2.dta kann direkt über das Internet von der ATS-Website mit dem Use-Befehl unten zugegriffen werden. Wir werden zwei Gleichungen verwenden, eine für lesen und eine für Mathe und führen Sie den Befehl sureg aus. Mit diesem Befehl schätzen wir zwei Gleichungen, eine, in der das Lesen von der Frau vorhergesagt wird. Ses Und socst und die andere, wo Mathe von Frau vorhergesagt wird. Ses Und Wissenschaft. Die einzelnen Gleichungen sind in Klammern angegeben, wobei die abhängige Variable (Ergebnis) zuerst aufgeführt ist, gefolgt von den unabhängigen (Prädiktor-) Variablen. Die Verknüpfung zwischen diesen beiden Gleichungen ist, dass die Fehlerterme in den beiden Gleichungen korrelieren können. Lets Kontrast die Ergebnisse der sureg Befehl mit zwei separaten Regressionen mit dem Regress-Befehl. Beachten Sie, dass die Regressionskoeffizienten, Standardfehler, R 2 s usw. in den Standardregressionen unterschiedlich sind. Dies ist auf korrelierte Fehler in den beiden Gleichungen zurückzuführen. Der Inhalt dieser Website sollte nicht als eine Bestätigung einer bestimmten Website, Buch oder Software-Produkt von der University of California ausgelegt werden. NOTICE: Die IDRE Statistische Beratungsgruppe wird die Website migrieren die Website auf die WordPress CMS im Februar zu erleichtern Wartung und Erstellung neuer Inhalte. Einige unserer älteren Seiten werden entfernt oder archiviert, so dass sie nicht mehr gepflegt werden. Wir werden versuchen, Umleitungen zu pflegen, damit die alten URLs weiterhin so gut funktionieren wie möglich. Willkommen am Institut für digitale Forschung und Bildung Hilfe der Stat Consulting Group durch ein Geschenk Stata Code Fragment Anpassung einer scheinbar unzusammenhängenden Regression (sureg) manuell Der Stata Befehl sureg läuft eine scheinbar unzusammenhängende Regression (SUR). Das ist eine Regression, bei der zwei (oder mehr) nicht verwandte Ergebnisvariablen durch Sätze von Prädiktorvariablen vorhergesagt werden. Diese Prädiktorvariablen können für die beiden Ergebnisse gleich sein. Wenn die Menge der Prädiktorvariablen über die beiden Ergebnisse identisch ist, sind die Ergebnisse von sureg identisch mit denen von OLS. In anderen Fällen (d. h. nicht identische Vorhersagegleichungen) erzeugt SUR effizientere Schätzungen als OLS. Dies geschieht durch die Gewichtung der Schätzungen durch die Kovarianz der Residuen aus den einzelnen Regressionen. Siehe Greene (2005 S. 340-351) für weitere Informationen über scheinbar unzusammenhängende Regression. Im Folgenden zeigen wir, wie die Ergebnisse des Statas-Befehls zu replizieren sind. Wir passen das folgende Modell an: Die Koeffizienten b0. B1 B2 Und b3. Sind die Abgrenzungs - und Regressionskoeffizienten zum Lesen. Und er ist der Fehlerausdruck zum Lesen. Die Koeffizienten g0 G1 Und g2 sind die Regressionskoeffizienten für die Wissenschaft. Und es ist der Fehler Begriff für die Wissenschaft. Die Matrixform der Gleichung für diese Koeffizienten lautet: Wo X eine Matrix von Prädiktoren ist, ist Y ein Vektor der Ergebnisse und V ist: das ist das Kronecker-Produkt von S und I. Wo S die Varianz-Kovarianzmatrix von OLS-Resten ist und I eine Identitätsmatrix der Größe n ist, die gleich der Anzahl der Fälle in der Analyse ist. Unten öffnen wir den Datensatz und führen dann das obige Modell mit dem Befehl sureg aus. Zuerst werden wir die Matte erhöhen, dies ermöglicht Stata, größere Matrizen zu halten, die notwendig sind, um dieses Beispiel auszuführen. Dann werden wir den Regress-Befehl verwenden, um das Lesen mit dem Schreiben vorherzusagen. Mathe und Gesellschaft. Nachdem wir die Regression durchgeführt haben, verwenden wir vorhersagen, um eine neue Variable rresid zu erstellen, die den Rest für jeden Fall enthält. Weiter unten wiederholen wir die letzten beiden Schritte für das Modell, das die Wissenschaft voraussagt. Wir verwenden den cor (Korrelate) - Befehl mit der cov-Option, um die Kovarianzmatrix für die Residuen aus den obigen Regressionen zu erhalten. Wir speichern diese Matrix als s. Eine 2 mal 2 symmetrische Matrix. Dann schaffen wir eine andere Matrix. Die eine Identitätsmatrix mit der Anzahl von Zeilen und Spalten ist, die gleich der Anzahl von Fällen in der Analyse ist, d. h. i ist eine 200 bis 200 Identitätsmatrix. Schließlich ist die Matrix v das Kronecker-Produkt von s und i, was zu einer 400 x 400 Matrix führt. Unten ist ein Beispiel dafür, wie die X-Matrix aussehen soll, wenn wir fertig sind. Die ersten beiden Zeilen der unten gezeigten Matrix sind die Zeilen für die erste Gleichung (mit weiteren Fällen weggelassen), der zweite Satz von Zeilen zeigt die Zeilen für die zweite Gleichung. Beachten Sie, dass die Mathe-Scores gleich sind, da die gleichen zwei hypothetischen Fälle gezeigt werden. Der untenstehende Code nimmt die Werte der Prädiktorvariablen für die erste Gleichung (d. h. Mathematik-Schreibgespräch) aus dem Datensatz und legt sie in eine Matrix, xread. In der zweiten Zeile des Codes wird eine Matrix von Nullen, die durch die Funktion J (200,3,0) mit 200 Zeilen (n200) und 3 Spalten (für drei Variablen in der zweiten Gleichung) erzeugt wird, rechts von den Werten aus gesetzt Das dataset Ein ähnlicher Vorgang findet für die Prädiktoren aus der zweiten Gleichung (xsci) statt, außer diesmal ist die Matrix der Nullen 200 mal 4 und wird links von den Werten aus dem Datensatz platziert. Die letzte Zeile des Codes unten stapelt die Matrix für die erste Gleichung (xread) oben auf der Matrix für die zweite Gleichung (xsci), wodurch eine einzelne Matrix x erzeugt wird. Mit 400 Reihen und 7 Spalten. Die ersten beiden Vektoren werden erstellt, eine für jede der beiden abhängigen Variablen (Lesen und Wissenschaft), dann wird der Vektor der gelesenen Werte oben auf den Vektor der Wissenschaftswerte gestapelt, um einen einzelnen Vektor y mit 400 Zeilen zu erzeugen. Schließlich berechnen wir die gewichteten Schätzungen und erzeugen den Vektor b mit 7 Reihen. Dann können wir den Vektor auflisten, um unsere Parameterschätzungen zu betrachten. Beachten Sie, dass diese die gleichen sind wie die von sureg erzeugten Koeffizientenschätzungen. Mit Mata Für das relativ kleine Beispiel oben, könnten wir Statas-Matrix-Funktionen verwenden, um die Schätzungen aus dem sureg zu reproduzieren. Allerdings, wenn du das mit einem größeren Beispiel machen wolltest, musst du vielleicht Mata benutzen. Unten ist der Code, um das gleiche Beispiel mit Stata und Mata zu reproduzieren. Referenzen Greene, William H. (2005). Ökonometrische Analyse. Fünfte Ausgabe. Pearson Ausbildung.
No comments:
Post a Comment