Gleichungen (6a) und (6b) werden in Form eines linearen Wahrscheinlichkeitsmodells geschrieben. Im Mare-Modell werden sie in Log-Odd-Verhältnissen geschrieben, ausgedrückt als Logitkoeffizienten. Ein Hauptpunkt ist jedoch, dass das Forschungsziel hier viel weniger befahrbar ist, da die H-Werte “c|” H nicht genau vergleichbar, aus zwei Gründen: (1) Die verglichenen Ergebnisse sind unterschiedlich, und (2) die verglichenen Populationen sind unterschiedlich. Lassen Sie mich das erste Problem als “Ergebnisunerzielung” und das zweite Problem als “Unermesslichkeit der Bevölkerung” bezeichnen. Beide Probleme werden von Cameron und Heckman (1998) diskutiert. Es gibt viele verschiedene Arten von statistischen Modellen, und ein effektiver Datenanalytiker muss ein umfassendes Verständnis von allen haben. In jedem Szenario sollten Sie nicht nur erkennen können, welches Modell die vorstehende Frage am besten beantworten kann, sondern auch, welches Modell für die Daten, mit denen Sie arbeiten, am besten geeignet ist. Bei der statistischen Modellierung wird statistische Analyse auf ein Dataset angewendet. Ein statistisches Modell ist eine mathematische Darstellung (oder ein mathematisches Modell) der beobachteten Daten. Jedes Modell macht Annahmen.

Die Aufgabe des Autors ist es, nicht nur sicherzustellen, dass es eine klare Unterscheidung zwischen den Beweisen und den Annahmen gibt, sondern auch, dass das Publikum verstehen kann, wie sich die Projektionen des Modells ändern werden, wenn sich diese Annahmen ändern. Wenn FRA Modelle für unsere Kunden entwickelt, verankern wir einen Prozess, bei dem alle zugrunde liegenden Annahmen klar formuliert und diskutiert werden, damit wichtige Entscheidungsträger zu einem Konsens kommen. Wenn statistische Modelle als fehlgeschlagen wahrgenommen werden, liegt dies häufig daran, dass eine oder mehrere wichtige Annahmen nicht angepasst wurden, um neue Daten widerzuspiegeln. Daher ist eine der wichtigsten Übungen bei der Entwicklung eines dynamischen Modells der Prozess, eine effektive Rückkopplungsschleife zu gewährleisten, um die Annahmen zu testen und das Modell mit neuen (oft zuverlässigeren) Informationen zu aktualisieren. Sowohl bei COVID-19 als auch bei der Schweinegrippe ging viele Modelle früh davon aus, dass die Zahl der Infizierten in etwa mit der Anzahl der positiven Tests korreliert. Wir wissen jetzt, dass dies nicht der Fall ist, was für die signifikante Abwärtskorrektur der Zahl der prognostizierten Todesfälle in beiden Modellgruppen verantwortlich ist. Modelle können durch die Qualität und Verfügbarkeit der Daten, die den Daten zugrunde liegenden Annahmen und das Konfidenzniveau in beiden Daten beeinflusst werden. Beispielsweise stützen sich die epidemiologischen COVID-19-Modelle auf bewährte statistische Methoden, aber die Nichtverfügbarkeit von Daten und die Schwierigkeit, öffentliche Maßnahmen zur Begrenzung der Ausbreitung des Virus vorherzusagen, führten zu großen Konfidenzintervallen – oder einem Bereich potenziell korrekter Werte – bei den vorhergesagten Infektionsraten.

Comments are closed.