Auswirkungen des Ignorierens des Stichprobendesigns bei der Vorhersage binärer Gesundheitsergebnisse durch logistische Regression: Beweise aus der Bevölkerungs- und Gesundheitsumfrage in Malawi unten
HeimHeim > Blog > Auswirkungen des Ignorierens des Stichprobendesigns bei der Vorhersage binärer Gesundheitsergebnisse durch logistische Regression: Beweise aus der Bevölkerungs- und Gesundheitsumfrage in Malawi unten

Auswirkungen des Ignorierens des Stichprobendesigns bei der Vorhersage binärer Gesundheitsergebnisse durch logistische Regression: Beweise aus der Bevölkerungs- und Gesundheitsumfrage in Malawi unten

Jan 23, 2024

BMC Public Health Band 23, Artikelnummer: 1674 (2023) Diesen Artikel zitieren

1 Altmetrisch

Details zu den Metriken

Die Geburten- und Sterberaten einer Bevölkerung gehören zu den entscheidenden Statistiken für die sozioökonomische Politikplanung in jedem Land. Da die Sterblichkeitsrate von Kindern unter fünf Jahren einer der Indikatoren zur Überwachung der Gesundheit einer Bevölkerung ist, bedarf sie einer regelmäßigen und genauen Schätzung. Die der Öffentlichkeit leicht zugänglichen nationalen Bevölkerungs- und Gesundheitserhebungsdaten sind zu einem Mittel geworden, um die meisten gesundheitsbezogenen Fragen der afrikanischen Bevölkerung mithilfe relevanter statistischer Methoden zu beantworten. Viele dieser Anwendungen neigen jedoch dazu, den Einfluss des Umfragedesigns in den Schätzungen zu ignorieren, obwohl statistische Tools zur Unterstützung der Analysen verfügbar sind. Über die Menge an ungenauen Informationen, die bei der Vorhersage der Sterblichkeitsraten von Kindern unter fünf Jahren anfallen, ist wenig bekannt. Diese Studie schätzt und vergleicht die Verzerrung, die bei der Anwendung ungewichteter und gewichteter logistischer Regressionsmethoden zur Vorhersage der Sterblichkeitsrate von Kindern unter fünf Jahren in Malawi unter Verwendung landesweiter Umfragedaten auftritt. Zur Bestimmung der Verzerrung wurden die demografischen und Gesundheitsumfragedaten Malawis aus den Jahren 2004, 2010 und 2015–16 herangezogen. Die Analysen wurden in der R-Software Version 3.6.3 und Stata Version 12.0 durchgeführt. Zur Schätzung der Sterblichkeitsrate von Kindern unter fünf Jahren wurde ein logistisches Regressionsmodell verwendet, das verschiedene bio- und soziodemografische Faktoren in Bezug auf Kind, Mutter und Haushalte berücksichtigte. Die Ergebnisse zeigten, dass die Genauigkeit der Vorhersage der nationalen Sterblichkeitsrate bei Kindern unter fünf Jahren von der Clustergewichtung der insgesamt vorhergesagten Wahrscheinlichkeit von Todesfällen bei Kindern abhängt, unabhängig davon, ob das Modell gewichtet wurde oder nicht. Die Gewichtung des Modells verursachte kleine positive und negative Änderungen in verschiedenen Schätzungen mit festem Effekt, wodurch das Ergebnis der Gewichtung in den angepassten Sterbewahrscheinlichkeiten verstreut wurde. Es gab wiederum keinen Unterschied zwischen der mit dem gewichteten Modell ermittelten Gesamtsterblichkeitsrate und der mit dem ungewichteten Modell ermittelten Gesamtsterblichkeitsrate. Wir empfehlen, bei der Berechnung der vorhergesagten Gesamtwahrscheinlichkeit von Ereignissen für ein binäres Gesundheitsergebnis Umfrageclustergewichte zu berücksichtigen. Dies kann erfolgen, ohne sich Gedanken über die Gewichte während der Modellanpassung machen zu müssen, deren Ziel die Vorhersage des Populationsparameters ist.

Peer-Review-Berichte

Die Sterblichkeitsrate von Kindern im Alter von null bis neunundfünfzig Monaten ist ein nützlicher Indikator für die Überwachung nationaler und globaler Gesundheitsziele [1, 16, 32]. Daher erfordert die Schätzung der Gesamtzahl der in der Altersgruppe unter fünf Jahren beobachteten Todesfälle robuste und zuverlässige Techniken, um eine genaue Annäherung an politische Entscheidungen zu erhalten [13, 16]. Es wurde berichtet, dass es in Gesundheitseinrichtungen in afrikanischen Ländern südlich der Sahara eine schwache Registrierung lebenswichtiger Systeme und eine hohe Rate an nicht ausreichend gemeldeten Todesfällen gibt [23, 28, 55]. Die meisten Schätzungen der Sterblichkeitsrate von Kindern unter fünf Jahren in der Region basieren auf Informationen aus nationalen Erhebungen, beispielsweise den Daten der Demographic and Health Survey (DHS) [21, 22, 42, 46]. Aus diesem Grund ist für genaue Schätzungen der Einsatz von auf dem Umfragedesign basierenden statistischen Analysen wie Stichprobengewichten erforderlich [5, 19, 20, 40, 44, 53]. Ein Stichprobengewicht ist der Kehrwert der Wahrscheinlichkeit, dass ein Proband in die Stichprobe aufgenommen wird. Dies gibt die Anzahl der Probanden in der Population an, die jede Stichprobeneinheit repräsentiert. Während der Regressionsanalyse wird das Gewicht des Probanden als Funktion der Kovariaten in das Modell eingeführt, das auf Umfragedaten angewendet wird, um die Verwendung ungleicher Stichprobeneinschlüsse, Nichtbeantwortung und Unterabdeckung des Stichprobenrahmens zu kompensieren [7, 11]. , 36, 42, 50, 57].

Der Effekt des Umfragedesigns wird jedoch in den meisten Anwendungen von Regressionsmethoden zur Schätzung der Sterblichkeitsrate von Kindern unter fünf Jahren in Afrika südlich der Sahara ignoriert, was die Schätzungen und Vorhersagen möglicherweise verzerrt [18, 41, 43, 52]. Es wurde festgestellt, dass dieses Problem auch für andere Studien gilt, in denen neben der Mortalität auch binäre Gesundheitsergebnisse analysiert wurden. Beispielsweise das Vorhandensein oder Nichtvorhandensein von Diabetes [48], Durchfall [33], Schistosomiasis [14, 31] und Malaria [29] sowie anderen Krankheiten bei Patienten. Dieser Trend könnte auf die Nichtverfügbarkeit von Studien zurückzuführen sein, die den technischen Nutzen von Umfragedesigns bei der Anwendung von Regressionsmethoden auf binäre Gesundheitsdaten belegen. Dies könnte auch auf die Tatsache zurückzuführen sein, dass die meisten der überprüften Studien darauf abzielten, Risikofaktoren für die betreffenden Gesundheitsergebnisse zu identifizieren, anstatt das Ausmaß der körperlichen Verfassung selbst vorherzusagen, das in der Bevölkerung auf irgendeine Weise erreicht werden könnte [9, 17, 54]. Es gibt kaum Literatur zu der Verzerrung, die man begehen würde, wenn die nationale Sterblichkeitsrate bei Kindern unter fünf Jahren oder andere binäre Gesundheitsdaten aus einer großen landesweiten Umfrage ohne Berücksichtigung des Designeffekts vorhergesagt würden. In dieser vorliegenden Studie wird daher die Verzerrung abgeschätzt, die ein Forscher bei der Vorhersage der Sterblichkeitsrate von Kindern unter fünf Jahren mithilfe umfragegewichteter und ungewichteter logistischer Regressionsmethoden begehen könnte. Eine Verzerrung bei der Schätzung der Sterblichkeitsrate von Kindern unter fünf Jahren ist die Diskrepanz zwischen der durch Zufallsstichproben geschätzten Rate und der tatsächlichen Rate, die in Routinebeobachtungen gemeldet wird. Man würde erwarten, dass die Differenz zwischen den beiden Werten Null beträgt. In diesem Fall wird der auf die Umfragedaten angewendete Schätzer als erwartungstreu bezeichnet [39]. Die vorliegende Studie verwendet drei aktuelle Datensätze aus Demografie- und Gesundheitsumfragen (DHS) in Malawi für die Jahre 2004, 2010 und 2015–16 sowie die vom jeweiligen DHS gemeldeten offiziellen Sterblichkeitsraten bei Kindern unter fünf Jahren, um die Verzerrung zu berechnen. Es werden verschiedene Stichprobengrößen jedes DHS-Datensatzes verwendet, um den Stichprobengrößeneffekt bei der Bias-Schätzung zu berücksichtigen.

Für Gesundheitsforscher ist es wichtig, den Wert der Informationen zum Umfragedesign in den Schätzmethoden der binären Regression zu kennen, damit sie fundierte Entscheidungen treffen können. Sie müssen die Vor- und Nachteile der Einbeziehung von Umfragegewichten bei der Analyse binärer Gesundheitsdaten mithilfe von Regressionstechniken ermitteln [11]. Die Kenntnis der Verzerrung der Sterblichkeitsschätzung aus dieser Studie wird Hinweise darauf liefern, in der Gesundheitsforschung ein Umfragedesign in Betracht zu ziehen, das die Vorhersage einiger binärer Ouktome beinhaltet. Der Rest des Artikels ist wie folgt gegliedert: Im Abschnitt „Methoden“ werden die in dieser Studie verwendeten statistischen Methoden und Daten vorgestellt; Abschnitt „Ergebnisse“ zeigt Ergebnisse; während im Abschnitt „Diskussion“ die Ergebnisse diskutiert werden. Der Abschnitt „Schlussfolgerung“ schließlich ist die Schlussfolgerung des Papiers.

In dieser Studie wurden Sekundärdaten für Kinder verwendet, die aus der Kinderaktendatei des Malawi Demographic and Health Survey (MDHS) stammen. Diese Datensätze stammen aus Umfragen, die zwischen Oktober 2004 und Januar 2005, dann zwischen Juni und November 2010 und schließlich zwischen Oktober 2015 und Februar 2016 durchgeführt wurden. Das MDHS verwendet eine zweistufige geschichtete Cluster-Zufallsstichprobe mit 522, 849 und 850 In der Anfangsphase wurden jeweils landesweit Cluster (d. h. Zählgebiete) beprobt. In der zweiten Phase wurden jeweils 15.091, 27.345 und 27.516 Haushalte aus den ursprünglich ausgewählten Clustern unter Verwendung der ländlichen und städtischen Schichtung befragt [30, 34, 35]. Ein Zählgebiet (Cluster oder Dorf) ist ein geografisches Gebiet, das beispielsweise zwischen 0 und 954 Haushalte oder durchschnittlich 235 Haushalte umfasst [24]. Jeder Cluster enthält Informationen über seinen Standort, seine Schichten (städtisch oder ländlich), eine geschätzte Anzahl von Wohnhaushalten sowie eine Kartenskizze mit den Grenzen, der Lage von Gebäuden und anderen Orientierungspunkten. Die bei der Volks- und Wohnungszählung 1998 ermittelten Cluster bildeten einen Stichprobenrahmen für primäre Stichprobeneinheiten im MDHS 2004, und die bei der Volkszählung 2008 definierten Cluster bildeten den Rahmen für die MDHS 2010 und 2015–16 [30, 34, 35]. Die Stichprobe für diese Studie bildeten die Kinder, die in den befragten Haushalten unter fünf Jahre alt waren. In den MDHSs 2004, 2010 und 2015–16 wurden insgesamt 10.914, 19.967 und 17.286 Kinder unter fünf Jahren für die Studie befragt. Die Mütter oder erwachsenen Betreuer im Alter zwischen 15 und 49 Jahren übermittelten die Geburtsgeschichte der Kinder, einschließlich der Sterblichkeitsdaten.

Die Antwortvariable für diese Studie war, ob in den letzten fünf Jahren vor der Umfrage ein Kind unter fünf Jahren aus einem Haushalt gestorben war oder nicht. Zur Berechnung der Wahrscheinlichkeit, dass ein Kind vor seinem fünften Lebensjahr stirbt, wurden auf Grundlage der Literatur verschiedene Risikofaktoren herangezogen, die das Kind, die Mutter und das häusliche Umfeld betreffen. Dies sind: Geburtsgewicht, Geburtsreihenfolge, Geschlecht, ob es sich um eine Einzel- oder Mehrlingsgeburt handelte, Art der Entbindung (normal oder Kaiserschnitt), Alter der Mutter, Bildung und Beruf, Wohnort, einschließlich Region des Landes, Ort der Entbindung, vor der Geburt, Verwendung von Verhütungsmitteln und Besuche in der Geburtsklinik (ANC) während der Schwangerschaft [3, 8, 12, 17, 18, 26, 49]. Allerdings wiesen die Variablen Geburtsgewicht des Kindes und ANC-Besuche mindestens ein Drittel fehlende Werte auf und wurden daher nicht in die angepassten Modelle einbezogen. Die Datenverwaltung und Modellanpassung erfolgten in der STATA-Softwareversion 12.0, während die Berechnungen der prognostizierten nationalen Sterblichkeitsrate bei Kindern unter fünf Jahren und der Standardfehler mit der R-Softwareversion 3.6.3 durchgeführt wurden. Darüber hinaus wurden die in den jeweiligen MDHS-Berichten [30, 34, 35] angegebenen Rohdaten der Sterblichkeitsraten von unter fünf Jahren von 133, 112 und 63 Todesfällen pro 1000 Lebendgeburten für Vergleiche mit den modellbasierten Schätzungen in dieser Studie verwendet . Die MDHS-Daten, die in dieser Studie verwendet wurden, können von Benutzern kostenlos unter www.DHSprogram.com abgerufen werden.

Betrachten Sie eine binäre Ergebnisvariable Y, die angibt, ob in einem Haushalt in den letzten fünf Jahren der Umfrage ein Kind bei oder vor Erreichen des fünften Lebensjahres gestorben ist oder nicht. Sei \(y_{ic}\) der beobachtete Todesfall für das i-te Kind im c-ten Cluster, \(i=1,2,...,n; c = 1,2,..., K\), wobei \(y_{ic}=1\), wenn das Kind starb, und \(y_{ic}=0\), wenn das Kind noch lebte. Weiterhin sei \(\pi _{ic}=P(Y=1)\) die Wahrscheinlichkeit, dass das i-te Kind im Haushalt aus dem c-ten Cluster stirbt. Dann ist die Gesamtzahl der Todesfälle im c-ten Cluster angesichts der Todeswahrscheinlichkeit und der Stichprobengröße, d. h. \(\sum (Y=1|n,\pi _{ic})\) ein \(Binomial(n, \pi _{ic})\) Zufallsvariable, mit Massenfunktion \(f(y_{ic};n,\pi _{ic}) = \exp \left[ y_{ic}\log (\frac{\ pi _{ic}}{1-\pi _{ic}})+ n\log (1-\pi _{ic})+\log {{n}\atopwithdelims (){y_{ic}}}\ Rechts]\). Außerdem sei \(x^{T}_{ick}=(1,x_{ic1},x_{ic2},...,x_{icp})\) ein Vektor erklärender Variablen, die auf dem i beobachtet werden -tes Kind, das sich in Cluster c befindet, wobei \(x_{ic0}=1\) und \(k = 1,2,...,p\) die Anzahl der Regressionskoeffizienten ist. Daher ist die ungewichtete bedingte Wahrscheinlichkeit, dass ein Kind stirbt, angesichts der Kovariaten \(\textbf{x}\), d. h. \(\pi _{ic}(\textbf{x})=P(Y=1|\textbf{x })\), bezieht sich auf die Kovariaten über eine logistische Funktion, gegeben durch:

wobei \(\beta ^{T}=(\beta _0,\beta _1,...,\beta _p)\) ein Vektor von Regressionskoeffizienten ist und \(\textbf{x}=(1,x_{ic1 },x_{ic2},...,x_{icp})^{T}\) ist ein Vektor von Kovariaten, die auf dem i-ten Kind des c-ten Clusters beobachtet werden.

Aus der Beziehung in Gl. (1) Das ungewichtete logistische Regressionsmodell mit Logit-Link wird wie folgt abgeleitet:

Die Maximum-Likelihood-Schätzungen (ML) \(\hat{\beta }\) für das Modell in Gl. (2) werden durch Multiplikation der Wahrscheinlichkeitswerte in der Massenfunktion \(f(y_{ic})\) für alle Kinder und anschließende Logarithmierung des Ergebnisses erhalten. Danach werden die partiellen Ableitungen der Log-Likelihood-Funktion nach \(\beta\) abgeleitet und dann mit Null gleichgesetzt, woraus die ML-Schätzungen \(\hat{\beta }\) gelöst werden. Zur Verarbeitung der Lösungen werden numerische Techniken eingesetzt, da die Gleichungen für die Ableitungen der Log-Likelihood-Funktion nicht in geschlossener Form vorliegen [6]. Die ML-Schätzung \(\hat{\beta }\) für Modell (2) wird als die Änderung des Logarithmus der angepassten Sterbewahrscheinlichkeit eines Kindes als Ergebnis der Änderung des Niveaus der Kovariate X unter Kontrolle interpretiert die anderen Variablen im Modell. Alternativ kann \(\hat{\beta }\) potenziert werden, um \(exp(\hat{\beta })\) zu erhalten, das als Verhältnis der angepassten Sterbewahrscheinlichkeiten eines Kindes beim Vergleich einer Ebene von interpretiert wird X zum anderen.

Nun wurde die gesamte ungewichtete vorhergesagte Sterbewahrscheinlichkeit für alle Kinder unter fünf Jahren im Land geschätzt, indem der Durchschnitt aller angepassten Wahrscheinlichkeiten für das Modell in Gleichung (1) herangezogen wurde. (2), wie folgt:

Dies ist die übliche Punktschätzung der Sterberate unter fünf Jahren in allen Clustern, wobei \(\hat{\pi }_{ic}(\textbf{x})=\frac{exp(\hat{\beta } ^T\textbf{x})}{1+exp(\hat{\beta }^T\textbf{x})}\) ist die angepasste Sterbewahrscheinlichkeit des i-ten Kindes im c-ten Cluster angesichts der Kovariateninformationen \(\textbf{x}\) für dieses Kind und gegebenes angepasstes Modell. Aus der Wahrscheinlichkeitstheorie der Stichprobenverteilung von Stichprobenanteilen wurde die ungewichtete Varianz von \(\hat{\pi }(\textbf{x})\) geschätzt durch:

Die ungewichteten Maße in Gl. (3) und (4) können entweder nach dem ungewichteten Modell in Gleichung implementiert werden. (2) oder das gewichtete Modell, das im nächsten Abschnitt vorgestellt wird, da die Berechnung der vorhergesagten Sterblichkeit separat durchgeführt werden muss, sobald die angepassten Wahrscheinlichkeiten aus dem Logit-Modell erhalten wurden. Die Quadratwurzel der Varianz in Gl. (4) lieferte den Standardfehler der vorhergesagten Sterblichkeitsrate unter fünf Jahren in Gl. (3).

Nach Erhalt der nationalen Schätzung der Sterblichkeitsrate von Kindern unter fünf Jahren in Gl. (3) Die Verzerrung der Schätzung wurde wie folgt berechnet:

wobei \(\hat{\pi }(\textbf{x})\) die vorhergesagte Sterblichkeitsrate ist, die in Gleichung erhalten wird. (3) und \(\pi\) ist die rohe Sterblichkeitsrate unter fünf Jahren, die im jeweiligen MDHS-Bericht angegeben ist. Wie bereits erwähnt, wurden die Modelle und alle anderen oben genannten Berechnungen unter Verwendung der drei aktuellen MDHS-Daten aus den Jahren 2004, 2010 und 2015–16 erneut durchgeführt, um die Ergebnisse zu bestätigen. Darüber hinaus kann die Nützlichkeit von Umfragegewichten in einer Regressionsmethode von der Stichprobengröße der Umfrage abhängen [15]. Daher wurden die oben genannten Prozesse mit 75 %, 50 % und 25 % der MDHS-Stichprobengröße wiederholt. Dies wurde mithilfe der gleichen Cluster-Sampling-Methode mithilfe der Stata-Softwarefunktion bsample ausgewählt, die auf die Cluster-Identifikationsvariable angewendet wurde, um den Effekt der Stichprobengröße bei der Bias-Schätzung zu berücksichtigen [51]. Die Berechnungen für Statistiken in Gl. (3-5) wurden mit der R-Softwareversion 3.6.3 implementiert, während das Modell in Gl. (2) wurde mit der Stata-Softwareversion 12.0 an die Daten angepasst.

Unter Verwendung der im Abschnitt „Ungewichtetes logistisches Regressionsmodell und vorhergesagte Sterblichkeitsrate“ dargestellten Datenstruktur sei \(w_{ic}=\frac{N_c}{n_c}\) das Stichprobengewicht für das i-te Kind im Cluster c, der in einer ländlichen oder städtischen Schicht lebte, wobei \(N_c\) die Bevölkerung von Kindern unter fünf Jahren in Cluster c gemäß der Proxy-Volkszählung bezeichnet und \(n_c\) die ausgewählte Anzahl von Kindern in Cluster c. Basierend auf der Volks- und Wohnungszählung von 2018 gab es im Land 2.552.406 Kinder unter fünf Jahren, die in 18.772 Zählgebieten (oder Clustern) gleicher Größe lebten [25]. Dies bedeutet, dass die Population von Kindern im Alter von fünf Jahren oder jünger zum Zeitpunkt des MDHS 2015-16 auf etwa \(N_c = \frac{2.555.406}{18.772}=135,969\) pro Cluster geschätzt wurde. Betrachtet man nun die untersuchten Kinder unter fünf Jahren (n_{c}\) im Cluster c, bedeutet dies, dass jedes ausgewählte Kind im MDHS 2015–16 Informationen für \(w_{ic}=\frac{135,969}{) repräsentierte. n_{c}}\) Kinder in ihrem Gebiet, abhängig von der Cluster-Stichprobengröße. Andererseits gab es im Jahr 2008 in Malawi 2.370.011 Kinder unter fünf Jahren, die auf 12.631 gleich große Zählgebiete (oder Cluster) verteilt waren [24]. Daher betrug die Population von Kindern unter fünf Jahren zum Zeitpunkt des MDHS 2004 oder 2010 etwa \(N_c = \frac{2.370.011}{12.631}=187,634\) pro Cluster. Daher repräsentierte jedes im MDHS 2004 oder 2010 untersuchte Kind \(w_{ic}=\frac{187,634}{n_{c}}\) Kinder an seinem Standort. Dann ist die gewichtete bedingte Todeswahrscheinlichkeit des i-ten Kindes angesichts der Kovariaten x:

wobei die restlichen Größen wie in Gl. definiert sind. (1). Daher ist das Gegenstück zum gewichteten Logit-Modell [56] zur Modellierung in Gl. (2) ist gegeben durch:

wobei \(w_{00}=1\) und die restlichen Berechnungen vom Cluster abhingen, zu dem das Kind gehörte. Der Konstruktionsprozess der Wahrscheinlichkeitsfunktion ähnelt dem im Abschnitt „Ungewichtetes logistisches Regressionsmodell und vorhergesagte Sterblichkeitsrate“ für das ungewichtete Modell. Wie bereits erwähnt, stellte diese Umfragegewichtung sicher, dass der Beitrag jedes Kindes zur Wahrscheinlichkeitsfunktion des Modells das Stichprobengewicht für dieses Kind berücksichtigte, um die ungleiche Stichprobenauswahl, Nichtbeantwortung oder Unterabdeckung des Stichprobenrahmens zwischen den Kindern auszugleichen Cluster bei der Berechnung der ML-Schätzungen [7, 11, 36, 50].

Zur Implementierung des Gewichtungsschemas während der Modellanpassung wurde die Stata-Paketumfragefunktion svy verwendet. Die Jackknife-Technik wurde angewendet, um Standardfehler der Schätzungen der Regressionskoeffizienten für das gewichtete Logit-Modell in Gleichung zu berechnen. (7) [27]. Im Idealfall sollte anstelle der binomialen Wahrscheinlichkeitsverteilung eine hypergeometrische Wahrscheinlichkeitsverteilung für die beobachtete Anzahl von Todesfällen unter fünf Jahren pro Cluster angenommen werden, da die Stichprobe der Kinder ersatzlos erfolgte und die Grundgesamtheit mit fortschreitender Stichprobe endlich wurde . Daher ist der Standardfehler der binomialen Antwortvariablen, also \(\sqrt{n\pi _{ic}(\textbf{x})(1-\pi _{ic}(\textbf{x}))}\ ) sollte mit dem endlichen Populationskorrekturfaktor (FPC) \(FPC=\sqrt{\frac{Nn}{N-1}}\) multipliziert werden, um es dem Standardfehler der hypergeometrischen Zufallsvariablen äquivalent zu machen. Allerdings haben wir den FPC-Faktor in den Berechnungen dieser Studie ignoriert, da sein Wert für jede Umfrage ungefähr 1 betrug, d. =0,9966\) basierend auf MDHS 2015-16 und der Volkszählung 2018, während \(FPC_{(2004)}=\sqrt{\frac{2,370,011-10,914}{2,370,011-1}}=0,9976\) basierend auf MDHS 2004, und \(FPC_{(2010)}=\sqrt{\frac{2,370,011-19,967}{2,370,011-1}}=0,9958\) bei der MDHS 2010 und der Volkszählung 2008.

Nach Erhalt der ML-Schätzungen und angepassten Todeswahrscheinlichkeiten aus dem ungewichteten Logit-Modell in Gl. (2) oder das gewichtete Logit-Modell in Gl. (7) kann es sinnvoll sein, die Gewichtungen auf Clusterebene bei der Berechnung der insgesamt vorhergesagten Sterblichkeitsrate zu berücksichtigen. Dazu müssen zunächst die Cluster-spezifischen ungewichteten Sterberaten \(\hat{\pi }_{c}(\textbf{x})\) mithilfe der Methode von Gl. ermittelt werden. (3). Anschließend kann die landesweit gewichtete Sterblichkeitsrate bei Kindern unter fünf Jahren geschätzt werden, indem das Gewicht jedes Clusters wie folgt berücksichtigt wird:

wobei \(\bar{m}=\frac{\sum _{c=1}^{K}n_{c}}{K}\) die durchschnittliche Anzahl der untersuchten Kinder pro Cluster ist, \(\hat{\ pi }_{c}=\frac{\sum _{i=1}^{n_{c}}\hat{\pi }_{i}}{n_{c}}\) ist die Cluster-spezifische Schätzung Sterberate bei Kindern unter fünf Jahren, wobei \(\hat{\pi }_{i}\) angepasste Sterbewahrscheinlichkeiten sind, die aus dem angepassten Modell erhalten wurden, und \(\frac{n_{c}}{\bar{m} }\) ist der Gewichtungsterm pro Cluster. Die gewichtete Varianz der Gesamtsterblichkeitsrate kann mit der üblichen Grundformel für die Varianz einer Zufallsgröße berechnet werden, jetzt jedoch mit quadriertem Gewichtungsterm, wie folgt:

wobei \(\hat{\pi }_{c}(\textbf{x})\) die geschätzte Sterblichkeitsrate unter fünf Jahren in Cluster c ist und \(\hat{\pi }^{*}(\textbf {x})\) die gewichtete geschätzte nationale Sterblichkeitsrate bei Kindern unter fünf Jahren in Gl. (8). Nach Erhalt der gewichteten Gesamtmortalitätsschätzung erfolgte die Berechnung der Verzerrung der Mortalitätsschätzung wie im Abschnitt „Ungewichtetes logistisches Regressionsmodell und vorhergesagte Mortalitätsrate“ unter Verwendung der R-Softwareversion 3.6.3.

Das Akaike-Informationskriterium (AIC) wurde verwendet, um das beste Modell zur Berechnung der prognostizierten nationalen Sterblichkeitsrate bei Kindern unter fünf Jahren auszuwählen [38]. Dies galt für das ungewichtete Modell, da die zur Anpassung der Modelle verwendete STATA-Software keine AIC-Werte für gewichtete Modelle erzeugt. Das ursprüngliche Modell umfasste alle im Abschnitt „Daten“ aufgeführten Variablen. Das zweite Modell ließ die Variablen weg, deren Koeffizienten im ersten Modell große p-Werte hatten.

Die Datenzusammenfassung in Tabelle 1 zeigt, dass die Zahl der Todesfälle bei Kindern unter fünf Jahren in Malawi in den 15 Jahren vor 2016 weniger als 10 % betrug. Darüber hinaus zeigte der Anteil der Todesfälle bei Kindern unter fünf Jahren in diesem Zeitraum einen rückläufigen Trend , so dass sich der Prozentsatz zwischen 2010 und 2016 fast halbiert hat. Darüber hinaus zeigten die Daten, dass der Prozentsatz der Todesfälle unter fünf Jahren bei männlichen Babys, der Geburtsreihenfolge 1 oder 6 und höher, Kaiserschnittgeburten, Zwillings- oder Mehrlingsgeburten usw. höher war bei Hauslieferungen in allen drei Umfragen. Ebenso wurde die Mehrzahl der Todesfälle bei Kindern unter fünf Jahren bei Babys beobachtet, deren Mütter entweder unter 20 oder 35 Jahre und älter waren, bei Babys, deren vorangegangener Geburtszeitraum weniger als 24 Monate betrug, bei anderen, die keine modernen Verhütungsmethoden anwendeten. diejenigen, die keinen formalen Bildungsabschluss hatten, und andere, die berufstätig waren. Darüber hinaus war der Prozentsatz der Todesfälle unter fünf Jahren bei Kindern aus ländlichen Gebieten sowie bei Kindern aus zentralen und südlichen Regionen des Studienlandes höher. Der Chi-Quadrat-Test der Unabhängigkeit zeigte, dass alle untersuchten erklärenden Variablen einen individuellen signifikanten Zusammenhang mit der Todesvariable von Kindern unter fünf Jahren hatten, was durch mindestens zwei der MDHS-Datensätze belegt wurde.

Die Ergebnisse in Tabelle 2 liefern die Modellschätzungen unter Einbeziehung aller verfügbaren Kovariaten aus Tabelle 1 zur Beschreibung des Todes von Kindern unter fünf Jahren. Sowohl in ungewichteten als auch in gewichteten Modellen und in allen Umfragen zeigt sich, dass die angepasste Sterbewahrscheinlichkeit von Kindern unter fünf Jahren bei weiblichen Kindern mit einem Geburtsintervall von mindestens 24 Monaten und bei Kindern von Müttern, die älter als 24 Monate waren, geringer war nutzte moderne Verhütungsmethoden. Die bereinigten Sterbewahrscheinlichkeiten waren höher bei Kaiserschnittgeburten, Zwillings- oder Mehrlingsgeburten, Kindern von Müttern aus der Arbeiterklasse, Kindern von Müttern im Alter von 35 bis 49 Jahren, Kindern aus ländlichen Gebieten und Kindern, die in zentralen und südlichen Regionen geboren wurden. Die Auswirkungen der Geburtsreihenfolge, des Entbindungsorts und des Wohnorts auf den Todesfall des Kindes waren in einem Modell mit den anderen oben genannten Variablen statistisch nicht signifikant. Daher wurden diese Kovariaten im endgültigen Modell, das zur Vorhersage der Sterblichkeitsrate von Kindern unter fünf Jahren und zur Schätzung der Verzerrung verwendet wurde, weggelassen. Die AIC-Werte in Tabelle 2 waren für Vergleiche mit denen reserviert, die durch Ausschluss der genannten Variablen erhalten wurden.

Bei der Anpassung der reduzierten Logit-Modelle an die Datensätze zeigt Tabelle 3, dass sich die AIC-Werte im Vergleich zu den zuvor gefundenen Werten nicht wesentlich verändert haben. Der Versuch, jede der drei Kovariaten unabhängig voneinander wegzulassen, verschlechterte die Anpassung der Modelle. Daher wurden die Ergebnisse der ML-Schätzungen in Tabelle 3 für Modelle ohne die drei angegebenen Kovariaten zur Berechnung der Verzerrung in dieser Studie verwendet. Die Ergebnisse in Tabelle 3 zeigten, dass die p-Werte für die reduzierten Modelle niedriger waren als die in Tabelle 2 angegebenen. Die Größen und Richtungen der Schätzungen änderten sich jedoch nicht. Die Sterbewahrscheinlichkeit von Kindern unter fünf Jahren war bei weiblichen Kindern im Vergleich zu männlichen deutlich geringer, bei Kindern, die von Müttern geboren wurden, deren Geburtsintervall vorher 24 Monate und länger betrug, bei Kindern, deren Mütter moderne Verhütungsmethoden anwendeten, und bei Kindern, deren Mütter die höchste hatten Das Bildungsniveau war Sekundarstufe oder höher. Dagegen war die Wahrscheinlichkeit, dass ein Kind stirbt, bei Kaiserschnittgeburten, Zwillings- oder Mehrlingsgeburten, Kindern von Müttern im Alter von 35 bis 49 Jahren, Kindern von berufstätigen Müttern und Kindern aus zentralen und südlichen Regionen höher. Darüber hinaus wurden sowohl die ML-Schätzungen als auch die p-Werte in den gewichteten Modellen im Vergleich zu den ungewichteten Modellen leicht nach oben oder unten angepasst, was eine gewisse Verzerrung in den Schätzungen der ungewichteten Modelle zeigte.

Die Ergebnisse für die Verzerrung der Schätzung der Sterblichkeitsrate bei Kindern unter fünf Jahren sind in Tabelle 4 aufgeführt. Es zeigt sich, dass die Verzerrung bei der gewichteten vorhergesagten Sterblichkeitsrate bei Kindern unter fünf Jahren geringer war als bei der ungewichteten vorhergesagten Sterblichkeitsrate bei Kindern unter fünf Jahren, unabhängig davon, ob das angepasste Modell gewichtet wurde oder nicht. Darüber hinaus zeigten die Ergebnisse, dass die Standardfehler auch für die gewichtete vorhergesagte Sterblichkeitsrate kleiner waren als für die ungewichtete vorhergesagte Sterblichkeitsrate, unabhängig vom Gewichtungsstatus des Modells. Darüber hinaus wird gezeigt, dass die Bias-Schätzung für die Sterblichkeitsrate von Kindern unter fünf Jahren in jedem Erhebungsjahr abnahm, so dass sie im MDHS 2015–2016 am niedrigsten war. Darüber hinaus zeigten die Ergebnisse, dass die Bias-Schätzungen der gewichteten vorhergesagten Mortalität aus den MDHS-Daten von 2010 mit abnehmender Stichprobengröße leicht zunahmen. Dies war jedoch bei den Umfragen von 2004 und 2015 nicht immer der Fall, da es selbst bei der kleinsten Stichprobe kleinere Bias-Schätzungen gab Größen für die MDHS-Daten in den angegebenen Jahren. Aufgrund der ungewichteten vorhergesagten Sterblichkeitsrate waren die Bias-Schätzungen für alle drei Umfragen unabhängig von der Stichprobengröße. Schließlich blieben die Standardfehler der gewichteten vorhergesagten Sterblichkeitsrate bei Reduzierung der Stichprobengröße gleich, stiegen jedoch bei ungewichteter vorhergesagter Sterblichkeit leicht an.

In diesem Artikel wurde die Nützlichkeit von Umfragegewichten bei der Vorhersage der Sterblichkeit von Kindern unter fünf Jahren mithilfe von Regressionsmethoden untersucht. Die Ergebnisse zeigten, dass die Gewichtung des Modells einige positive und negative Änderungen in den Maximum-Likelihood-Schätzungen (ML) verursacht, die ursprünglich aus dem ungewichteten Modell erhalten wurden. Dies bestätigt das Vorhandensein einer gewissen Verzerrung bei ML-Schätzungen für ungewichtete Modelle [11, 36]. Die Studie hat jedoch ergeben, dass das Ignorieren der Stichprobengewichte während der Modellanpassung nur geringe Auswirkungen auf die Genauigkeit der Schätzung der insgesamt vorhergesagten Sterblichkeitsrate bei Kindern unter fünf Jahren hat. Es ist die Gewichtung des Erhebungsdesigns, die auf die prognostizierten Sterblichkeitsschätzungen aus jedem Cluster angewendet wird und die einen erheblichen Einfluss auf die Abweichung der insgesamt prognostizierten Sterblichkeitsrate bei Kindern unter fünf Jahren hat. Dies impliziert, dass die Verschiebungen der ML-Schätzungen für verschiedene erklärende Variablen nach oben und unten den Gewichtungseffekt bei der Berechnung der angepassten Ereigniswahrscheinlichkeiten für Einzelpersonen aufheben, die bei der Berechnung der gesamten vorhergesagten Sterblichkeitsrate verwendet werden. Daher besteht die Notwendigkeit zusätzlicher Cluster-Schichten-Gewichte für die prognostizierten Sterblichkeitsraten des Clusters, um eine niedrig verzerrte Gesamtschätzung der prognostizierten Sterblichkeit unter fünf Jahren zu erreichen.

Die Ergebnisse zeigten, dass die Verzerrungen bei der Sterblichkeitsschätzung mit jedem Umfragejahr abnahmen, wobei die Verzerrung am geringsten war, wenn die MDHS-Daten 2015–16 zur Vorhersage der vorherrschenden Sterblichkeit von Kindern unter fünf Jahren im Vergleich zu früheren Umfragen verwendet wurden. Dies spiegelte Verbesserungen bei den Datenqualitätssicherungsmaßnahmen wider, die das Measure DHS-Programm und das Nationale Statistikamt im Laufe der Jahre durchgeführt haben. Beispielsweise wurden die MDHS-Daten 2015–16 mithilfe des CAPI-Tools (Computer-Assisted Personal Interviews) erfasst, im Gegensatz zum MDHS 2004, wo die Fragebögen physisch verwaltet und die Daten manuell eingegeben wurden. Dieser manuelle Prozess der Datenverwaltung könnte der Grund dafür sein, dass bei einigen Variablen wie dem Geburtsgewicht im MDHS 2004 im Vergleich zu den MDHS-Daten 2015–16 mehr Werte fehlten. Fehlende Daten können die Zufälligkeit und Repräsentativität der Stichprobe beeinträchtigen und gleichzeitig die Verzerrung der Gesamtmortalitätsschätzungen erhöhen. Darüber hinaus wurden die Geokoordinatendaten der Haushalte vor der Umfrage aufgezeichnet und als Leitfaden für die Erzähler verwendet, damit sie die richtigen Haushalte in der Stichprobe erreichen und einen unbefugten Austausch von Befragten während des MDHS 2015–2016 vermeiden konnten. Darüber hinaus wurden die Haushalte in halbstädtischen Gebieten während des MDHS 2015–16 in richtige ländliche oder städtische Schichten umklassifiziert, damit die Daten eines Kindes korrekt erfasst werden konnten. Dies war anders als bei den vorherigen Erhebungen, bei denen solche Haushalte fälschlicherweise städtischen Schichten zugeordnet werden konnten. Daher führten diese Initiativen zu einer hohen Rücklaufquote und einer guten Datenqualität im MDHS 2015-16 im Vergleich zu den MDHSs 2010 und 2004. Dies wiederum führte zu einer geringeren Verzerrung der prognostizierten Sterblichkeitsrate von Kindern unter fünf Jahren für das MDHS 2015–16, wie in der vorliegenden Studie beobachtet wurde [30].

Die Studie hat auch gezeigt, dass eine Reduzierung der Stichprobengröße des MDHS nur zu einem leichten Anstieg der Standardfehler der ungewichteten vorhergesagten Sterblichkeitsraten führte und nicht zu einem Anstieg der Schätzungen selbst, da diese trotz der Verringerung der Stichprobengröße konstant blieben . Es wurde beobachtet, dass eine Stichprobengröße von nur 2 % der Bevölkerung aller Kinder im Land immer noch zu niedrig verzerrten Sterblichkeitsschätzungen führen könnte, vorausgesetzt, die Stichprobe wurde zufällig ausgewählt und ist repräsentativ für die Bevölkerung, und die Gesamtprognose stimmt Die Sterblichkeitsrate wurde gewichtet. Dies wurde erwartet, da das ungewichtete Varianzmaß für den Stichprobenanteil, wie z. B. die ungewichtete Sterblichkeitsrate, eine Gesamtstichprobengröße im Nenner beinhaltete, was die Varianz bei geringeren Stichprobengrößen erhöhte. Aufgrund der Auswirkungen der Stichprobenzufälligkeit und Repräsentativität konnte dies jedoch keinen Einfluss auf den Wert der Mortalitätsschätzung haben. Wenn ein Forscher keinen Zugriff auf primäre Umfragedaten, sondern auf aggregierte Daten aus zwei oder mehr Umfragen für ein Land oder eine Region hat, für die er ähnliche Vorhersagen treffen möchte, können Methoden der gepoolten und gewichteten Umfrageschätzung unter Verwendung hierarchischer Mixed-Effects-Modelle oder Metaanalysen verwendet werden könnten zuverlässige Schätzungen liefern, vorausgesetzt, dass alle gepoolten Umfragen innerhalb derselben Schlussfolgerungszeit durchgeführt wurden [4, 10].

Die ML-Schätzungen des Modells zeigten, dass das Sterblichkeitsrisiko bei Kindern unter fünf Jahren bei weiblichen Kindern geringer war als bei männlichen Kindern, bei Kindern, deren Mütter einen Geburtsabstand von 24 Monaten und mehr hatten, bei Kindern, deren Mütter moderne Verhütungsmethoden verwendeten, und bei Kindern, deren Mütter zur Schwangerschaftsvorsorge kamen bis zur Sekundarstufe und höher. Das Risiko war bei Kaiserschnittgeburten, Zwillings- oder Mehrlingsgeburten, bei Kindern, deren Mütter zwischen 35 und 49 Jahre alt waren, bei Kindern, die von Müttern aus der Arbeiterklasse geboren wurden, und bei Kindern, die in zentralen und südlichen Regionen Malawis lebten, höher. Diese Ergebnisse stimmen mit früheren Erkenntnissen überein, und in der Literatur gibt es auch klare biologische und soziale Erklärungen für diese Beobachtungen [18, 26, 37, 45, 47]. Beispielsweise haben gut gebildete Mütter im Vergleich zu weniger gebildeten Müttern die Oberhand in Bezug auf Wissen und Fähigkeiten im Gesundheitswesen, was der Gesundheit des Babys zugute kommt [26]. Das hohe Sterberisiko bei Zwillingsgeburten spiegelt größtenteils ein erhöhtes Risiko einer intrapartalen Anoxie beim zweiten termingerecht geborenen Zwilling wider, was seine Überlebenschancen verringert [47]. Bei Kaiserschnittgeburten ist das hohe Sterberisiko auf ein erhöhtes Risiko einer iatrogenen Frühgeburt oder einer Atemwegserkrankung zurückzuführen [45]. Während die niedrigeren Sterblichkeitsraten bei weiblichen Babys auf ihre genetische und biologische Veranlagung sowie auf vorgefasste Umstände zurückgeführt werden, die ihr Risiko für die meisten Krankheiten im Vergleich zu männlichen Babys senken [37]. Darüber hinaus wird das hohe Sterberisiko von Kindern unter fünf Jahren von Müttern aus der Arbeiterklasse auf unzureichendes Stillen ihrer Babys zurückgeführt [2].

In diesem Artikel wurde der Einfluss des Stichprobendesigns der Umfrage auf die prognostizierte Sterblichkeitsrate von Kindern unter fünf Jahren mithilfe von Regressionsmethoden untersucht, die auf drei aktuelle demografische und gesundheitsbezogene Umfragedaten in Malawi angewendet wurden. Die Ergebnisse zeigten, dass sich die Risikofaktoren für die Sterblichkeit von Kindern unter fünf Jahren im Vergleich zu denen, die in früheren Studien in der Region südlich der Sahara und in anderen Ländern mit niedrigem und mittlerem Einkommen (LMIC) beobachtet wurden, nicht verändert haben. Die Studie hat ergeben, dass die Wahrscheinlichkeitsgewichte des Modells nur einen sehr geringen Einfluss auf die Abweichung der vorhergesagten Sterblichkeitsrate haben, sodass das Ignorieren der Gewichtung während der Modellanpassung den vorhergesagten Sterblichkeitswert nicht verändert. Es wurde jedoch beobachtet, dass die Gewichtung der Cluster-spezifischen vorhergesagten Sterblichkeitsraten erhebliche Auswirkungen auf die Minimierung der Verzerrung der insgesamt vorhergesagten Sterblichkeitsrate bei Kindern unter fünf Jahren hat. Die Studie hat außerdem herausgefunden, dass die Bias-Schätzungen für die vorherrschenden Sterblichkeitsraten unter fünf Jahren mit jedem Umfragejahr abnahmen, was dazu führte, dass die Bias-Schätzungen im MDHS 2015–16 deutlich geringer ausfielen als in früheren Umfragen. Darüber hinaus wurde beobachtet, dass eine zufällige und repräsentative Stichprobengröße von mindestens 2 % der Bevölkerung ausreicht, um geringgradige Sterblichkeitsschätzungen für Kinder unter fünf Jahren zu erhalten, sofern bei der Berechnung der Gesamtmortalitätsschätzung Clustergewichte berücksichtigt werden. Eine kleine Stichprobengröße wirkt sich nur auf die Standardfehler einer geschätzten Sterblichkeit aus, die groß werden und die Konfidenzintervalle für die Schätzungen erweitern.

Diese Studie empfiehlt daher die Anwendung von Cluster-Stichprobengewichten in Cluster-spezifischen vorhergesagten Ereigniswahrscheinlichkeiten zur Berechnung der gesamten vorhergesagten Wahrscheinlichkeit des Ereignisses bei der Analyse binärer Gesundheitsergebnisse mithilfe von Regressionsmethoden, ohne Rücksicht auf die Gewichtung des Modellanpassungsprozesses. Obwohl sich diese Studie auf Modelle für binäre Antwortvariablen konzentrierte, gelten die Ergebnisse auch für andere Modelle für kategoriale Variablen mit mehr als zwei Ebenen. Da die Zuverlässigkeit von Regressionsmethoden von der Eignung der Daten für die in den Modellen enthaltenen Kovariaten abhängt, werden weitere Verbesserungen der Datenqualitätskontrolltechniken des DHS dazu beitragen, durch die in dieser Studie vorgeschlagenen regressionsbasierten Methoden genauere Vorhersagen über die Sterblichkeitsrate von Kindern unter fünf Jahren zu erzielen . Zukünftige Forschung könnte Methoden zur Behebung fehlender Daten in erklärenden Variablen wie Geburtsgewicht und Schwangerschaftsvorsorgebesuchen einbeziehen, sodass die Modelle so viele Kovariaten wie möglich verwenden und gleichzeitig die Auswirkung des Stichprobendesigns auf die Vorhersage der Sterblichkeitsrate von Kindern unter fünf Jahren beobachten.

Die in dieser Studie verwendeten MDHS-Daten sind öffentlich und für Benutzer unter https://dhsprogram.com/data/new-user-registration.cfm frei verfügbar.

Ahmad OB, Lopez AD, Inoue M. Der Rückgang der Kindersterblichkeit: eine Neubewertung. Bull World Health Organ. 2000;78:1175–91.

CAS PubMed PubMed Central Google Scholar

Amir-ud Din R, Zafar S, Muzammil M, Shabbir R, Malik S, Usman M. Erforschung des Zusammenhangs zwischen Mütterberuf und Kindersterblichkeit unter fünf Jahren: Empirische Erkenntnisse aus 26 Entwicklungsländern. Eur J Dev Res. 2022;34(5):2373–99.

Artikel Google Scholar

Argawu AS, Mekebo GG. Risikofaktoren der Sterblichkeit von Kindern unter fünf Jahren in Äthiopien unter Verwendung von Zähldaten-Regressionsmodellen, 2021. Ann Med Surg. 2022;82:104764.

Belay DG, Asratie MH, Aragaw FM, Tsega NT, Endalew M, Gashaw M. Offene Defäkationspraxis und ihre Determinanten in Haushalten in Afrika südlich der Sahara: gepoolte Prävalenz und mehrstufige Analyse von demografischen und Gesundheitsumfragen in 33 Ländern Afrikas südlich der Sahara. Trop Med Gesundheit. 2022;50(1):28.

Artikel PubMed PubMed Central Google Scholar

Brenning A, Gruber S, Hoelzle M. Probenahme und statistische Analysen von BTS-Messungen. Permafr-Periglac-Prozess. 2005;16(4):383–93.

Artikel Google Scholar

Carroll RJ, Pederson S. Zur Robustheit im logistischen Regressionsmodell. JR Stat Soc Ser B Methodol. 1993;55(3):693–706.

Google Scholar

Chen C, Wakefield J, Lumely T. Die Verwendung von Stichprobengewichten in Bayes'schen hierarchischen Modellen zur Schätzung kleiner Flächen. Spatio-temporales Epidemiol. 2014;11:33–43.

Artikel Google Scholar

Vater AF. Eine systematische Überprüfung und Metaanalyse der Auswirkung kurzer Geburtenintervalle auf die Kindersterblichkeit in Äthiopien. Plus eins. 2015;10(5):e0126759.

Artikel PubMed PubMed Central Google Scholar

Fagbamigbe AF, Nnanatu CC. Modellierung der räumlichen Verteilung und der Faktoren, die mit der Sterblichkeit von Kindern unter fünf Jahren in Nigeria verbunden sind. Spat Demogr. 2022;10(2):255–82.

Artikel Google Scholar

Fagbamigbe AF, Uthman AO, Ibisomi L. Hierarchische Entflechtung kontextueller und kompositorischer Risikofaktoren für Durchfall bei Kindern unter fünf Jahren in Ländern mit niedrigem und mittlerem Einkommen. Sci Rep. 2021;11(1):8564.

Artikel CAS PubMed PubMed Central Google Scholar

Faiella I. Die Verwendung von Umfragegewichten in der Regressionsanalyse. Bank of Italy Temi di Discussione (Arbeitspapier) Nr. 739, 2010. https://scholar.google.com/scholar?hl=en&as_sdt=0%2C5&q=the+use+of+survey+weights+in+regression+ Analyse&btnG=.

Getachew Y, Bekele S. Überlebensanalyse der Sterblichkeit von Kindern unter fünf Jahren und der damit verbundenen Risikofaktoren in Äthiopien. J Biosens Bioelectron. 2016;7(213):2.

Google Scholar

Groenewald P, Bradshaw D, Neethling I, Martin LJ, Dempers J, Morden E, et al. Die Verknüpfung von Leichenbestattungsdaten verbessert wichtige Statistiken über die Todesursache von Kindern unter fünf Jahren in der Provinz Westkap in Südafrika. Trop Med Int Health. 2016;21(1):114–21.

Artikel PubMed Google Scholar

Guimarães RJ, Freitas CC, Dutra LV, Moura A, Amaral RS, Drummond SC, et al. Analyse und Schätzung der Schistosomiasis-Prävalenz für den Bundesstaat Minas Gerais, Brasilien, unter Verwendung multipler Regression mit sozialen und umweltbezogenen räumlichen Daten. Mem Inst Oswaldo Cruz. 2006;101:91–6.

Artikel PubMed Google Scholar

Jaki T, Kim M, Lamont A, George M, Chang C, Feaster D, et al. Die Auswirkungen der Stichprobengröße auf die Schätzung von Regressionsmischungsmodellen. Educ Psychol Meas. 2019;79(2):358–84.

Artikel PubMed Google Scholar

Joos O, Amouzou A, Silva R, Banda B, Park L, Bryce J, et al. Stärkung der gemeindebasierten Berichterstattung über wichtige Ereignisse zur Echtzeitüberwachung der Sterblichkeit von Kindern unter fünf Jahren: Lehren aus den Distrikten Balaka und Salima in Malawi. Plus eins. 2016;11(1):e0138406.

Artikel PubMed PubMed Central Google Scholar

Kayode GA, Adekanmbi VT, Uthman OA. Risikofaktoren und ein Vorhersagemodell für die Sterblichkeit von Kindern unter fünf Jahren in Nigeria: Erkenntnisse aus der Bevölkerungs- und Gesundheitsumfrage in Nigeria. BMC Schwangerschaft Geburt. 2012;12(1):1–11.

Artikel Google Scholar

Kazembe LN, Mpeketula PM. Quantifizierung räumlicher Unterschiede in der Neugeborenensterblichkeit mithilfe eines strukturierten additiven Regressionsmodells. Plus eins. 2010;5(6):e11180.

Artikel PubMed PubMed Central Google Scholar

Kneipp SM, Yarandi HN. Komplexe Stichprobenentwürfe und statistische Probleme in der Sekundäranalyse. West J Nurs Res. 2002;24(5):552–66.

Artikel PubMed Google Scholar

Koch GG, Gillings DB, Stokes ME. Biostatistische Auswirkungen von Design, Probenahme und Messung auf die gesundheitswissenschaftliche Datenanalyse. Annu Rev Public Health. 1980;1(1):163–225.

Artikel CAS PubMed Google Scholar

Lehtonen R, Pahkinen E. Praktische Methoden für die Gestaltung und Analyse komplexer Umfragen. Wiley; 2004.

Li Z, Hsiao Y, Godwin J, Martin BD, Wakefield J, Clark SJ, et al. Veränderungen in der räumlichen Verteilung der Sterblichkeitsrate bei Kindern unter fünf Jahren: Kleinflächige Analyse von 122 DHS-Erhebungen in 262 Subregionen von 35 Ländern in Afrika. Plus eins. 2019;14(1):e0210645.

Artikel CAS PubMed PubMed Central Google Scholar

Maïga A, Jiwani SS, Mutua MK, Porth TA, Taylor CM, Asiki G, et al. Generierung von Statistiken aus Daten von Gesundheitseinrichtungen: der Stand routinemäßiger Gesundheitsinformationssysteme im östlichen und südlichen Afrika. BMJ Global Health. 2019;4(5):e001849.

Artikel PubMed PubMed Central Google Scholar

Nationales Statistikamt Malawi (NSO). Volks- und Wohnungszählung 2008 in Malawi: Hauptbericht. Zomba; 2009.

Nationales Statistikamt Malawi (NSO). Bevölkerungs- und Wohnungszählung in Malawi: Hauptbericht. Zomba: Autor; 2018. S. 2019.

Google Scholar

Manda S. Geburtsintervalle, Stillen und Determinanten der Kindersterblichkeit in Malawi. Soc Sci Med. 1999;48(3):301–12.

Artikel CAS PubMed Google Scholar

Markatou M, Basu A, Lindsay B. Gewichtete Wahrscheinlichkeitsschätzungsgleichungen: Der diskrete Fall mit Anwendungen auf die logistische Regression. J Stat Plan Infer. 1997;57(2):215–32.

Artikel Google Scholar

Morris SS, Black RE, Tomaskovic L. Vorhersage der Verteilung von Todesfällen unter fünf Jahren nach Ursache in Ländern ohne angemessene Systeme zur Registrierung lebenswichtiger Erkrankungen. Int J Epidemiol. 2003;32(6):1041–51.

Artikel PubMed Google Scholar

Mwanga EP, Minja EG, Mrimi E, Jiménez MG, Swai JK, Abbasi S, et al. Nachweis von Malariaparasiten in getrockneten menschlichen Blutflecken mittels Mittelinfrarotspektroskopie und logistischer Regressionsanalyse. Malar J. 2019;18(1):1–13.

Artikel Google Scholar

Nationales Statistikamt (NSO) [Malawi] und ICF. Malawi-Demografie- und Gesundheitsumfrage 2015–16: Wichtigste Ergebnisse. Zomba, Malawi und Rockville, Maryland, USA NSO und ICF: Autor, 2017.

Nsowah-Nuamah N, Mensah G, Aryeetey ME, Wagatsuma Y, Bentil G. Harn-Bilharziose im Süden Ghanas: ein logistischer Regressionsansatz für Daten aus einem gemeindebasierten integrierten Kontrollprogramm. m J Trop Med Hyg. 2001;65(5):484–90.

Ntuli ST, Malangu N, Alberts M. Todesursachen bei Kindern unter fünf Jahren in einem Tertiärkrankenhaus in der südafrikanischen Provinz Limpopo. Glob J Health Sci. 2013;5(3):95.

Artikel PubMed PubMed Central Google Scholar

Nyambe S, Agestika L, Yamauchi T. Das Verbesserte und das Unverbesserte: Faktoren, die Hygiene und Durchfall in einer stadtnahen Siedlung in Lusaka, Sambia, beeinflussen. Plus eins. 2020;15(5):e0232763.

Artikel CAS PubMed PubMed Central Google Scholar

Nationales Statistikamt (NSO) [Malawi] und ORC Macro. 2004. Zomba, Malawi und Calverton. Maryland, USA NSO und ORC Macro: Autor, 2005.

Office National Statistical (NSO) und ICF Macro. Malawi Demographic and Health Survey, 2010. Zomba, Malawi und Calverton. Maryland, USA NSO und ICF Macro: Autor, 2011.

Pfeffermann D. Die Rolle von Stichprobengewichten bei der Modellierung von Umfragedaten. Int Stat Rev/Rev Int Stat. 1993;61:317–37.

Pongou R. Warum ist die Kindersterblichkeit bei Jungen höher als bei Mädchen? Eine neue Hypothese, die auf einem vorgefassten Umfeld und Beweisen aus einer großen Stichprobe von Zwillingen basiert. Demographie. 2013;50(2):421–44.

Artikel PubMed Google Scholar

Portet S. Eine Einführung in die Modellauswahl anhand des Akaike-Informationskriteriums. Dis-Modell infizieren. 2020;5:111–28.

PubMed PubMed Central Google Scholar

Spinnrocken MH. Hinweise zur Verzerrung der Schätzung. Biometrie. 1956;43(3/4):353–60.

Artikel Google Scholar

Rajaratnam JK, Tran LN, Lopez AD, Murray CJ. Messung der Sterblichkeit von Kindern unter fünf Jahren: Validierung neuer, kostengünstiger Methoden. PLoS Med. 2010;7(4):e1000253.

Artikel PubMed PubMed Central Google Scholar

Renschler JP, Walters KM, Newton PN, Laxminarayan R. Geschätzte Todesfälle unter fünf Jahren im Zusammenhang mit minderwertigen Malariamitteln in Afrika südlich der Sahara. Bin J Trop Med Hyg. 2015;92(Suppl 6):119.

Artikel PubMed PubMed Central Google Scholar

Rerimoi AJ, Jasseh M, Agbla SC, Reniers G, Roca A, Timæus IM. Sterblichkeit von Kindern unter fünf Jahren in Gambia: Vergleich der Ergebnisse der ersten Bevölkerungs- und Gesundheitserhebung mit denen bestehender Untersuchungen. Plus eins. 2019;14(7):e0219919.

Artikel CAS PubMed PubMed Central Google Scholar

Rutkowski L, Gonzalez E, Joncas M, Von Davier M. Internationale groß angelegte Bewertungsdaten: Probleme bei der Sekundäranalyse und Berichterstattung. Educ Res. 2010;39(2):142–51.

Artikel Google Scholar

Seemann SR, Weißes IR. Überprüfung der inversen Wahrscheinlichkeitsgewichtung für den Umgang mit fehlenden Daten. Statistische Methoden Med Res. 2013;22(3):278–95.

Artikel PubMed Google Scholar

Schermaschine EL. Kaiserschnitt: Medizinischer Nutzen und Kosten. Soc Sci Med. 1993;37(10):1223–31.

Artikel CAS PubMed Google Scholar

Silva R, et al. Schätzung der Kindersterblichkeit: Konsistenz von Schätzungen der Sterblichkeitsrate bei Kindern unter fünf Jahren unter Verwendung vollständiger Geburtsgeschichten und zusammenfassender Geburtsgeschichten. PLoS Med. 2012;9(8):1–14.

Artikel Google Scholar

Smith GC, Fleming KM, White IR. Geburtsreihenfolge von Zwillingen und Risiko eines perinatalen Todes im Zusammenhang mit der Entbindung in England, Nordirland und Wales, 1994–2003: retrospektive Kohortenstudie. BMJ. 2007;334(7593):576.

Artikel PubMed PubMed Central Google Scholar

Talukder A, Hossain M, et al. Prävalenz von Diabetes mellitus und den damit verbundenen Faktoren in Bangladesch: Anwendung eines zweistufigen logistischen Regressionsmodells. Sci Rep. 2020;10(1):1–7.

Artikel Google Scholar

Tuoyire DA, Amo-Adjei J. Vorgeburtlicher Zeitraum, Zeitpunkt und Anzahl vorgeburtlicher Kontakte in Afrika, 2010–2020. Internationale Gesundheit. 2022.

Vandijck Y, Faes C, Kirby R, Lawson A, Hens N. Modellbasierte Inferenz für die Schätzung kleiner Flächen mit Stichprobengewichten. Spat-Stat. 2016;18:455–73.

Artikel CAS PubMed PubMed Central Google Scholar

Vergouwe Y, Steyerberg EW, Eijkemans MJ, Habbema JDF. Für externe Validierungsstudien prädiktiver logistischer Regressionsmodelle waren erhebliche effektive Stichprobengrößen erforderlich. J Clin Epidemiol. 2005;58(5):475–83.

Artikel PubMed Google Scholar

Wakefield J, Fuglstad GA, Riebler A, Godwin J, Wilson K, Clark SJ. Schätzung der Sterblichkeit von Kindern unter fünf Jahren in Raum und Zeit im Kontext der Entwicklungsländer. Statistische Methoden Med Res. 2019;28(9):2614–34.

Artikel PubMed Google Scholar

Winship C, Radbill L. Stichprobengewichte und Regressionsanalyse. Sociol Methods Res. 1994;23(2):230–57.

Artikel Google Scholar

Yaya S, Bishwajit G, Okonofua F, Uthman OA. Unter fünf Sterblichkeitsmustern und damit verbundenen mütterlichen Risikofaktoren in Afrika südlich der Sahara: eine länderübergreifende Analyse. Plus eins. 2018;13(10):e0205977.

Artikel PubMed PubMed Central Google Scholar

Yaya S, Uthman OA, Okonofua F, Bishwajit G. Zerlegen Sie die Kluft zwischen Land und Stadt bei den Faktoren der Sterblichkeit von Kindern unter fünf Jahren in Afrika südlich der Sahara? Beweise aus 35 Ländern. BMC Öffentliche Gesundheit. 2019;19(1):1–10.

Artikel CAS Google Scholar

Zeng G. Zur Existenz von Maximum-Likelihood-Schätzungen für die gewichtete logistische Regression. Methoden der kommunalen Statistiktheorie. 2017;46(22):11194–203.

Artikel Google Scholar

Zieschang KD. Beispielhafte Gewichtungsmethoden und Schätzung der Gesamtsummen in der Verbraucherausgabenbefragung. J Am Stat Assoc. 1990;85(412):986–1001.

Artikel Google Scholar

Referenzen herunterladen

Wir sind dem National Statistical Office of Malawi und dem Measure DHS-Programm für die Daten, die wir in dieser Studie verwendet haben, aufrichtig dankbar. Wir danken auch Dr. Margaret Wazakili für die sprachliche Bearbeitung dieses Artikels.

Die Autoren erhielten für diese Studie keine anzugebenden Fördermittel.

Abteilung für Mathematische Wissenschaften, Fakultät für Natur- und Angewandte Wissenschaften, Universität Malawi, Zomba, Malawi

Beenden Sie M. Kaombe

Nationales Statistisches Amt von Malawi, Zomba, Malawi

Gnädiger A. Hamuza

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

TK konzipierte die ersten Forschungsideen für diese Studie und lieferte Vorschläge für statistische Methoden und Datenanalyse. Er verfasste auch das Manuskript. GH half beim Datenmanagement und der deskriptiven Datenanalyse. Beide Autoren haben das endgültige Manuskript gelesen und genehmigt.

Korrespondenz mit Tsirizani M. Kaombe.

Für die Studie wurden Sekundärdaten verwendet, die vom National Statistical Office (NSO) von Malawi in Zusammenarbeit mit dem Measure DHS-Programm gesammelt wurden. Die Dateneigentümer haben berichtet, dass sie bei der Erhebung der Daten die erforderlichen ethischen Verfahren befolgt haben. Diese Einzelheiten sind in den jeweiligen Berichten der Malawi Demographic and Health Survey (MDHS) für 2004, 2010 und 2015–16 enthalten [30, 34, 35]. Die Daten wurden nach einer Online-Genehmigung durch das Measure DHS-Programm verwendet, auf die über https://dhsprogram.com/data/new-user-registration.cfm zugegriffen werden kann. Alle Methoden wurden in Übereinstimmung mit den relevanten Richtlinien und Vorschriften durchgeführt.

Unzutreffend.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative-Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/. Der Creative Commons Public Domain Dedication-Verzicht (http://creativecommons.org/publicdomain/zero/1.0/) gilt für die in diesem Artikel zur Verfügung gestellten Daten, sofern in einer Quellenangabe für die Daten nichts anderes angegeben ist.

Nachdrucke und Genehmigungen

Kaombe, TM, Hamuza, GA Auswirkungen des Ignorierens des Stichprobendesigns bei der Vorhersage binärer Gesundheitsergebnisse durch logistische Regression: Belege aus Bevölkerungs- und Gesundheitsumfragedaten zur Sterblichkeit von Kindern unter fünf Jahren in Malawi; 2000-2016. BMC Public Health 23, 1674 (2023). https://doi.org/10.1186/s12889-023-16544-4

Zitat herunterladen

Eingegangen: 07. Februar 2023

Angenommen: 16. August 2023

Veröffentlicht: 31. August 2023

DOI: https://doi.org/10.1186/s12889-023-16544-4

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt