{"id":857054,"date":"2023-03-27T11:00:00","date_gmt":"2023-03-27T18:00:00","guid":{"rendered":"https:\/\/www.questionpro.com\/blog\/inferentiele-statistiek\/"},"modified":"2024-02-27T08:40:45","modified_gmt":"2024-02-27T08:40:45","slug":"inferentiele-statistiek","status":"publish","type":"post","link":"https:\/\/www.questionpro.com\/blog\/nl\/inferentiele-statistiek\/","title":{"rendered":"Inferenti\u00eble statistiek: Definitie, soorten + voorbeelden"},"content":{"rendered":"\n
Als je een student bent in een statistiekklas of een professionele onderzoeker, moet je weten hoe je inferenti\u00eble statistieken gebruikt om gegevens te analyseren en slimme beslissingen te nemen. In dit tijdperk van “big data”, waarin we toegang hebben tot heel veel informatie, is het vermogen om correcte populatieconclusies te trekken uit steekproeven cruciaal.<\/p>\n\n
Inferenti\u00eble statistieken stellen je in staat om conclusies te trekken en voorspellingen te doen op basis van je gegevens, terwijl beschrijvende statistieken de eigenschappen van een gegevensverzameling samenvatten. Het is een gebied van de wiskunde waarmee we trends en patronen kunnen identificeren in een groot aantal numerieke gegevens.<\/p>\n\n
In deze post bespreken we inferenti\u00eble statistieken, inclusief wat ze zijn, hoe ze werken en enkele voorbeelden.<\/p>\n\n
Inferenti\u00eble statistiek gebruikt statistische technieken om informatie uit een kleinere steekproef te extrapoleren om voorspellingen te doen en conclusies te trekken over een grotere populatie.<\/p>\n\n
Het gebruikt kansrekening en statistische modellen om populatieparameters te schatten en populatiehypothesen te testen op basis van steekproefgegevens. Het belangrijkste doel van inferenti\u00eble statistiek is om informatie te verschaffen over de hele populatie met behulp van steekproefgegevens om de getrokken conclusies zo nauwkeurig en betrouwbaar mogelijk te maken.<\/p>\n\n
Er zijn twee primaire toepassingen voor inferenti\u00eble statistieken:<\/p>\n\n
Onderzoekers kunnen een populatie generaliseren door inferenti\u00eble statistieken en een representatieve steekproef te gebruiken. Het vereist logisch redeneren om tot conclusies te komen. Hieronder volgt een procedure van de methode om tot de resultaten te komen:<\/p>\n\n
Inferenti\u00eble statistieken zijn onderverdeeld in twee categorie\u00ebn:<\/p>\n\n
Onderzoekers gebruiken deze methoden vaak om resultaten te generaliseren naar grotere populaties op basis van kleine steekproeven. Laten we eens kijken naar enkele methoden die beschikbaar zijn in deferenti\u00eble statistiek.<\/p>\n\n
Het testen van hypotheses en het trekken van generalisaties over de populatie uit de steekproefgegevens zijn voorbeelden van inferenti\u00eble statistiek. Er moeten een nulhypothese en een alternatieve hypothese worden opgesteld en vervolgens moet er een statistische significantietest worden uitgevoerd.<\/p>\n\n
Een hypothesetest kan links-, rechts- of tweestaartige verdelingen hebben. De waarde van de teststatistiek, de kritische waarde en de betrouwbaarheidsintervallen worden gebruikt om conclusies te trekken. Hieronder staan enkele belangrijke hypothesetests die worden gebruikt in de afgeleide statistiek.<\/p>\n\n
Als de gegevens een normale verdeling hebben en de steekproefomvang minstens 30 is, wordt de z-test<\/strong> toegepast op de gegevens. Als de populatievariantie bekend is, wordt bepaald of de gemiddelden van de steekproef en de populatie gelijk zijn. De volgende opstelling kan worden gebruikt om de rechtsstaarthypothese te testen:<\/p>\n\n nulhypothese: <\/strong>H0<\/sub>: \u03bc=\u03bc0<\/sub><\/p>\n\n Alternatieve hypothese:<\/strong> H1<\/sub>: \u03bc>\u03bc0<\/sub><\/p>\n\n Teststatistiek: <\/strong>Z Test = (x\u0304 – \u03bc) \/ (\u03c3 \/ \u221an)<\/p>\n\n waar,<\/p>\n\n x\u0304 = steekproefgemiddelde<\/p>\n\n \u03bc = populatiegemiddelde<\/p>\n\n \u03c3 = standaardafwijking van de populatie<\/p>\n\n n = steekproefgrootte<\/p>\n\n Beslissingscriteria:<\/strong> Als de z statistiek > z kritische waarde, verwerp dan de nulhypothese.<\/p>\n\n Als de steekproefomvang kleiner is dan 30 en de gegevens een t-verdeling van studenten hebben, wordt een t-toets<\/strong> gebruikt. Het gemiddelde van de steekproef en de populatie worden vergeleken als de variantie van de populatie onbekend is. De hypothesetest voor de inferenti\u00eble statistiek is als volgt:<\/p>\n\n nulhypothese:<\/strong> H0<\/sub>: \u03bc=\u03bc0<\/sub><\/p>\n\n Alternatieve hypothese:<\/strong> H1<\/sub>: \u03bc>\u03bc0<\/sub><\/p>\n\n Testgrootheid: <\/strong>t = x\u0304-\u03bc \/ s\u221an<\/p>\n\n De voorstellingen x\u0304, \u03bc, en n zijn dezelfde als voor de z-test. De letter “s” staat voor de standaardafwijking van de steekproef.<\/p>\n\n Beslissingscriteria:<\/strong> Als de t statistiek > t kritische waarde, verwerp dan de nulhypothese.<\/p>\n\n Bij het vergelijken van de varianties van twee steekproeven of populaties wordt een f-test<\/strong> gebruikt om te zien of er een verschil is. De rechtsstaart f-test kan als volgt worden geconfigureerd:<\/p>\n\n nulhypothese:<\/strong> H0<\/sub>:\u03c321<\/sup>=\u03c322<\/sub><\/p>\n\n Alternatieve hypothese:<\/strong> H1<\/sub>:\u03c321<\/sub>> \u03c322<\/sub><\/p>\n\n Teststatistiek: <\/strong>f = \u03c321<\/sup>\/ <\/sub> <\/sub>\u03c322<\/sub>, waarbij \u03c321<\/sub> de variantie van de eerste populatie is en \u03c322<\/sub> de variantie van de tweede populatie.<\/p>\n\n Beslissingscriteria: <\/strong>Beslissingscriteria: Verwerp de nulhypothese als f teststatistiek > kritische waarde.<\/p>\n\n Een betrouwbaarheidsinterval helpt bij het schatten van de parameters van een populatie. Een 95% betrouwbaarheidsinterval betekent bijvoorbeeld dat 95 van de 100 tests met verse monsters uitgevoerd onder identieke omstandigheden zullen resulteren in een schatting binnen het gespecificeerde bereik. Een betrouwbaarheidsinterval kan ook worden gebruikt om de cruciale waarde in hypothesetests te bepalen.<\/p>\n\n Naast deze toetsen worden in de afgeleide statistiek ook de ANOVA, Wilcoxon signed-rank, Mann-Whitney U, Kruskal-Wallis en H toetsen gebruikt.<\/p>\n LEER OVER: <\/strong>ANOVA testen<\/a><\/p>\n<\/blockquote>\n\n Regressieanalyse wordt gedaan om te berekenen hoe een variabele zal veranderen in relatie tot een andere. Er kunnen talloze regressiemodellen worden gebruikt, waaronder eenvoudige lineaire, meervoudige lineaire, nominale, logistische en ordinale regressie.<\/p>\n\n In de afleidingsstatistiek is lineaire regressie de meest gebruikte vorm van regressie. De respons van de afhankelijke variabele op een eenheidsverandering van de onafhankelijke variabele wordt onderzocht door middel van lineaire regressie. Dit zijn enkele cruciale vergelijkingen voor regressieanalyse met behulp van inferenti\u00eble statistiek:<\/p>\n\n Regressieco\u00ebffici\u00ebnten:<\/strong><\/p>\n\n De vergelijking voor de rechte lijn wordt gegeven als y = \u03b1 + \u03b2x, waarbij \u03b1 en \u03b2 regressieco\u00ebffici\u00ebnten zijn.<\/p>\n\n \u03b2=\u2211n1<\/sub>(xi<\/sub> – x\u0304)(yi<\/sub> -y) \/ \u2211n1<\/sub>(xi-x<\/sub>)2<\/sup><\/p>\n\n \u03b2=rxy <\/sub>\u03c3y<\/sub> \/ <\/sub>\u03c3x<\/sub><\/p>\n\n \u03b1=y-\u03b2x <\/p>\n\n Hier is x het gemiddelde en \u03c3x<\/sub> de standaardafwijking van de eerste gegevensreeks. Op dezelfde manier is y het gemiddelde en \u03c3y de standaardafwijking van de tweede gegevensverzameling.<\/p>\n\n Neem voor dit voorbeeld aan dat je je onderzoek hebt gebaseerd op de testresultaten voor een bepaalde klas, zoals beschreven in het gedeelte over beschrijvende statistieken. Je wilt nu een onderzoek doen naar inferenti\u00eble statistiek voor diezelfde test.<\/p>\n\n Stel dat het een examen is dat voor de hele staat is gestandaardiseerd. Je kunt laten zien hoe dit de manier verandert waarop we het onderzoek uitvoeren en de resultaten die je rapporteert door dezelfde test te gebruiken, maar deze keer met de bedoeling om conclusies te trekken over een gemeenschap.<\/p>\n\n Kies de klasse die je wilt beschrijven in beschrijvende statistieken en voer dan alle testresultaten voor die klasse in. Goed en gemakkelijk. Voor inferenti\u00eble statistieken moet je eerst de populatie defini\u00ebren voordat je er een willekeurige steekproef uit trekt.<\/p>\n\n Om een representatieve steekproef te garanderen, moet je een willekeurige steekproefstrategie ontwikkelen. Deze procedure kan tijd in beslag nemen. Laten we vijfdeklassers die naar openbare scholen gaan in de Amerikaanse staat Californi\u00eb als bevolkingsdefinitie nemen.<\/p>\n\n Stel dat je voor dit voorbeeld de hele populatie een lijst met namen hebt gegeven, vervolgens willekeurig 100 studenten uit die lijst hebt geselecteerd en hun testresultaten hebt verkregen. Houd er rekening mee dat deze leerlingen niet uit \u00e9\u00e9n klas komen, maar uit verschillende klassen van verschillende scholen in de staat.<\/p>\n\n Het gemiddelde, de standaardafwijking en de proportie voor je willekeurige steekproef kunnen allemaal worden berekend met inferenti\u00eble statistiek als een puntschatting. Er is geen manier om dat te weten, maar het is onwaarschijnlijk dat deze puntschattingen exact zijn. Deze cijfers hebben een foutmarge omdat het onmogelijk is om elk individu in deze populatie te meten.<\/p>\n\n Neem de betrouwbaarheidsintervallen op voor het gemiddelde, de standaardafwijking en het percentage voldoendes (>=70). Inferenti\u00eble statistieken is het CSV-gegevensbestand.<\/p>\n\n\n
T Test<\/h4><\/li>\n<\/ul>\n\n
\n
F Test<\/h4><\/li>\n<\/ul>\n\n
<\/ul>\n\n
\n
02. Regressieanalyse<\/h3>\n\nVoorbeeld van inferenti\u00eble statistiek<\/h2>\n\n
Inferenti\u00eble statistiek resulteert in<\/h2>\n\n