Steekproef versus bevolking
Populatie en steekproef zijn twee belangrijke termen in het vak 'Statistieken'. In eenvoudige bewoordingen is populatie de grootste verzameling items die we willen bestuderen, en de steekproef is een subset van een populatie. Met andere woorden, de steekproef zou de populatie moeten vertegenwoordigen met minder maar voldoende items. Een populatie kan meerdere steekproeven hebben met verschillende groottes.
Monster
Een steekproef kan bestaan uit twee of meer items die uit de populatie zijn geselecteerd. De laagst mogelijke grootte voor een steekproef is twee en de hoogste is gelijk aan de grootte van de populatie. Er zijn verschillende manieren om een steekproef uit een populatie te selecteren. Theoretisch is het selecteren van een 'willekeurige steekproef' de beste manier om nauwkeurige conclusies te trekken over de populatie. Dit type steekproeven worden ook wel kanssteekproeven genoemd, omdat elk item in de populatie evenveel kans heeft om in een steekproef te worden opgenomen.
De 'Simple random sampling'-techniek is de bekendste techniek van random sampling. In dit geval worden de voor de steekproef te selecteren items willekeurig uit de populatie gekozen. Zo'n steekproef wordt een 'Simple Random Sample' of SRS genoemd. Een andere populaire techniek is 'systematische bemonstering'. In dit geval worden de items voor een steekproef geselecteerd op basis van een bepaalde systematische volgorde.
Voorbeeld: elke 10e persoon van de wachtrij wordt geselecteerd voor een steekproef.
In dit geval is de systematische volgorde elke 10e persoon. Het staat de statisticus vrij om deze volgorde op een zinvolle manier te definiëren. Er zijn andere willekeurige steekproeftechnieken, zoals clustersteekproeven of gestratificeerde steekproeven, en de selectiemethode wijkt enigszins af van de bovenstaande twee.
Voor praktische doeleinden kunnen niet-willekeurige steekproeven zoals gemaksmonsters, beoordelingsmonsters, sneeuwbalmonsters en doelgerichte monsters worden gebruikt. Bovendien hebben items die zijn geselecteerd voor een niet-willekeurige steekproef betrekking op een kans. In feite heeft niet elk item van de populatie een gelijke kans om in een niet-willekeurige steekproef te worden opgenomen. Dit soort steekproeven worden ook niet-kanssteekproeven genoemd.
Bevolking
Elke verzameling entiteiten die interessant zijn om te onderzoeken, wordt simpelweg gedefinieerd als 'populatie'. Bevolking is de basis voor steekproeven. Elke set objecten in de universe kan een populatie zijn, op basis van de studieverklaring. Over het algemeen moet een populatie relatief groot zijn en het is moeilijk om bepaalde kenmerken af te leiden door de items afzonderlijk te beschouwen. De te onderzoeken metingen in de populatie worden parameters genoemd. In de praktijk worden de parameters geschat met behulp van statistieken die de relevante metingen van het monster zijn.
Voorbeeld: bij het schatten van het gemiddelde wiskundecijfer van 30 studenten in een klas op basis van het gemiddelde wiskundecijfer van 5 studenten, is de parameter het gemiddelde wiskundecijfer van de klas. De statistiek is het gemiddelde wiskundecijfer van 5 studenten.
Steekproef versus bevolking
De interessante relatie tussen de steekproef en de populatie is dat de populatie kan bestaan zonder steekproef, maar de steekproef kan mogelijk niet bestaan zonder populatie. Dit argument bewijst verder dat een steekproef afhankelijk is van een populatie, maar interessant genoeg zijn de meeste populatie-gevolgtrekkingen afhankelijk van de steekproef. Het belangrijkste doel van een steekproef is om sommige metingen van een populatie zo nauwkeurig mogelijk te schatten of af te leiden. Een hogere nauwkeurigheid kan worden afgeleid uit het algehele resultaat dat is verkregen uit verschillende steekproeven van dezelfde populatie in plaats van uit één steekproef. Een ander belangrijk ding om te weten is dat bij het selecteren van meer dan één steekproef uit een populatie een item ook in een andere steekproef kan worden opgenomen. Dit geval staat bekend als 'monsters met vervangingen'. Verder meer,het investeren van de relevante metingen van de populatie uit een steekproef en het verkrijgen van een bijna vergelijkbare output is een gouden kans om de kosten en tijdwaarde te besparen.
Het is cruciaal om te weten dat wanneer de steekproefomvang toeneemt, de nauwkeurigheid van de schatting voor de populatieparameter ook toeneemt. Logischerwijs mag de steekproefomvang niet te klein zijn om betere schattingen voor de populatie te hebben. Verder moeten willekeurige steekproeven ook worden beschouwd als betere schattingen. Daarom is het cruciaal om aandacht te besteden aan de grootte en willekeur van de steekproef om representatief te zijn om de beste schattingen voor de populatie te krijgen.