Staafdiagram versus histogram
Bij statistieken is het samenvatten en presenteren van de gegevens belangrijk. Het kan numeriek worden gedaan met behulp van beschrijvende maatregelen of grafisch met behulp van de taartgrafieken, staafdiagrammen en vele andere grafische weergavemethoden.
Wat is een staafdiagram?
Staafdiagram is een van de belangrijkste grafische weergavemethoden in statistieken. Het wordt gebruikt om verschillende waarden van de kwalitatieve gegevens op een horizontale as weer te geven en de relatieve frequenties (of frequenties of percentages) van die waarden op een verticale as. Een staaf waarvan de hoogte / lengte evenredig is aan de relatieve frequentie vertegenwoordigt elke afzonderlijke waarde, en de staven zijn zo geplaatst dat ze elkaar niet raken. Een staafdiagram met de bovenstaande configuratie is de meest voorkomende en staat bekend als een verticaal staafdiagram of een kolomdiagram. Maar het is ook mogelijk om de assen te verwisselen; in dat geval zijn de spijlen horizontaal.
Het staafdiagram werd voor het eerst gebruikt in het boek "The Commercial and Political Atlas" uit 1786 van William Playfair. Sindsdien is staafdiagram een van de belangrijkste hulpmiddelen geworden bij het weergeven van categorische gegevens. Het gebruik van staafdiagrammen kan worden uitgebreid om meer complexe categorische gegevens weer te geven, zoals variabelen in de tijdontwikkeling (verkiezingsreactie), gegroepeerde gegevens en meer.
Wat is een histogram?
Het histogram is een andere belangrijke grafische weergave van gegevens en kan worden beschouwd als een ontwikkeling op basis van het staafdiagram. In een histogram worden de klassen van de kwantitatieve gegevens weergegeven op de horizontale as en wordt de frequentie (of relatieve frequentie of percentages) van de klassen weergegeven op de y-as. Een verticale balk vertegenwoordigt meestal de frequentie (of relatieve frequentie of percentages) van de klasse waarvan de hoogte gelijk is aan de grootte. In tegenstelling tot de gewone staafdiagrammen, zijn de balken zo geplaatst dat ze elkaar raken.
De variabele in de X-as-as kan een enkele waarde gegroepeerd of een limietgroep zijn. Voor groepering met één waarde worden verschillende waarden van de waarnemingen gebruikt om de staven te labelen, waarbij elke waarde onder de balk gecentreerd is. Voor limietgroepering of snijpuntgroepering worden lagere klasse limieten (of, equivalent, lagere klasse snijpunten) gebruikt om de staven te labelen. Klassemarkeringen of klassenmiddenpunten gecentreerd onder de balken kunnen ook worden gebruikt.
Een van de belangrijkste verschillen zit in de variabele die wordt gebruikt in de X-as-as. In het histogram is de variabele een kwantitatieve variabele en kan deze continu of discreet zijn. En het kan worden gebruikt om dichtheidsinformatie over de datasets weer te geven. In dit geval kunnen de intervallen die op de x-as worden gebruikt, van de ene tot de andere variëren, en op de y-as is de frequentiedichtheid gemarkeerd. Als het interval van de X-as 1 is, is het histogram gelijk aan de relatieve frequentieplot.
Wat is het verschil tussen staafdiagram en histogram?
• Een histogram is in de eerste plaats een ontwikkeling uit het staafdiagram, maar het is niet identiek aan een staafdiagram. Histogrammen zijn een soort staafdiagrammen, maar staafdiagrammen zijn beslist geen histogrammen.
• Staafdiagrammen worden gebruikt om categorische of kwalitatieve gegevens uit te zetten, terwijl histogrammen worden gebruikt om kwantitatieve gegevens uit te zetten met de bereiken van de gegevens gegroepeerd in bakken of intervallen.
• Staafdiagrammen worden gebruikt om variabelen te vergelijken, terwijl histogrammen worden gebruikt om verdelingen van variabelen te tonen
• Staafdiagrammen hebben spaties tussen twee staven, terwijl histogrammen geen spaties tussen de staven hebben. (De reden hiervoor is dat de x-as in staafdiagrammen discrete categorische waarden zijn, terwijl deze in histogrammen ofwel discreet ofwel continu kwantitatief is).
• Histogrammen worden gebruikt om de dichtheid van een variabele in intervallen te illustreren; in dit geval vertegenwoordigt het gebied van de balk de frequentie van de variabele.