Pauline Berens: Statistiek Barger-Compascuum 31-12-1872 N=509
The making of
Dit statistiekproject gaat over de ontstaansgeschiedenis van een veenkolonie in Zuid-Oost Drenthe, met hier daar vergelijkingen met het heden en elders op de wereld. m'n Roots liggen in Barger-Compascuum, vandaar de belangstelling voor de geschiedenis van dit dorp. Onder de 509 inwoners op 31-12-1872 bevinden zich 1 grootouder, 4 overgrootouders en 2 overovergrootouders van mij. Van de 509 mensen die op de teldatum in BC woonden zijn er slechts 142 in BC overleden. Het is dus aannemelijk dat er veel meer mensen buiten BC zijn met voorouders op de teldatum in BC dan in BC zelf. Internet is handig om beide groepen te bereiken.
Voor de dataverzameling is hoofdstuk "Eerste bewoners gesorteerd op lijstnummer" uit J.B. Berens: Barger-Compascuum gebruikt. De gegevens van iedereen die op 31-12-1872 in Barger-Compas woonde zijn overgenomen in Excel. Iedereen die vóór de teldatum overleden was is dus niet meegenomen. En ook niet degenen die ná de teldatum geboren zijn. Statistisch pakket SPSS gebruik ik om eventuele samenhang tussen variabelen te onderzoeken.
Met dank aan sparringpartner Jaap Verhage, laatste wijziging 25-03-2012, wordt vervolgd afhankelijk van reacties.
Onderzoeksvraag bevolkingssamenstelling en migratie
Onderzoeksvraag is of en hoe geboorteplaats, overlijdensplaats, leeftijd op de teldatum, leeftijd op overlijdensdatum, geslacht, grootte van en rol in de huishouding samenhangen. Statistiek als uitdaging, het onderzoek is exploratief van aard. Verder dan wat kruistabellen en de Chikwadraattoets ga ik niet. Bevolkingssamenstelling en migratie zijn de centrale begrippen. De afstand tussen geboorteplaats en overlijdensplaats gebruiken we als indicator van migratie.
Conclusies
In dit statistiekproject is aangetoond dat Barger-Compascuum (BC) op teldatum 31-12-1872 een jonge, groeiende bevolkingsopbouw kende. Er is een significant verband tussen leeftijdscategorie en geslacht. Opvallend is het meisjesoverschot tot 5 jaar, iets dat ook al bleek in het onderzoek naar het oude kerkhof in 2010. Wereldwijd overlijden jongens vaker dan meisjes in het eerste levensjaar. Jongens worden vaker te vroeg geboren en dat leidt vaak tot ademhalingsproblemen. Doordat jongens gemddeld iets groter zijn dan meisjes zijn er vaker problemen met de bevalling. Lees meer...
De migratietabel laat zien dat er enorm veel verloop was in de beginjaren van het dorp. Er is een significante samenhang tussen geboorteregio en regio van overlijden (0,05>0,00/2). De meeste mensen kwamen uit Duitsland, vlak over de grens ter hoogte van BC en ze overleden grotendeels in de gemeente Emmen inclusief BC.
De meest voorkomende rol in de huishouding waren Kind en Ouder. Het aantal kilometers verschil tussen geboorte- en sterfteplaats is voor kinderen significant groter (0,05>0,000/2) dan die van hun ouders. De kinderen waren dus iets mobieler dan de ouders, in die zin dat geboorte- en overlijdensplaats iets verder van elkaar vandaan lagen gemiddeld.
Het afstandsverschil tussen geboorte- en overlijdensplaats verschilde niet significant tussen mannen en vrouwen.
Staafdiagrammen over Grootte van de huishouding en Rol in de huishouding leken een verschil te tonen tussen mannen en vrouwen, maar volgens SPSS is er toch geen significant verband. Dit was voor mij het meest verrassende uit het hele onderzoek en behoeft wellicht nader onderzoek.
Leeftijdsopbouw versus geslacht: Bevolkingspiramide 31-12-1872
Bovenstaande bevolkingspiramide toont de bevolkingssamenstelling van Barger-Compascuum op teldatum 31-12-1872. Van de 509 inwoners van BC op de teldatum waren 264 man/jongen en 229 vrouw/meisje. Van de overige 16 is geslacht onbekend. Er is een significant verband (0,05>0,003/2) tussen geslacht en leeftijdscategorie. Voor liefhebbers van de Chikwadraattoets is hieronder de uitwerking.
Leeftijdsopbouw versus geslacht en de Chikwadraattoets
Onderstaande tabel toont de verdeling naar geslacht per leeftijdscategorie. Per leeftijdscategorie is een overschot tot 10 met lichtgrijs en 10-20 met donkergrijs aangegeven. De Chikwadraattoets is een rekenmethode om samenhang aan te tonen tussen variabelen en geschikt in combinatie met een kruistabel. De Chikwadraattoets vergelijkt de verwachte waarde met de aangetroffen waarde. Verwachte waarde is dan naar verhouding evenveel mannen als vrouwen in elke leeftijdscategorie. Hieronder is de SPSS-tabel uitgebreid met enkele kolommen om de rekenmethode te verhelderen.
leeftijdscategorie | Geslacht man | Geslacht vrouw | Totaal | aangetroffen - verwacht | kwadraat | kwadraat / verwacht man | kwadraat / verwacht vrouw | |
---|---|---|---|---|---|---|---|---|
0-4 jaar | aangetroffen | 34 | 42 | 76 | ||||
verwacht | 40,6 | 35,4 | 76 | -6,6 | 43,56 | 1,072906404 | 1,230508475 | |
5-9 jaar | aangetroffen | 43 | 33 | 76 | ||||
verwacht | 40,6 | 35,4 | 76 | 2,4 | 5,76 | 0,141871921 | 0,162711864 | |
10-14 jaar | aangetroffen | 39 | 19 | 58 | ||||
verwacht | 31 | 27 | 58 | 8 | 64 | 2,064516129 | 2,37037037 | |
15-19 jaar | aangetroffen | 19 | 23 | 42 | ||||
verwacht | 22,5 | 19,5 | 42 | -3,5 | 12,25 | 0,544444444 | 0,628205128 | |
20-24 jaar | aangetroffen | 16 | 12 | 28 | ||||
verwacht | 15 | 13 | 28 | 1 | 1 | 0,066666667 | 0,076923077 | |
25-29 jaar | aangetroffen | 14 | 23 | 37 | ||||
verwacht | 19,8 | 17,2 | 37 | -5,8 | 33,64 | 1,698989899 | 1,955813953 | |
30-34 jaar | aangetroffen | 15 | 20 | 35 | ||||
verwacht | 18,7 | 16,3 | 35 | -3,7 | 13,69 | 0,732085561 | 0,839877301 | |
35-39 jaar | aangetroffen | 26 | 11 | 37 | ||||
verwacht | 19,8 | 17,2 | 37 | 6,2 | 38,44 | 1,941414141 | 2,234883721 | |
40-44 jaar | aangetroffen | 15 | 24 | 39 | ||||
verwacht | 20,9 | 18,1 | 39 | -5,9 | 34,81 | 1,665550239 | 1,92320442 | |
45-49 jaar | aangetroffen | 13 | 5 | 18 | ||||
verwacht | 9,6 | 8,4 | 18 | 3,4 | 11,56 | 1,204166667 | 1,376190476 | |
50-54 jaar | aangetroffen | 16 | 4 | 20 | ||||
verwacht | 10,7 | 9,3 | 20 | 5,3 | 28,09 | 2,625233645 | 3,020430108 | |
55-59 jaar | aangetroffen | 2 | 4 | 6 | ||||
verwacht | 3,2 | 2,8 | 6 | -1,2 | 1,44 | 0,45 | 0,514285714 | |
60-64 jaar | aangetroffen | 2 | 3 | 5 | ||||
verwacht | 2,7 | 2,3 | 5 | -0,7 | 0,49 | 0,181481481 | 0,213043478 | |
65-69 jaar | aangetroffen | 3 | 4 | 7 | ||||
verwacht | 3,7 | 3,3 | 7 | -0,7 | 0,49 | 0,132432432 | 0,148484848 | |
70-74 jaar | aangetroffen | 5 | 1 | 6 | ||||
verwacht | 3,2 | 2,8 | 6 | 1,8 | 3,24 | 1,0125 | 1,157142857 | |
Totaal | 262 | 228 | 490 | 15,53425963 | 17,85207579 |
Value | df | Asymp. Sig. (2-sided) | |
---|---|---|---|
Pearson Chi-Square | 33,301a | 14 | ,003 |
Likelihood Ratio | 34,409 | 14 | ,002 |
N of Valid Cases | 490 | ||
a 8 cells (26,7%) have expected count less than 5. The minimum expected count is 2,33. |
Bovenstaande Chikwadraat 33,3 is de som van bovenstaande kolomtotalen 15,5 en 17,9. Het aantal vrijheidsgraden is 14, oftewel 15 leeftijdscategorieën -1. Of de berekende Chikwadraat significant is kun je opzoeken in deze tabel. Is de berekende Chikwadraat groter dan de kritische Chikwadraatwaarde bij een bepaald aantal vrijheidsgraden en betrouwbaarheidsniveau in de tabel dan bestaat er een significant verband tussen de variabelen. In dit geval is de kritische chikwadraatwaarde 29,14 bij 14 vrijheidsgraden, dus met 99% betrouwbaarheid kunnen we zeggen dat er een significant verband is tussen leeftijdscategorie en geslacht.
Bevolkingspiramide nu
De teller stond op 31-12-1872 op 509, 137 jaar later (in 2009) was dat 2003, een stijging van 35 t.o.v. 2002, bron: emmen.nl. Ter vergelijking hieronder de bevolkingspiramide van 2012 van Zuid-Oost Drenthe: de gemeentes Emmen, Coevorden en Borger/Odoorn.
Bron: www.cbs.nl
De piramide uit 2012 toont een vergrijzende bevolking. Een piramidevormige bevolkingspiramide hoort bij een jonge bevolking zoals nu alleen nog in veel derde wereldlanden te vinden is. De industrialisatie vanaf 1750 veranderde een hoog sterfte- en geboortecijfer in West-Europa naar een laag sterfte- en geboortecijfer.
Levensduur versus Geslacht
Hoe oud werden de inwoners van BC? En werden vrouwen gemiddeld ouder dan mannen, net als tegenwoordig? Van 509-401=108 mensen was levensduur niet bekend, omdat geboortedatum en/of overlijdensdatum ontbraken. De overblijvende 401 mensen werden gemiddeld 65,7 jaar, met een minimum van 3 jaar, een maximum van 107 en een standaardafwijking van 19,6 jaar. Voor de 210 mannen waren deze getallen respectievelijk 210, 66,5, 3, 97 en 19, voor de 191 vrouwen 4, 107, 64,8 en 20. Mannen werden dus gemiddeld iets ouder dan vrouwen. De verschillen die worden getoond tussen de histogram van mannen en van vrouwen zijn niet significant (0,05<0,452/2).
Het bovenstaande resultaat verschilt nogal van het beeld dat naar voren komt in het onderzoek naar het oude kerkhof, waarin de enorme kindersterfte opviel en een gemiddelde levensduur van 24,4 jaar op deel I (N=367 1876-1896) en 29,9 jaar op deel II (N=613 1896-1942). Hoe zit dat? Het oude kerkhof project bevat gegevens van overledenen vanaf 1876. Het overlijdensregister van de R.K. kerk start in 1873, tot de opening van het oude kerkhof in july 1876 werden mensen in omringende dorpen begraven. In versie 4 van m'n vaders werkstuk zijn ontbrekende gegevens wel zoveel mogelijk opgezocht op internet, en is steekproefsgewijs gecontroleerd of mensen misschen nog meer kinderen hadden dan die in het werkstuk genoemd worden. In een steekproef van 10 huishoudingen van de totaal 116 zijn geen kinderen gevonden in Genlias die op de teldatum in BC woonden en niet al opgenomen waren in het boek. Het verschil zit niet in levensloos geborenen, die zijn buiten beide tellingen gehouden. Hoeveel van de 44 overledenen in BC 1873-1876 woonden op teldatum 31-12-1872 in BC? Die knagende vraag lijkt me relevant, want mochten er veel kleine kinderen kort na de teldatum overleden zijn, dan zou dat moeten opvallen in de overledenenlijst 1873-1876. Slechts 8 van de 44 staan in het RK-kerkboek genoteerd als overleden parochiaan. Waren de anderen niet-katholiek? Of levenloos geboren, daarom niet gedoopt en daarom niet opgenomen in het overlijdensregister? In BC overledenen ook mensen wiens woonplaats anders dan BC was: 6x Hebelermeer, 1x Schweringen, 1x Lindloh, 1x Neuenhaus, 1x Wesuwe, 1x Rütenbrock, 1x Ruhle en 1x Altharen, allemaal net over de grens dus. 23 Van de 44 mensen waren na 31-12-1872 geboren, waarvan 9x levenloos. 9 Van de 44 mensen bleken zowel op de teldatum in BC te wonen als op de overledenenlijst 1873-1876 te staan. Van 4 mensen is (nog) geen bewijs dat ze op de teldatum in BC woonden, het betreft Gesina Keuter (*27-4-1803 +5-12-1875), Marchien Gankema (*18-6-1797 +17-9-1875), Zwaantien Schutrups ( *25-4-1830 +15-7-1875) en Johann Bernard Kappen (*2-1-1805 +17-4-1874), alle 4 volwassenen. Conclusie: Er zijn wel veel kleine kinderen overleden na de teldatum, maar die leefden niet op de teldatum. De gegevens zijn volgens mij wel betrouwbaar genoeg om mee te rekenen, maar de verschillende resultaten hangen samen met de andere manier van meten; alle inwoners tellen op 1 datum, of alle overledenen tellen over een langere periode. Mee eens?
Geslacht versus rol in de huishouding en de Chikwadraattoets
Het jongens- en mannenoverschot zit vooral in de categorieën Volwassenen zonder kinderen en Kinderen. Benieuwd hoe de Chikwadraattoets uitpakt voor de samenhang tussen Rol in de huishouding en Geslacht. Volgens SPSS is er geen significant verband tussen beide variabelen (0,05<0,225/2), zie onderstaande tabellen.
Rol in huishouding | Geslacht | Totaal | |
---|---|---|---|
man | vrouw | ||
anders, bijv. dienstmeid, inwonende broer/zus of ouder(s) | 1 | 5 | 6 |
kind | 160 | 130 | 290 |
kind uit eerdere relatie | 5 | 7 | 12 |
kleinkind | 0 | 1 | 1 |
ouder | 83 | 78 | 161 |
volwassene zonder levende inwonende kinderen op teldatum 31-12-1872 | 15 | 8 | 23 |
Totaal | 264 | 229 | 493 |
Chikwadraattoets | Value | df | Asymp. Sig. (2-sided) |
---|---|---|---|
Pearson Chi-Square | 6,939a | 5 | ,225 |
Likelihood Ratio | 7,574 | 5 | ,181 |
N of Valid Cases | 493 | ||
a 4 cells (33,3%) have expected count less than 5. The minimum expected count is ,46. |
Grootte van de huishouding versus rol in de huishouding
De meeste huishoudens bestonden volgens onderstaande staafdiagram zoals verwacht uit ouders met kinderen.
Iets interessanter is dan ook de verdeling naar geslacht, zie onderstaande grafiek. Mannen woonden iets vaker alleen dan vrouwen, al gaat het slechts om een handjevol mensen. De categorie Anders, bestaande uit inwonende dienstmeiden, knechten, ouders, broers/zussen, is iets groter bij de vrouwen dan bij de mannen. Deze categorie komt vooral bij huishoudens van 3-5 personen voor. De categorie "Kind uit eerdere relatie" is wel aanwezig, maar kleiner dan ik verwachtte, aangezien zowel mannen als vrouwen relatief snel hertrouwden nadat hun partner overleed. Als een huishouding ouders heeft dan zijn dat er gewoonlijk 2. Vandaar
Voor 3 verschijnselen in deze grafiek is vermoedelijk het jongensoverschot in de leeftijd 5-14 jarigen de verklaring. Onder kinderen t/m 4 jaar zijn meisjes het sterke geslacht.
- Bij de mannen komt een grootte van de huishouding van 5-7 personen, of nog ruimer 4-8, het vaakst voor, bij de vrouwen is dat 4-6. Het verschil zit niet bij de ouders, dat gedeelte van de staaf is bij de mannen evengroot als bij de vrouwen, maar bij de kinderen.
- Bij de vrouwen is een groot verschil tussen de staaf van 6- en van 7-persoonshuishoudingen. Dat verschil zie je niet bij de mannen.
- Naarmate huishoudingen groter zijn lijken er minder meisjes uit eerdere relaties deel uit te maken van de huishouding.
Migratie van en naar BC: migratie als afstand tussen geboorte- en overlijdensplaats
In Barger-Compascuum werden in 1859 voor het eerst bewoners gesignaleerd in schriftelijke bronnen. Dat de leefomstandigheden erbarmelijk waren is bekend. Waar kwamen de eerste bewoners vandaan? En waar gingen ze heen als ze uit BC vertrokken? Hieronder zijn geboorteplaats en overlijdensplaats in kaart gebracht. Daaronder de Chikwadraattoets: er is een significante samenhang tussen geboorteregio en regio van overlijden (0,05>0,00/2). De meeste mensen kwamen uit Duitsland, vlak over de grens ter hoogte van BC en ze overleden grotendeels in de gemeente Emmen inclusief BC. Van de 509 mensen die op 31-12-1872 in BC woonden zijn 14 zowel in BC geboren (*) als overleden (+), 128 zijn elders geboren en in BC overleden, 81 zijn in BC geboren en elders overleden, de overige 286 zijn zowel elders geboren als overleden. We mogen wel concluderen dat er enorm veel verloop was in de beginjaren van het dorp. Hopend op een beter leven speelde zowel bij de komst als bij vertrek en is van alle tijden. Bij de trek vanuit Duitsland naar Nederland speelde na 1866, toen Hannover de oorlog verloor tegen Pruisen, ook mee dat sommige mannen niet wilden dienen in het Pruisische leger, al is niet bekend op welke schaal dit verschijnsel zich voordeed.
* \ + | BC | Emmen | Drenthe | Nederland | Duitsland | VS | Indonesië | onbekend | totaal |
---|---|---|---|---|---|---|---|---|---|
BC | 14 | 32 | 5 | 6 | 12 | 19 | 7 | 95 | |
Emmen | 3 | 12 | 4 | 2 | 4 | 25 | |||
Drenthe | 16 | 31 | 11 | 5 | 1 | 10 | 74 | ||
Nederland | 18 | 12 | 2 | 7 | 2 | 5 | 46 | ||
Duitsland | 91 | 71 | 3 | 4 | 43 | 17 | 1 | 17 | 247 |
onbekend | 1 | 21 | 22 | ||||||
totaal | 142 | 159 | 19 | 21 | 65 | 52 | 1 | 50 | 509 |
Chikwadraattoets | Value | df | Asymp. Sig. (2-sided) |
---|---|---|---|
Pearson Chi-Square | 291,921a | 30 | ,000 |
Likelihood Ratio | 205,749 | 30 | ,000 |
Linear-by-Linear Association | 3,434 | 1 | ,064 |
N of Valid Cases | 509 | ||
a 18 cells (42,9%) have expected count less than 5. The minimum expected count is ,82. |
Migratie versus rol in de huishouding
Variabele afstand bevat de afstand tussen geboorte- en plaats van overlijden. Per regio is het gewogen gemiddelde genomen van de afstand van meest voorkomende plaatsen tot BC. Regio's zijn overgenomen uit bovenstaande migratietabel. Binnen Duitsland waren de plaatsen in het Emsland vlak over de grens belangrijk zowel voor de herkomst van immigranten als bestemming van emigranten. Binnen de VS waren de staten Michigan, Missouri en Minnesota populair als bestemming. Dat zijn de waarden rond 6800km. De afstand van 11778km. tot BC wordt verklaard door een persoon die in Malang, Indonesië overleed. In deze tabel is grensoverschrijding niet zichtbaar. Een afstand van 5 km. verschil tussen geboorte- en overlijdensplaats kan dus evengoed betekenen geboren elders in de gemeente Emmen en overleden aan de overkant van de Duitse grens dan andersom.
Variabele "Rol in de huishouding" is voor 424 mensen gevuld met waarde Ouder of Kind. De overige 27 mensen waren volwassenen zonder kinderen, inwonende dienstmeiden, knechten, grootouders kinderen uit eerdere relaties of kleinkinderen. Deze groep van 27 is te klein om statistisch iets mee te doen. Onderstaande kruistabel toont het aantal kilometers verschil tussen geboorte- en sterfteplaats voor kinderen en hun ouders. Volgens de Chikwadraattoets is die afstand voor kinderen significant groter (0,05>0,000/2) dan die van hun ouders. De kinderen waren dus iets mobieler dan de ouders, in die zin dat geboorte- en overlijdensplaats iets verder van elkaar vandaan lagen gemiddeld. Hoe kwam dat? Om dat te kunnen verklaren heb je weer meer en andere gegevens nodig, m'n databestand is nogal beperkt.
Afstand | Rol in huishouding | Totaal | |
---|---|---|---|
kind | ouder | ||
0 | 13 | 0 | 13 |
1-10 | 107 | 84 | 191 |
11-20 | 33 | 16 | 49 |
21-30 | 33 | 36 | 69 |
31-40 | 8 | 10 | 18 |
41-50 | 10 | 1 | 11 |
129-159 | 20 | 0 | 20 |
6843-6873,11778 | 46 | 7 | 53 |
Totaal | 270 | 154 | 424 |
Chikwadraattoets | Value | df | Asymp. Sig. (2-sided) |
---|---|---|---|
Pearson Chi-Square | 50,096a | 7 | ,000 |
Likelihood Ratio | 63,403 | 7 | ,000 |
N of Valid Cases | 424 | ||
a 2 cells (12,5%) have expected count less than 5. The minimum expected count is 4,00. |
Migratie versus geslacht en de Chikwadraattoets
Waren mannen mobieler dan vrouwen? Gewoonlijk vestigen mannen zich eerst en later trouwen ze of komen hun vrouw en kinderen over. Ook in BC woonden mannen vaak eerst alleen of met een broer zoals 'n overgrootvader van me. Dit beeld wordt echter niet bevestigd in de kruistabel. Er is geen significant verband tussen geslacht en afstand tussen geboorte- en overlijdensplaats (0,05<0,199/2). Het afstandsverschil tussen geboorte- en overlijdensplaats is dus geen geschikte maatstaf om dit migratiepatroon te onderzoeken.
Geslacht | Totaal | ||
---|---|---|---|
afstand | man | vrouw | |
0 | 5 | 9 | 14 |
1-10 | 111 | 98 | 209 |
11-20 | 29 | 28 | 57 |
21-30 | 34 | 39 | 73 |
31-40 | 13 | 7 | 20 |
41-50 | 3 | 8 | 11 |
129-159 | 12 | 9 | 21 |
6843-6873,11778 | 34 | 19 | 53 |
Totaal | 241 | 217 | 458 |
Chikwadraattoets | Value | df | Asymp. Sig. (2-sided) |
---|---|---|---|
Pearson Chi-Square | 9,827a | 7 | ,199 |
Likelihood Ratio | 9,990 | 7 | ,189 |
N of Valid Cases | 458 | ||
a 0 cells (,0%) have expected count less than 5. The minimum expected count is 5,21. |
Daarom migratie ook nog op een iets andere manier in beeld gebracht; het feit of mensen in BC geboren dan wel overleden waren uitgesplitst naar geslacht. Ook hier zien we geen significant verband (0,05<0,498/2).
Geslacht | Totaal | ||
---|---|---|---|
Migratie | man | vrouw | |
in BC geboren en overleden | 5 | 9 | 14 |
elders geboren, in BC overleden | 66 | 62 | 128 |
in BC geboren, elders overleden | 38 | 36 | 74 |
elders geboren en overleden | 132 | 110 | 142 |
geboorte- en/of overlijdensplaats onbekend | 19 | 11 | 30 |
Totaal | 260 | 228 | 488 |
Chikwadraattoets | Value | df | Asymp. Sig. (2-sided) |
---|---|---|---|
Pearson Chi-Square | 3,371a | 4 | ,498 |
Likelihood Ratio | 3,400 | 4 | ,493 |
N of Valid Cases | 488 | ||
a 0 cells (,0%) have expected count less than 5. The minimum expected count is 6,54. |