Statistiek
Gefascineerd door de functie Verwantschap van Stamboomonderzoek.com
Knagende vragen
15-01-2016: Mooi hè al die plaatjes van verwantschap tussen 2 mensen, tot wel 10 manieren om een relatie weer te geven en tot wel 20 generaties, helemaal als je relaties via aangetrouwden ook meerekent. Hier het meest extreme voorbeeld:ene Heinrich Fischer en Maria Elisabeth Hake, oftewel tante Lies.
- Kun je hier nog meer mee, zonder over gedeeld DNA of inteelt te beginnen. Wat zegt het vaak voorkomen van verwantschappen bijv. over m'n database? Probleemstelling: Ik ben op zoek naar een maat voor de onderlinge verwantschap binnen een genealogie database. Een maat waarin bijv. de volgende indicatoren verwerkt zijn:
- het aantal mensen in de database, in mijn geval 10087, waarvan 71 onderzocht (klein steekproefje was al veel werk, onbetrouwbaar?)
- het aantal mensen dat in hetzelfde jaar geboren is. Waarom in hetzelfde jaar? Dat is een keuze, dat levert de mooiste uitgebalanceerde plaatjes op, met 2 mensen en alle mensen op de route via gemeenschappelijke voorouders.
- het aantal daarvan dat onderling gerelateerd is volgens de functie Verwantschap op Stamboomonderzoek.com met standaard 'Laat Partners Zien' aan.
- het aantal manieren waarop 2 mensen gerelateerd zijn
- het aantal generaties per relatie
- het aantal malen dat 2 personen van elkaar verwijderd zijn per relatie
- Iemand nog suggesties voor andere indicatoren?
- Of voor een mooie formule om de indicatoren in te stoppen? Wat te denken van de volgende formules: D=A/B E=B/C F=D*E, in woorden:
A B C in tabel 1 en 2 betekent A relaties met B personen van totaal C onderzochte personen. tabel 1: C=16, tabel 2: C=52
D is het quotient van A en B; het totaal aantal relaties tussen 'n persoon en de anderen in hetzelfde geboortejaar ten opzichte van het aantal verwante personen van die betreffende persoon, oftewel de gekleurde cellen in dezelfde rij of kolom.
E is het quotient van B en C, het aantal gekleurde cellen ten opzichte van het aantal onderzochte personen in 'n bepaald geboortejaar.
Vervolgens F is het product van D en E als maat voor onderlinge gerelateerdheid tussen 1 persoon en andere onderzochte personen.
A/B * B/C
voorbeeld: A=10, B=5, C=10 levert op 10/5 * 5/10 = 1
A=100 B=5 C=10 levert op 100/5 * 5/10 = 10
A=1 B=1 C=10 levert op 1/1 * 1/10 = 0.1
A=0 B=0 C=10 levert op 0/0 * 0/10 = 0, delen door 0 kan niet, resultaat wordt per definitie 0
A is altijd groter of gelijk aan B. Geen verwantschap levert 0 op, veel verwantschappen in weinig cellen en ook weinig verwantschappen in veel gekleurde cellen leveren een getal rond de 1 op. Veel verwantschappen en veel gekleurde cellen leveren een hoog getal op. Alles boven de 1 is al heel mooi. Het maximum in dit onderzoek is 2.9, bijbehorende persoon is Heinrich Fischer, op de tweede plaats Maria Elisabeth (Lies) HAKE (tante Lies) met 2.2, gedeelde derde plaats voor Anne Sprehe en Albert WILKEN ieder met 1.7. - Is dit bruikbaar als maat voor de interne samenhang binnen 'n database? Neen, F zegt alleen iets over afzonderlijke personen geboren in 1916, 1908 en 1924 in mijn database.
- Middelen dan maar per geboortejaar? G is de gemiddelde F. 10 Mensen met geboortejaar 1924 zijn gemiddeld 0,7 verwant aan mensen uit 1908. 42 mensen met geboortejaar 1908 leveren met mensen geboren in 1924 gemiddeld ook 0,7 op, netjes wederkerig, 19 mensen geboren in 1916 onderling gemiddeld G=0,4. Dit klopt ook niet helemaal, immers, onderzocht is de verwantschap tussen mensen geboren in 1916 onderling en tussen mensen geboren in 1908 enerzijds en mensen geboren in 1924 anderzijds, zie 25-01-2016: Update.
- Hoe liggen gemiddelde, minimum en maximum voor de 3 geboortejaren samen? gemiddeld=G=0,6, minimum=Mi=0 en maximum=Ma=2,9
- Hoe krijg jou zo gek om hetzelfde uit te rekenen voor jouw database?:-) Welke geboortejaren leveren voor jouw database een hoge G op? Enig idee welke 3 geboortejaren je zou moeten kiezen om het resultaat überhaubt te kunnen vergelijken?
- Wie was toch die Heinrich Fischer, die zo belangrijk binnen m'n database blijkt te zijn?
- Hoe kan het dat de verwantschap tussen m'n vader en een tante, zus van m'n moeder (7x) iets anders oplevert dan tussen die tante en m'n vader (5x)? Ik verwacht wederkerigheid, als jij m'n broer bent ben ik jouw zus, als jij m'n nicht bent kan ik je nicht of tante zijn. Volgens mij is hier sprake van een bug. Gewoonlijk geeft de functie Verwantschap je naam rechts in het schema en in de toelichting weer als je via je echtgenoot/echtgenote verwant bent met iemand. Op zich prima, dat lijkt een keuze. Maar het gaat fout als je EN zelf EN via je echtgenoot/echtgenote met een bepaalde persoon verwant bent. En dat is precies het geval tussen tante Lies en m'n vader. In het schema met de verwantschappen tussen haar en m'n vader ontbreken de 2 relaties via oom Geert, haar man, zie onderstaand overzicht.
Johan Bernard Berens: Verwantschap met Maria Elisabeth Hake- Johan Bernard Berens is de 3 x neef een keer verwijderd van de echtgenoot van Maria Elisabeth (Lies) Hake
- Johan Bernard Berens is de 5 x neef van Maria Elisabeth (Lies) Hake
- Johan Bernard Berens is de 6 x neef een keer verwijderd van Maria Elisabeth (Lies) Hake
- Johan Bernard Berens is de 7 x neef een keer verwijderd van Maria Elisabeth (Lies) Hake
- Johan Bernard Berens is de 10 x neef een keer verwijderd van Maria Elisabeth (Lies) Hake
- Johan Bernard Berens is de 10 x neef van de echtgenoot van Maria Elisabeth (Lies) Hake
- Johan Bernard Berens is de 10 x neef een keer verwijderd van Maria Elisabeth (Lies) Hake
- Maria Elisabeth (Lies) Hake is de 5 x nicht van Johan Bernard Berens
- Maria Elisabeth (Lies) Hake is de 6 x nicht een keer verwijderd van Johan Bernard Berens
- Maria Elisabeth (Lies) Hake is de 7 x nicht een keer verwijderd van Johan Bernard Berens
- Maria Elisabeth (Lies) Hake is de 10 x nicht een keer verwijderd van Johan Bernard Berens
- Maria Elisabeth (Lies) Hake is de 10 x nicht een keer verwijderd van Johan Bernard Berens
Het probleem treedt NIET op indien de verwantschappen tussen 2 mensen getoond wordt en een ervan is ALLEEN via zijn/haar echtgenote/echtgenoot verwant, zoals het geval bij Johan Bernard Berens en Katharina Bolle en terug Katharina Bolle en Johan Bernard Berens. Nog een voorbeeld: Anne Sprehe en Hermanus Jozephus (Herman) Reuvers, andersom Hermanus Jozephus (Herman) Reuvers en Anne Sprehe. Degene die enkel via de partner verwant is wordt steevast in de rechtertak van het schema getoond, onafhankelijk van het feit of die persoon de hoofdpersoon/primaryperson op de webpagina is.
Het probleem treedt ook NIET op indien voor beide personen geldt dat de verwantschap NIET via hun echtgenote/echtgenoot loopt, zie Johan Bernard Berens en Johann Jozeph (Joop) Muller en andersom Johann Jozeph (Joop) Muller en Johan Bernard Berens.
Nu nog een voorbeeld zoeken van 2 personen die ALLEEN via hun respectievelijke echtgenote/echtgenoot verwant zijn:-) Bijv. Johan Theodor Berends en Margaretha Schwenen levert op "De twee personen zijn niet verwant aan elkaar binnen 20 generaties". Da's vreemd, hun beide partners zijn wel verwant, zie Heinrich Fischer en Anna Maria Gezina GEPKEN. Hier loopt de definitie van verwantschap spaak, blijkbaar telt 'n relatie via je partner soms wel mee, soms niet. Dat zou niet moeten kunnen. - Na het ontdekken van de bug sloeg de twijfel toe. Hoe kom ik er snel achter of de bug optreedt in "tabel 2: verwantschap tussen alle 42 mensen geboren in 1908 (rijen) en alle 10 mensen in 1924 (kolommen)"? Die tabel heb ik gemaakt nadat tabel 1 symetrisch leek. De tabel kantelen en opnieuw alle links aanklikken is teveel werk. Het is me inmiddels wel duidelijk dat de bug voor mijn onderzoek niet relevant is. De aantallen verwantschappen die ik geteld heb kloppen denk ik nu wel. Het was eerder opgevallen als tante Lies in tabel 2 aan de linkerkant had gestaan:-) Ik kan nu tabel 3 invullen.
- Er lijkt iets vreemds aan de hand met tabel 3 en beide daaropvolgende staafdiagrammen. Zowel in het aantal relaties als bij het aantal tussenliggende generaties per relatie ontbreken 7, 8 en 9 helemaal of bijna helemaal. 10 Zowel bij relaties als bij generaties is oververtegenwoordigd. Misschien is de onderzoeksgroep wel te klein om conclusies te mogen trekken uit beide staafdiagrammen. Mee eens?
Drie tabellen gemaakt
- De eerste tabel toont de onderlinge verwantschap tussen alle 19 mensen in m'n database geboren in 1916. Waarom 1916? Het is het zgn. cutoff year, d.w.z. van mensen geboren na 1916 wordt als geen overlijdensdatum bekend is aangenomen dat ze leven. 1916 Was ook het geboortejaar van m'n vader. In m'n database zijn van m'n ouders de meeste voorouders bekend. De tweede tabel toont de verwantschap tussen alle 42 mensen geboren in 1908 enerzijds en alle 10 mensen in 1924 anderzijds, om te zien of het resultaat wezenlijk verschilt van dat in de eerste tabel. Waarom 1908 en 1924? M'n moeder leeft, zit dus niet in de database. Daarom een zus van haar gekozen geboren in 1924, om de voorouders te tonen die zij en m'n moeder gemeenschappelijk hadden. Ter compensatie van 8 jaar verschil met 1916 voor 1908 gekozen, tegenhanger van 1924.
- De tooltip toont aard en aantal verwantschappen tussen 2 personen. "10 x nicht" Betekent bijv. 10 generaties tussen de 2 mensen en hun gemeenschappelijke voorouder. "een keer verwijderd" Betekent bijv. dat 2 mensen 1 generatie van elkaar verschillen.
- Je kunt doorklikken via de x-linken naar Stamboomonderzoek.com om de betreffende verwantschap te zien.
- De achtergrondkleur is een indicatie voor het aantal manieren waarop 2 mensen verwant zijn; hoe donkerder des te meer relaties.
- Het aantal manieren is per kolom en rij getotaliseerd.
- Sowieso zijn alle mensen in m'n online database onderling gerelateerd, resultaat van het selecteren van alle gerelateerden van m'n zus in Progen VOOR het uploaden van de GEDCOM exclusief levenden. Ongetwijfeld bevordert deze actie de nieuwe maat G in positieve zin. Ben benieuwd wat het effect ervan in jouw database is als je hetzelfde doet in een kopie van je database bijv.
- Stamboomonderzoek.com berekent verwantschap binnen maximaal 20 generaties en maximaal op 10 manieren. De optie Laat Partners Zien staat aan, d.w.z. de verwantschap kan ook via aangetrouwden zijn.
- De namen in eerste rij en kolom linken naar de betreffende persoon in m'n genealogie database.
- Tabel 3 toont de samenhang tussen aantal tussenliggende generaties met gemeenschappelijke voorouder(s) per relatie (rijen) en aantal verwantschappen tussen 2 personen (kolommen).
Het resultaat
- Het gemiddelde G, minimum Mi en maximum Ma voor de 3 geboortejaren 1908, 1916, 1924 samen: G=0,6, Mi=0 en Ma=2,9. Een nieuwe maat G voor onderlinge verwantschap, berekend door de verwantschappen te middelen tussen 1 persoon en mensen met hetzelfde geboortejaar (1916) of ander geboortejaar (1908 of 1924).
- Het komt 1x voor in de onderzochte groepen dat 2 mensen op 10 manieren verwant zijn, te weten Heinrich FISCHER en Maria Elisabeth (Lies) HAKE.
- Het komt 63 keer voor dat mensen met 10 tussenliggende generaties verwant zijn.
- Dat voorouders uit Hebelermeer belangrijk zouden zijn voor de onderlinge verwantschap had ik wel verwacht. Maar ik zie weinig terug van het recente invoerwerk uit Ortsfamilienbuch Rütenbrock. Dat had ik niet verwacht. Misschien (te) weinig mensen overgenomen uit *1908, *1916 en *1924. Misschien moet ik nog verder gaan met dat Ortsfamilienbuch, om het effect duidelijk te merken:-)
- Verschilt het resultaat van tabel 1 en 2 wezenlijk? De relaties tussen mensen in tabel 1 zijn berekend tussen mensen met hetzelfde geboortejaar, in tabel 2 met 16 jaar verschil qua geboortejaar. Dat levert vaker een generatie verschil op in de plaatjes. Op zich niet verrassend.
- De rijtotalen in tabel 2 mag je niet vergelijken met de kolomtotalen. Een rij bestaat immers uit 10 mensen, een kolom uit 42. Meer kansen dus dat er verwantschap is.
- In tabel 1 (19 x *1916) heeft m'n vader de meeste onderlinge verwantschappen, Berens staat op plaats 13 in de Familienamenlijst op stamboomonderzoek.com. Tabel 2 laat voor de mensen geboren in 1924 hetzelfde beeld zien; Gröninger (7), Schulte (4) en Hake (2) staan in de Top 10 van achternamen. Van degenen geboren in 1908 met de meeste onderlinge verwantschappen hebben Fischer (8) en Wilken (1) een achternaam uit de Top 10. Derde persoon is hier ene Anne Sprehe, 'n achternaam die verder niet in m'n database voorkomt. Als aangetrouwde lopen al haar verwantschappen met anderen in m'n database via haar man.
- Het lijkt erop dat sommige mensen een beetje verwant zijn aan veel mensen, terwijl bij anderen de verwantschappen geconcentreerd lijken over een paar mensen. Voorbeelden in tabel 2: Johann Gerhard KOOP (7 verwantschappen met 5 van totaal 10 mensen geboren in 1924), Gerhard Heinrich VERINGA (28/21/42 *1908), Anne SPREHE (17/4/10 *1924). Tabel 1 is misschien te klein voor zo'n bewering. M'n vader is vooral op veel manieren verwant aan Katharina BöLLE en Johann Jozeph (Joop) MULLER. De moeite waard om een frequentietabel te maken; hoevaak komen 1x, 2x etc. verwant voor? Tabel 3 laat zien hoe meer relaties des te minder generaties per relatie, hoe minder relaties, des te meer generaties per relatie.
legenda
aantal verwantschappen tussen 2 personen1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
tabel 1: onderlinge verwantschap tussen alle 19 mensen in m'n database geboren in 1916 onderling
Tabel 1 toont een symetrisch beeld langs de diagonaal van linksboven naar rechtsonder. In feite is de verwantschap tussen 2 personen 2x berekend, omdat ik er rekening mee hield dat de verwantschap tussen A en B iets anders op kon leveren dan tussen B en A.19 x *1916 | J H A S S E N |
H B E N T L A G E |
J B B E R E N D S E N |
A M B E R E N D Z E N |
G B E R E N S |
J B B E R E N S |
A B R A S I E R |
K B ö L L E |
M H A K E |
J G L I N N E M A N N |
G M H L ü B B E R S |
M A L ü B B E R S |
A E M U L D E R |
J J M U L L E R |
C W R E U V E R S |
H H R E U V E R S |
H S C H O L T E |
C E S C H R A M M |
E S P E C K E N |
totaal |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Johannes Hendrikus ASSEN | x | x | x | x | x | x | x | 1_x | x | 1_x | 1_x | 1_x | x | x | x | x | x | x | 4 | |
Helena BENTLAGE | x | x | x | 1_x | 2_x | x | x | 1_x | x | 1_x | 1_x | 2_x | 2_x | x | x | x | x | 1_x | 10 | |
Johannes Bernardus BERENDSEN | x | x | x | x | 1_x | x | 1_x | x | x | x | x | x | x | 1_x | 1_x | x | x | x | 4 | |
Augusta Maggie BERENDZEN | x | x | x | x | x | x | x | 1_x | x | x | x | x | x | x | x | x | x | x | 1 | |
Gezina BERENS | x | 1_x | x | x | 2_x | x | x | x | x | x | x | 1_x | 1_x | x | x | 1_x | x | x | 6 | |
Johan Bernard BERENS | x | 1_x | 1_x | x | 2_x | x | 4_x | x | x | x | x | 2_x | 5_x | 1_x | 1_x | 2_x | x | x | 19 | |
Alta BRASIER | x | x | x | x | x | x | x | 1_x | x | x | x | x | x | x | x | x | x | x | 1 | |
Katharina BöLLE | x | x | 1_x | x | x | 4_x | x | 1_x | x | 1_x | 1_x | 2_x | 1_x | 1_x | 1_x | x | x | 1_x | 14 | |
Maria HAKE | 1_x | 1_x | x | 1_x | x | x | 1_x | 1_x | x | 1_x | 1_x | 1_x | x | x | x | x | x | x | 8 | |
Johannes Gerard LINNEMANN | x | x | x | x | x | x | x | x | x | x | x | x | x | x | x | x | 1_x | x | 1 | |
Gezina Maria Helena LüBBERS | 1_x | 1_x | x | x | x | x | x | 1_x | 1_x | x | 1_x | 1_x | x | x | x | x | x | x | 6 | |
Maria Angela LüBBERS | 1_x | 1_x | x | x | x | x | x | 1_x | 1_x | x | 1_x | 1_x | x | x | x | x | x | x | 6 | |
Anna Elisabeth MULDER | 1_x | 2_x | x | x | 1_x | 2_x | x | 2_x | 1_x | x | 1_x | 1_x | 2_x | x | x | 1_x | x | x | 14 | |
Johann Jozeph (Joop) MULLER | x | 2_x | x | x | 1_x | 5_x | x | 1_x | x | x | x | x | 2_x | x | x | 2_x | x | x | 13 | |
Christiaan Wilhelmus REUVERS | x | x | 1_x | x | x | 1_x | x | 1_x | x | x | x | x | x | x | 1_x | x | x | x | 4 | |
Hermannus_Henderikus_REUVERS | x | x | 1_x | x | x | 1_x | x | 1_x | x | x | x | x | x | x | 1_x | x | x | x | 4 | |
Herman SCHOLTE | x | x | x | x | 1_x | 2_x | x | x | x | x | x | x | 1_x | 2_x | x | x | x | 1_x | 7 | |
Cleopha Elizabeth SCHRAMM | x | x | x | x | x | x | x | x | x | 1_x | x | x | x | x | x | x | x | x | 1 | |
Elizabeth SPECKEN | x | 1_x | x | x | x | x | x | 1_x | x | x | x | x | x | x | x | x | 1_x | x | 3 | |
A B C D=A/B E=B/C F=D*E |
4 4 19 1.0 0.3 0.3 |
10 8 19 1.3 0.4 0.5 |
4 4 19 1.0 0.2 0.2 |
1 1 19 1.0 0.1 0.1 |
6 5 19 1.2 0.3 0.3 |
19 9 19 2.1 0.5 1.0 |
1 1 19 1.0 0.1 0.1 |
14 10 19 1.4 0.5 0.7 |
8 8 19 1.0 0.4 0.4 |
1 1 19 1.0 0.1 0.1 |
6 6 19 1.0 0.3 0.3 |
6 6 19 1.0 0.3 0.3 |
14 10 19 1.4 0.5 0.7 |
13 6 19 2.2 0.3 0.7 |
4 4 19 1.0 0.2 0.2 |
4 4 19 1.0 0.2 0.2 |
7 5 19 1.4 0.3 0.4 |
1 1 19 1.0 0.1 0.1 |
3 3 19 1.0 0.2 0.2 |
126 |
tabel 2: verwantschap tussen 42x*1908 (rows) en 10x*1924 (cols)
10 x *1924 42 x *1908 |
J G R ö N I N G E R |
M E H A K E |
B H O L L E N |
H J R E U V E R S |
B H S C H U L T E |
B V A N D E R M E E R |
G V E R I N G A |
M C F V L I J M I N C X |
J W ü B B E N |
A W ü B K E S | A_B_C_D=A/B_E=B/C_F=D*E |
---|---|---|---|---|---|---|---|---|---|---|---|
A B C D=A/B E=B/C F=D*E | 7 7 42 1.0 0.2 0.2 | 94 34 42 2.8 0.8 2.2 | 37 20 42 1.9 0.5 0.9 | 37 18 42 2.1 0.4 0.9 | 33 24 42 1.4 0.6 0.8 | 1 1 42 1.0 0.0 0.0 | 28 21 42 1.3 0.5 0.7 | 1 1 42 1.0 0.0 0.0 | 29 26 42 1.1 0.6 0.7 | 35 21 42 1.7 0.5 0.8 | totaal A=301 |
Gerardus Hendrik ARLING | x | x | x | x | x | x | x | x | 1_x | x | 1 1 10 1.0 0.1 0.1 |
Margaretha BACKS | x | 3_x | 2_x | x | 1_x | x | x | x | 1_x | x | 7 4 10 1.8 0.4 0.7 |
Maria Margaretha BACKS | x | 1_x | x | x | x | x | x | x | 1_x | x | 2 2 10 1.0 0.2 0.2 |
Helena Josefina BENTLAGE | x | 3_x | x | 1_x | 1_x | x | 1_x | 1_x | 1_x | 1_x | 9 7 10 1.3 0.7 0.9 |
Anna Maria BERENDSEN | x | x | x | x | 1_x | x | x | x | x | x | 1 1 10 1.0 0.1 0.1 |
Josef BORGMANN | x | 3_x | 2_x | x | 1_x | x | 1_x | x | 1_x | 1_x | 9 6 10 1.5 0.6 0.9 |
Anna Helena (Lenie) BORKER | 1_x | 4_x | 1_x | 2_x | 2_x | x | 1_x | x | 1_x | 2_x | 14 8 10 1.8 0.8 1.4 |
Maria Anna (Annie) BORKER | 1_x | 4_x | 1_x | 2_x | 2_x | x | 1_x | x | 1_x | 2_x | 14 8 10 1.8 0.8 1.4 |
Johann BRUNS | x | 5_x | 2_x | 2_x | 1_x | x | 1_x | x | 2_x | x | 12 6 10 2.0 0.6 1.2 |
Johann Herman BUDDE | x | 3_x | x | 1_x | 3_x | x | 1_x | x | 2_x | x | 10 5 10 2.0 0.5 1.0 |
Josef (Gottfried) BöLLE | x | 4_x | 1_x | 2_x | 1_x | x | 1_x | x | 1_x | 2_x | 12 7 10 1.7 0.7 1.2 |
Kaspar BöLLE | x | 3_x | 2_x | x | 1_x | x | x | x | 1_x | 2_x | 9 5 10 1.8 0.5 0.9 |
Maria Margarete EFKEN | x | 1_x | 1_x | 2_x | x | x | 1_x | x | x | x | 5 4 10 1.3 0.4 0.5 |
FEHRMANN | x | 1_x | x | x | 1_x | x | 1_x | x | 1_x | x | 4 4 10 1.0 0.4 0.4 |
Heinrich FENSLAGE | x | 1_x | x | x | 1_x | x | 1_x | x | 1_x | 1_x | 5 5 10 1.0 0.5 0.5 |
Gesina FERINGA | x | 2_x | 1_x | 1_x | x | x | 1_x | x | x | 1_x | 6 5 10 1.2 0.5 0.6 |
Heinrich FISCHER | x | 10_x | 4_x | 4_x | 2_x | x | 1_x | x | 2_x | 6 x | 29 7 10 4.1 0.7 2.9 |
Anna Maria Gezina GEPKEN | x | 4_x | 2_x | 2_x | 1_x | x | 2_x | x | 1_x | 2_x | 14 7 10 2.0 0.7 1.4 |
Maria Helena GEPKEN | x | 2_x | 2_x | 2_x | x | x | 2_x | x | x | 1_x | 9 5 10 1.8 0.5 0.9 |
Anna GRAVELAR | x | 3_x | 2_x | x | 1_x | x | x | x | 1_x | x | 7 4 10 1.8 0.4 0.7 |
Anthony HAKE | 1_x | 1_x | x | x | x | x | x | x | x | 1_x | 3 3 10 1.0 0.3 0.3 |
Anthony L. HAKE | 1_x | 1_x | x | x | x | x | x | x | x | 1_x | 3 3 10 1.0 0.3 0.3 |
Rudolphus_Engelbertus_HAKE | 1_x | 3_x | 2_x | 2_x | 1_x | x | 2_x | x | 1_x | 1_x | 13 8 10 1.6 0.8 1.3 |
Johann Hermann HERBERS | x | 3_x | x | 1_x | 1_x | x | 1_x | x | 1_x | x | 7 5 10 1.4 0.5 0.7 |
Maria Helena KOLLMER | x | 2_x | x | x | 1_x | x | x | x | 1_x | x | 4 3 10 1.3 0.3 0.4 |
Johann Gerhard KOOP | x | 2_x | 2_x | x | 1_x | x | x | x | 1_x | 1_x | 7 5 10 1.4 0.5 0.7 |
LEIBT | x | 1_x | 1_x | 2_x | x | x | 1_x | x | x | x | 5 4 10 1.3 0.4 0.5 |
Euphemia Maria LINNEMANN | x | x | x | x | x | x | x | x | 1_x | x | 1 1 10 1.0 0.1 0.1 |
Almer Lena LUBBERS | 1_x | 1_x | x | x | x | x | x | x | x | 1_x | 3 3 10 1.0 0.3 0.3 |
George W. MAASS | x | x | x | x | x | x | x | x | x | x | 0 0 10 0.0 0.0 0.0 |
Johann Georg MENKE | x | x | x | x | x | x | x | x | x | x | 0 0 10 0.0 0.0 0.0 |
Maria MENKE | x | 1_x | 2_x | x | x | x | x | x | x | 1_x | 4 3 10 1.3 0.3 0.4 |
Maria Catharina MULLER | x | 5_x | x | 1_x | 3_x | x | 1_x | x | 2_x | 1_x | 13 6 10 2.2 0.6 1.3 |
Bertha OP 'T ENDE | x | x | x | x | 1_x | x | x | x | x | x | 1 1 10 1.0 0.1 0.1 |
Adeline Rose SPECKEN | x | 1_x | x | x | x | x | x | x | 1_x | x | 2 2 10 1.0 0.2 0.2 |
Anne SPREHE | x | 3_x | 4_x | 6 x | x | x | 4_x | x | x | x | 17 4 10 4.3 0.4 1.7 |
Ferdinand Heinrich STEINKAMP | x | 1_x | x | x | x | x | x | x | x | x | 1 1 10 1.0 0.1 0.1 |
Maria Jozephina THOMAS | x | x | x | x | x | x | x | x | x | x | 0 0 10 0.0 0.0 0.0 |
Johan Bernard VAN DER MEER | 1_x | 4_x | 1_x | 2_x | 2_x | 1_x | 1_x | x | 1_x | 2_x | 15 9 10 1.7 0.9 1.5 |
Herman J. VELTROP | x | x | x | x | x | x | x | x | x | x | 0 0 10 0.0 0.0 0.0 |
Albertus (Albert) WILKEN | x | 6 x | 1_x | 2_x | 1_x | x | 2_x | x | 1_x | 4_x | 17 7 10 2.4 0.7 1.7 |
Henry WILKEN | x | 2_x | x | x | 2_x | x | x | x | 1_x | 1_x | 6 4 10 1.5 0.4 0.6 |
Tabel 3: relaties, generaties per relatie en x keer verwijderd
Met relaties wordt hier bedoeld het aantal manieren waarop 2 mensen verwant zijn, zeg maar het aantal schema's dat klikken op een link naar de functie Verwantschap oplevert. In het voorbeeld met Gezina Berens en Helena Bentlage is dat 1. Het maximum aantal relaties dat de functie Verwantschap kan berekenen is 10. Verwantschap komt 219x voor, niet verwant binnen 20 generaties oftewel 0 relaties komt 419x voor. Om te kunnen zeggen dat 1/3 van de mensen in m'n steekproef onderling gerelateerd is zou ik moeten uitsplitsen hoe dit ligt binnen de groep geboren in 1916 (19 personen), resp. tussen geborenen in 1908 (42) en 1924 (10). Als de functie Verwantschap verwantschap constateert, dan betreft het meestal 1 of 2 relaties. Het komt 1x voor dat de functie Verwantschapp tussen 2 mensen 10 relaties vindt, waarvan 2x met 2 tussenliggende generaties verschil, 2 met 3, 2 met 4, 1 met 5, 1 met 7 en 2 met 10! Dit is wel het meest indrukwekkende plaatje uit m'n hele onderzoek:-) Het betreft Heinrich Fischer en Maria Elisabeth (Lies) Hake.
Met generaties wordt hier bedoeld het aantal tussenliggende generaties tussen 2 personen enerzijds en hun gemeenschappelijke voorouder(s) anderzijds. Voorbeeld: De functie Verwantschap levert voor Gezina Berens en Helena Bentlage op "Gezina Berens is de 10 x nicht een keer verwijderd van de echtgenoot van Helena Bentlage". Gemeenschappelijke voorouders zijn Herman Böllering en Johanna Niehoff. Ter hoogte van Bernard Böllering t/m Antoon Berens zie je totaal 10 generaties. Elke generatie is 1 laag in het schema. "Een keer verwijderd" slaat op die ene laag verschil tussen Gezina Berens en Helena Bentlage verticaal gezien in het schema. Hoe verder weg mensen aan elkaar verwant zijn des te indrukwekkender het plaatje dat 't oplevert:-)
"een keer verwijderd" komt 25 x in tabel 1 voor en 199 in tabel 2, "2 maal verwijderd" 5 x in tabel 1 en 7 in tabel 2. Het hoge aantal "een keer verwijderd" in tabel 2 komt vermoedelijk door de aard van de groep; alle 42 mensen geboren in 1908 en alle mensen geboren in 1924. Iemand uit 1908 kan gemakkelijk oom/tante zijn of op een andere manier 1 generatie verschillen van iemand geboren in 1924. Het komt in mijn database tussen alle mensen geboren in 1916 onderling en tussen alle mensen geboren in 1908 enerzijds en 1924 anderzijds totaal 63 keer voor dat er 10 generaties verschil is, zie volgende tabel.
Vraag is of er enige samenhang is tussen aantal verwantschappen tussen 2 personen en aantal tussenliggende generaties per verwantschap.
Staafdiagram: relaties en generaties per relatie absoluut
Hoe meer relaties des te minder generaties per relatie, hoe minder relaties, des te meer generaties per relatie, een negatieve correlatie heet dit meen ik:-)
Staafdiagram: relaties en generaties per relatie relatief
25-01-2016 maat G = gemiddelde F per geboortejaar
- Misschien is het al moeilijk genoeg om alleen alle mensen geboren in hetzelfde jaar te betrekken bij de zoektocht naar een maat voor onderlinge verwantschap. De keuze iedereen geboren in 1908 respectievelijk 1924 te kiezen is bij nader inzien nogal willekeurig, respectievelijk 8 jaar voor en na 1916. In tabel 4 worden de relaties tussen alle 11 mensen geboren in 1924 getoond. Dat levert op: G = gemiddelde F per geboortejaar 1924 = 0,6, minimum Mi=0 en maximum Ma=1,8. G zegt nog steeds niets over de database als geheel, alleen iets over 1 geboortejaar. Je zou al die G's per geboortejaar ook weer kunnen middelen en dan zegt het iets over je hele database. Maar dat lijkt me niet interessant, want het lijkt me lichtelijk voorspelbaar dat de G vooral hoog is voor geboortejaren die in de buurt liggen van het cut off-year, op zich een veronderstelling die wel vraagt om meer bewijs, een dusdanig tijdrovende klus dat ik daar graag van af zie:-)
- Selecteren op geboortejaar 1924 levert inmiddels 11 mensen op in m'n database, was 10.
- Een nieuw record: Het komt maar liefst 3x voor dat 2 mensen op 11 manieren verwant zijn, zie
Anton Wubkes Verwantschap met Joseph Wubben,
Anton Wubkes Verwantschap met Maria Elisabeth (Lies) Hake,
Joseph Wubben Verwantschap met Maria Elisabeth (Lies) Hake. - De bug in wederkerigheid treedt in tabel 4 herhaaldelijk op. Vergelijk maar 'ns de resultaten in de rij van ME Hake met de kolom van dezelfde ME Hake. 4 Keer worden 2 in plaats van 3 relaties tussen 2 personen gevonden, 1 keer zelfs 2 i.p.v. 5!
Reciprocity bug
The reciprocity bug is evident in table 4, this table should be coloured symetrically on the left-upper / right-down axis. Please compare ME Hake's row and column. 4 Times 2 relationships are found instead of 3, once 2 instead of 5. If a relationship is not found, it's always one via someones husband. In general; if 2 persons (A and B) are related AND via B's partner as well, then the relationships via B's partner are not found if you only look for the relationships between B and A. If you look for relationships between A and B, all relationships are found. Problems with totals are shown red in table 4, correct totals are shown green.Example
Hermanus Jozephus (Herman) Reuvers Verwantschap met Maria Elisabeth (Lies) Hake- Hermanus Jozephus (Herman) Reuvers is de 5 x neef een keer verwijderd van de echtgenoot van Maria Elisabeth (Lies) Hake
- Hermanus Jozephus (Herman) Reuvers is de 6 x neef van Maria Elisabeth (Lies) Hake
- Hermanus Jozephus (Herman) Reuvers is de 8 x neef van de echtgenoot van Maria Elisabeth (Lies) Hake
- Hermanus Jozephus (Herman) Reuvers is de 8 x neef een keer verwijderd van de echtgenoot van Maria Elisabeth (Lies) Hake
- Hermanus Jozephus (Herman) Reuvers is de 9 x neef van Maria Elisabeth (Lies) Hake
- Maria Elisabeth (Lies) Hake is de 6 x nicht van Hermanus Jozephus (Herman) Reuvers
- Maria Elisabeth (Lies) Hake is de 9 x nicht van Hermanus Jozephus (Herman) Reuvers
tabel 4: verwantschap tussen alle 11 mensen *1924 onderling
11 x *1924 | P M D I E K M A N N |
J G R ö N I N G E R |
M E H A K E |
B H O L L E N |
H J R E U V E R S |
B H S C H U L T E |
B V A N D E R M E E R |
G V E R I N G A |
M C F V L I J M I N C X |
J W ü B B E N |
A W ü B K E S | A B C D=A/B E=B/C F=D*E |
---|---|---|---|---|---|---|---|---|---|---|---|---|
A B C D=A/B E=B/C F=D*E | 0 0 11 0 0 0 | 3 3 11 1 0.3 0.3 | 20 7 11 2.9 0.6 1.8 | 7 | 9 | 6 | 0 0 11 0 0 0 | 7 | 0 0 11 0 0 0 | 4 | 11 7 11 1.6 0.6 1 | totaal A=74 |
PM DIEKMANN | x | x | x | x | x | x | x | x | x | x | 0 0 11 0 0 0 | |
J GRöNINGER | x | 1(4)x | x | x | 1(5)x | x | x | x | x | 1(4)x | 3 3 11 1 0.3 0.2 | |
ME HAKE | x | 1(4)x | 2(3,4)x | 2(6,9)x | 2(6,10)x | x | 2(5,6)x | x | 2(1,11)x | 2(1,11)x | 13 | |
B HOLLEN | x | x | 3(3,4,4)x | 2(6,9)x | x | x | 1(5)x | x | x | 2(3,4)x | 8 4 11 2 0.4 0.7 | |
HJ REUVERS | x | x | 5 (5,6,8,8,9) x | 2(6,9)x | 1(7)x | x | 2(6,9)x | x | x | 2(6,9)x | 12 5 11 2.4 0.5 1.1 | |
BH SCHULTE | x | 1(5)x | 3 (6,10,10) x | x | 1(7)x | x | x | x | 1(6)x | 1(10)x | 7 5 11 1.4 0.5 0.6 | |
B_VAN_DER_MEER | x | x | x | x | x | x | x | x | x | x | 0 0 11 0 0 0 | |
G VERINGA | x | x | 3(1,5,6)x | 1(5)x | 2(6,9)x | x | x | x | x | 2(5,6)x | 8 4 11 2 0.4 0.7 | |
MCF VLIJMINCX | x | x | x | x | x | x | x | x | x | x | 0 0 11 0 0 0 | |
J WüBBEN | x | x | 3 (1,11,10) x | x | x | 1(6)x | x | x | x | 1(11)x | 5 3 11 1.7 0.3 0.5 | |
A WüBKES | x | 1(4)x | 2(1,11)x | 2(3,4)x | 2(3,4)x | 1(10)x | x | 2(5,6)x | x | 1(11)x | 11 7 11 1.6 0.6 1 |
20-01-2020 Bug opgelost
Johan Bernard Berens en Maria Elisabeth Hake zijn inmiddels op 10 manieren verwant, evenveel als Maria Elisabeth Hake en Johan Bernard Berens.:-)Update reciprocity bug 13-02-2016
Ik heb de bug besproken met Darrin Lythgoe, eigenaar van de software die stamboomonderzoek.com gebruikt voor de functie Verwantschap. Hij zag 't probleem wel, maar heeft geen oplossing toegezegd. Misschien helpt het als meer mensen gaan klagen? Totdat het probleem verholpen is raad ik aan zelf handmatig relaties tussen B en A te laten berekenen, nadat je die tussen A en B hebt getoond. Dat kan door de persoonsnummers in primarypersonID en savedpersonID op de adresbalk te verwisselen.
Knagende vragen
Drie tabellen gemaakt
Het resultaat
Legenda
Tabel 1: onderlinge verwantschap tussen alle 19 mensen in m'n database geboren in 1916
Tabel 2: verwantschap tussen alle 42 mensen geboren in 1908 enerzijds (rijen) en alle 10 mensen in 1924 anderzijds (kolommen)
Tabel 3: relaties, generaties per relatie en x keer verwijderd
Update 25-01-2016: G = gemiddelde F per geboortejaar
Reciprocity bug
Tabel 4: verwantschap tussen alle 11 mensen geboren in 1924 onderling
20-01-2020 update bug
Drie tabellen gemaakt
Het resultaat
Legenda
Tabel 1: onderlinge verwantschap tussen alle 19 mensen in m'n database geboren in 1916
Tabel 2: verwantschap tussen alle 42 mensen geboren in 1908 enerzijds (rijen) en alle 10 mensen in 1924 anderzijds (kolommen)
Tabel 3: relaties, generaties per relatie en x keer verwijderd
Update 25-01-2016: G = gemiddelde F per geboortejaar
Reciprocity bug
Tabel 4: verwantschap tussen alle 11 mensen geboren in 1924 onderling
20-01-2020 update bug