Genealogie gegevens in het bestand van My Heritage verwerkt tot artikel in Science (voor gevorderden)

Bovenkant formulier

De onderzoekers downloadden 86 miljoen openbare stamboomprofielen van het dochterbedrijf van MyHeritage, Geni.com, een van ‘s werelds grootste websites voor genealogische samenwerking, waarvan 43 miljoen gedetailleerde genealogische gegevens hadden, zoals geboortedatum en -locatie. Dr. Erlich, Chief Science Officer van MyHeritage, en zijn team hebben de gegevensgevalideerd. Ze valideerden hun algoritmen door de beslissingen die de algoritmen maakten te vergelijken met de beslissingen die expert-genealogen namen in dezelfde scenario’s. Daarbij bleek dat de uitkomsten in meer dan 90% van de gevallen overeenkwamen. Uiteindelijk zijn ze geëindigd met 5,3 miljoen gevalideerde onafhankelijke stambomen. De grootste daarvan omvatte 13 miljoen individuen, verspreid over gemiddeld 11 generaties.

De dataset geeft aan wanneer en waar elk individu is geboren en stierf, en weerspiegelt de demografie van Geni.com-p[ersonen, met 85 procent van de profielen afkomstig uit Europa en Noord-Amerika. De onderzoekers hebben vastgesteld dat de dataset representatief was voor verschillende demografische en sociaaleconomische parameters. Ze controleerden bijvoorbeeld een deelverzameling van de Vermont Geni.com-profielen tegen het gedetailleerde overlijdensregister van de staat en vonden een zeer goede consistentie tussen het opleidingsniveau van de Vermont-profielen in Geni.com en de rest van de bevolking van Vermont. Deze waarneming suggereert dat de gegevens de algemene Amerikaanse bevolking weerspiegelen.

Het team ontdekte dat de industrialisatie het gezinsleven ingrijpend veranderde. Vóór 1750 vonden de meeste Amerikanen een echtgenoot binnen zes mijl van hun geboorteplaats, maar voor degenen die in 1950 waren geboren, had die afstand zich tot ongeveer 60 mijl uitgestrekt. Vóór 1850 was trouwen in het gezin gebruikelijk – gemiddeld trouwde neef en nicht met elkaar, vergeleken met de zevende neven van vandaag. Vreemd genoeg ontdekten ze dat mensen tussen 1800 en 1850 verder dan ooit reisden om een ​​partner te vinden – bijna 12 mijl gemiddeld – maar eerder een neef of dichterbij zouden trouwen. Hun hypothese is dat veranderende sociale normen, in plaats van toenemende mobiliteit, ertoe kunnen leiden dat mensen nabestaanden als huwelijkspartners hebben geschuwd. In een verwante waarneming constateerden ze dat vrouwen in Europa en Noord-Amerika de voorbije 300 jaar meer dan mannen gemigreerd zijn, maar toen mannen toch migreerden, reisden ze gemiddeld aanzienlijk verder.
 

Ze concludeerden ook dat goede genen voor een lange levensduur slechts iemands leven met gemiddeld vijf jaar kunnen verlengen. Veelbetekenend, ze toonden ook aan dat de genen die de levensduur beïnvloeden onafhankelijk handelen in plaats van interactie met elkaar, en dat erfelijkheid een vrij kleine rol speelt in de algemene levensduur; milieu- en leefstijlfactoren hebben een grotere impact op hoe lang mensen leven.