#1  
Alt 19.03.2021, 14:07
Benutzerbild von DerFalke
DerFalke DerFalke ist offline
Benutzer
 
Registriert seit: 26.02.2021
Ort: Sachsen
Beiträge: 56
Standard Stammbaum-Statistiken

Ich hab mir gedacht, dass es ganz cool wäre wenn man über seine Vorfahren ein paar Statistiken errechnen könnte. (Lebenserwartung, Heiratsalter, häufigste Namen, Orte etc.)

Jetzt kenne ich mich mit Geneanologieprogrammen überhaupt nicht aus und weiß nicht welche Features die schon haben aber ich wette keins hat alle Features, die ich möchte.

Da hab ich mir gedacht, ich kann mir auch selber ein kleines Programm schreiben, dort meine Gedcom-Datei reinschmeißen und mir dann alles berechnen lassen was ich möchte.

Das funktioniert ungefähr so:
  1. Ich sag dem Programm was der Wurzelknoten ist
  2. Das Programm rennt alle direkten Vorfahren der Reihe nach durch und sammelt Daten (Personen, wo die benötigten Daten nicht vorliegen werden übersprungen)
  3. Am Ende spuckt es die Daten aus (als Text)

Was für Daten will ich anzeigen/berechnen:
  1. Nummerierung und Auflistung aller Vorfahren gemäß der gängigen Stammbaumnummerierung (Knoten ist die 1, Vater die 2, Mutter die 3, Großväter die 4 und 6, Großmütter 5 und 7, etc.)
  2. Erkennen von Dopplungen, Mehrfachvorfahren bekommen mehrere Nummern
  3. Anzahl individueller Vorfahren und Anzahl von Dopplungen
  4. Durchschnitt Lebensdauer (männlich, weiblich, gesamt)
  5. Durchschnitt Heiratssalter (männlich, weiblich, gesamt)
  6. Durchschnitt Lebensdauer pro Jahr (damit man damit in Excel oder so eine Diagramm über die Jahrhunderte draus machen kann)
  7. Durchschnitt Heiratsalter pro Jahr
  8. häufigste Vornahmen (männlich, weiblich) => der Teil ist schwierig, weil hier verschiedene Schreibweisen gruppiert werden müssen, das geht nur manuel
  9. analog häufigste Nachnamen

Die meisten Punkte hab ich testweise schon umgesetzt, das ist nicht super kompliziert.

Weitere Ideen, was man evtl. machen könnte, wo ich mir aber noch nicht sicher bin ob das einen Wert hat
  1. Auflistung (oder häufigste) Geburts-, Heiratsorte-, Sterbeorte
  2. Altersunterschiede der Ehepartner
  3. Anzahl Geburts- Heirats-, Todestag damit man sich das als Jahres-Diagramm anzeigen lassen kann wer an welchem Tag Geburtstag hat etc.
  4. jüngste, älteste Person/Heirat
Die Frage ist, was ist noch interessant?

Das Tool würde ich am Ende bei Bedarf zur freien Verfügung stellen, kann es aber nicht versprechen.

Mit Zitat antworten
  #2  
Alt 19.03.2021, 17:17
Lock Lock ist offline
Erfahrener Benutzer
 
Registriert seit: 07.04.2016
Beiträge: 413
Standard

Hallöchen

Ich denke das Thema Statistiken ist vielfältig. Jeder wird für sich einen anderen Schwerpunkt setzen. Es gibt da x Möglichkeiten.
Mich hat beispielsweise einmal die regionale Verteilung bestimmter Vornamen interessiert. Also ein Vorname verknüpft mit dem Geburts- und Tauforten.
In einer Linie waren die "Andreas" gehäuft und in der anderen gab es die nur vereinzelt. Zweck war eigentlich den Suchbereich einzugrenzen um diejenigen, welche sozusagen in der Luft hingen zuordnen zu können.

v.G. Gerhard
Mit Zitat antworten
  #3  
Alt 19.03.2021, 20:06
Benutzerbild von offer
offer offer ist offline
Erfahrener Benutzer
 
Registriert seit: 20.08.2011
Beiträge: 1.590
Standard

Hallo DerFalke!

Zitat:
Zitat von DerFalke Beitrag anzeigen
Ich hab mir gedacht, dass es ganz cool wäre wenn man über seine Vorfahren ein paar Statistiken errechnen könnte. (Lebenserwartung, Heiratsalter, häufigste Namen, Orte etc.)

Jetzt kenne ich mich mit Geneanologieprogrammen überhaupt nicht aus und weiß nicht welche Features die schon haben aber ich wette keins hat alle Features, die ich möchte.
...
Hast Du dir mal mein Programm KAum angesehen?
Da kannst Du dir ja vielleicht einige Anregungen holen und vieles besser machen.

Viel Erfolg bei der Erstellung des Programms. Ich bin schon gespannt auf Dein Ergebnis.
__________________
This is an offer you can't resist!
Mit Zitat antworten
  #4  
Alt 20.03.2021, 10:00
Mismid Mismid ist offline
Erfahrener Benutzer
 
Registriert seit: 21.02.2009
Beiträge: 617
Standard

Ich denke, die genannten Statisken gibt es bei vielen Programmen.
Die Frage ist aber, was man mit der jeweiligen Statistik bezwecken will und welche Aussagekraft diese besitzt.
Man kann natürlich alle möglichen Zahlenwerte irgendwie zusammenstellen.
Man mußt sich dabei auch bewußt sein, wie man die Werte überhaupt ermitteln will. Bildet man einen einfachen Durchschnitt?
Dann sind auch alle Extremwerte (früher Tod durch Unfall, Mord, Krieg usw., falsches Lebensalter durch fehlendes genaues Geburts oder Todesdatum) enthalten.
Das könnte man wiederum durch diverse Statistische Auswertungen anders betrachten (Elimination aus Ausreissern ab einer bestimmten Abweichung). Dafür gibt es auch unzählige Methoden.
Auf der anderen Seite sollte man Daten auch nicht zu wichtig nehmen, denn meistens ist die Aussagekraft sowieso beschränkt. Wahrscheinlich wirst du herausfinden, dass die tatsächliche Lebenswertung irgendwo zwischen 0 und 110 Jahren liegt und steigt je älter man aktuell schon ist ;-)
Mit Zitat antworten
  #5  
Alt 21.03.2021, 10:48
Steinfeld Steinfeld ist offline
Erfahrener Benutzer
 
Registriert seit: 06.08.2016
Beiträge: 131
Standard

Hallo @DerFalke
Wie groß ist Ihre Gedcom-Datei, wie viele Personen beinhaltet sie?
Mit Zitat antworten
  #6  
Alt 21.03.2021, 11:46
Benutzerbild von DerFalke
DerFalke DerFalke ist offline
Benutzer
Themenstarter
 
Registriert seit: 26.02.2021
Ort: Sachsen
Beiträge: 56
Standard

Mir hat mein Tool schon geholfen (und war auch mal wieder eine nette Programmierübung), gerade die Auflistung der Personen mit der Kekula-Zahl und Berechnung des Alters habe ich vorher alles per Hand gemacht, aber bei vielen hundert Vorfahren und diversen Ahnenschwund macht man irgendwann auch Fehler.



Hier im Anhang ist das Tool für Windows, kann gerne getestet werden.
Es ist sehr primitiv aber tut genau das wofür es gedacht war.



@Steinfeld
Meine Datei hat ca. 2800 Personen aber das spielt keine Rolle, das Programm sollte auch wesentlich größere Dateien schaffen, ich seh keinen Grund der dagegen spricht.
Angehängte Dateien
Dateityp: zip windows.zip (1,30 MB, 12x aufgerufen)
Mit Zitat antworten
  #7  
Alt 21.03.2021, 13:02
Steinfeld Steinfeld ist offline
Erfahrener Benutzer
 
Registriert seit: 06.08.2016
Beiträge: 131
Standard

Ich habe meine Gedcom in eine DB gepackt und mittels SQL kann ich alles mögliche auslesen, ohne zu programmieren. Bei 1,4 Mio. Personen packt das außer der DB keine Software.
Mit Zitat antworten
  #8  
Alt 21.03.2021, 14:18
Benutzerbild von DerFalke
DerFalke DerFalke ist offline
Benutzer
Themenstarter
 
Registriert seit: 26.02.2021
Ort: Sachsen
Beiträge: 56
Standard

Nagut, das ist eine andere Hausnummer und auch ein anderer Anwendungsfall.

Grob geschätz sind deine 1,4Mio Datensätze wenige GB an Daten. Das ist eine Menge, die eine vernünftig programmierte Software auch alles im Speicher bearbeiten könnte, das Einlesen der Daten könnte nur paar min dauern...


Aber eine SQL-DB ist da nicht verkehrt, würde ich an deiner Stelle sicher auch so machen. Nur SQL-Queries schreiben ist irgendwo genauso anstrengen wie Code schreiben, das nimmt sich nicht viel.
Mit Zitat antworten
Antwort

Lesezeichen

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.

Gehe zu

Alle Zeitangaben in WEZ +2. Es ist jetzt 06:10 Uhr.