Warum der Austausch von Daten zwischen den Programmen einfach nicht richtig funktioniert.

Gleich zu Anfang gesagt:

Dies ist ein Kommentar meinerseits. 

Das heißt, ich spreche hier nicht für das Team von GES-2000, sondern er stellt ausschließlich meine Meinung dar.

Immer wieder müssen wir feststellen, dass es bei dem Import von GedCom-Dateien zu Problemen kommt.

Klar, werden jetzt viele sagen. GES ist schuld.

Aber so einfach ist es nicht.

Dazu sollte man zunächst einmal wissen was GedCom eigentlich ist.

Deshalb zunächst erst einmal etwas Erklärung um zu verstehen wozu es dient und wo die Fallstricke liegen.

 

Schauen wir doch mal nach, was uns das GenWiki dazu sagt

GedCom - Der Versuch einer Definition / Zitate mit Kommentaren

GEDCOM (engl. GEnealogical Data COMmunication) ist die Spezifikation eines Datenformates, das den Austausch von Daten zwischen verschiedenen Computerprogrammen zur Genealogie (Ahnenforschung) ermöglicht.

Wikipedia

Eigentlich müsste dort stehe, dass es den Austausch ermöglichen sollte.

Viele Genealogieprogramme und genealogische Websites im Internet unterstützen dieses Datenformat.

Wikipedia

Ja. Das stimmt. Aber…

Wer hat's erfunden?

Es wurde von der Kirche Jesu Christi der Heiligen der Letzten Tage (Mormonen) entwickelt, um ihre Mitglieder bei der Familienforschung zu unterstützen.

Und hier kommt der Knackpunkt

Obwohl es als ein „Standard“ entwickelt wurde, legen viele Programmierer den ‚Standard‘ individuell aus. 

Besonders die Programme, die nicht aus Deutschland sind, haben oft eine ‚eigentümliche‚ Interpretation des Standards.

Wo ist der Haken bei den Programmen

Ich werde jetzt hier kein ‚bashing‘ von anderen Programmen machen.
Bestimmte Erfahrungen sollte jeder für sich machen.
Vor Allem was OnLine-Stammbäume angeht, kann man die tollsten Dinge erleben.
Aber von meinen Erfahrungen will ich dennoch einige Punkte ansprechen.

Fehler Nr. 1 den man macht!

Ich bin ehrlich. Als ich vor langer Zeit angefangen habe, habe ich auch diese Programme genutzt.
Doch schon bald habe ich gemerkt, welch ein Fehler es war.
Einige dieser Online-Datenbanken nutze ich heute immer noch.
Allerdings nicht mehr um meine Genealogien zu bearbeiten.
Aber es erleichtert die Forschung in Bezug auf die Suche nach Dokumenten. Es erspart mir den Weg in Archive.
Ich kann Dokumente Online einsehen, und sehr schnell von einem Archiv ins nächste wechseln.
Auch die Kosten halten sich dadurch in Grenzen.
Familienforschung gibt es nicht kostenlos. Auch wenn viele das Glauben.

Ancestry

Es ist so schön einfach. Man muss nur ein paar Personen eingeben; und dann einfach nur abwarten.
Nach kuzer Zeit bekommt man ‚Hinweise‘ zu der Person.
Ein Klick genügt um den Stammbaum zu erweitern.
Doch was man dann bekommt, ist oft nicht das was man braucht.
Einer schreibt vom anderen ab. Und das auch noch ohne wirklich die Quellen zu prüfen.
Oft bekommt man sogar seine eigenen Daten als Hinweis angezeigt.
Wer dann sich nicht die Zeit nimmt nach originalen Quellen zu suchen, kann sehr schnell in eine Falle tappen.

Und wenn man dann die Daten exportiert und sie in sein eigentliches Programm importieren will, wird feststellen, dass solchen Programme nicht um Standards scheren.
Ein gutes Programm lässt ein Datum in dieser Form nicht zu.

myHeritage

Ja, auch das Programm habe ich mal benutzt.
Besonders toll fand ich, dass ich mich 8 Stunden für einen Kunden damit beschäftigen konnte, die GedCom-Datei erst einmal ins GedPad laden zu können.
Denn myHeritage ignoriert den CONT-Tag bei langen Texten wenn sie im Internet eingegeben werden.

Vor Allem werden auch HTML-Tags mit in die GedCom übernommen.
Das macht sich dann besonders gut, wenn man aus seiner Genealogie ein WebSeite generieren will.

CONT {CONTINUED}:= (weitergeführter Text) Ein Indikator, dass weitere Daten zum übergeordneten Wert gehören. Die Information aus dem CONT-Wert muss an den Wert der vorangehenden, übergeordneten Zeile mittels eines Zeilenumbruches angehängt werden. Führende Leerzeichen könnten für die Formatierung des resultierenden Textes wichtig sein. Beim Import von CONT-Werten sollte das lesende Programm nur ein Trennzeichen hinter dem CONT-Kennzeichen annehmen. Alle folgenden Leerzeichen sollen als Teil des Wertes angenommen werden. GEDCOM-Zeilen sind auf 255 Zeichen begrenzt, jedoch können die CONC und CONT-Kennzeichen dazu benutzt werden, ein Feld über dieses Limit hinaus zu verlängern. Eine CONT-Zeile impliziert einen Zeilenumbruch, um die Formatierung zu erhalten. CONC impliziert die Verknüpfung mit dem vorherigen Zeilenwert ohne einen Zeilenumbruch. Dies wird genutzt, um den dynamischen Zeilenumbruch anhand der Größe eines Textfeldes zu ermöglichen, ohne feste Zeilenumbrüche vorzugeben. Die CONT und CONC-Kennzeichen werden genutzt, um textlich angegebene Werte zu erweitern.

Wikipedia

Warum können andere Programme alle GedCom-Dateien importieren?

Schauen wir uns doch mal an, was andere Programme zu einer GedCom-Datei aus myHeritage sagen.
Dies ist ein Ausschnitt aus der Datei, geöffnet mit Notpad++

Diese Meldung kommt von GedPad Pro 2015.

Das Programm kann die Datei gar nicht einlesen.

Besonders hilfreich ist die Aussage zunächst erst mal gar nicht. Sie sagt lediglich aus, das eine neue Zeile ohne gültigen Tag in der Datei enthalten ist.
Um welche Zeile es sich handelt gibt das Programm nicht aus.

Mal sehen wie es bei anderen Programmen aussieht.

Der Family Tree Maker World Express

Das Programm importiert die Daten, gibt aber eine Meldung aus, die besagt es wären 65.879 Fehler aufgetreten.

Wer macht sich schon die Mühe sich die Protokolldatei anzusehen?

Hat doch geklappt. Und die Fehlermeldungen sagen den wenigsten etwas.

Denn das Lesen einer GedCom ist nicht jedermanns Sache.

Was man dabei übersieht…

Es steht im Protokoll dass eine Zeile ignoriert wurde.

Das heißt ganz einfach: Es wurden Daten nicht übernommen.

Wie sieht es dann im Programm selbst aus.

Die Person ist vorhanden. Aber Daten zum Wohnsitz 1935 und Volkszählung 1940 fehlen. Auch die Quellenangaben sind weg.

Heredis

Bei Heredis findet zunächst eine Analyse statt. 

Dabei wird aber nur geprüft ob und wie Tags zugeordnet werden sollen, Orte in welcher Form importiert und übernommen werden sollen.

Der Import dauert länger als bei Ahnenblatt. 

Warum es bei einigen Programmen zu unterschiedlichen Importzeiten kommt, werde ich weiter unten versuchen zu erklären.

Aber auch bei Heredis fehlen die Daten die in der GedCom fehlerhaft sind, wie man in dem Bild erkennen kann. 

Ahnenblatt

Ahnenblatt importiert die Daten recht schnell.

Obwohl danach optional ein Bericht angezeigt werden sollte, wurde dieser mir nicht angezeigt.

Ich nutze im Augenblick lediglich die Testversion. Es kann sein, dass in der Vollversion ein Bericht angezeigt wird.

Aber auch hier werden die falschen Tags ignoriert und somit die Daten nicht übernommen.

Import Einstellungen beziehen sich lediglich auf das Datumsformat.

Aber auch hier werden die falschen Tags ignoriert und somit die Daten nicht übernommen.

Import Einstellungen beziehen sich lediglich auf das Datumsformat.

Über die Plausibilitätsprüfung kann in Bezug auf GedCom zwar das Datumsformat geprüft werden; aber weitere GedCom-Fehler werden nicht angezeigt.

Und auch hier werden die Daten einfach ignoriert.

Wie gesagt.
Dies soll keine Kritik an den genannten Genealogieprogrammen sein.

Ich möchte damit nur demonstrieren wie problematisch es ist Daten von einem Programm zum anderen mit GedCom auszutauschen.

Gerade wenn in einem Programm, und das ist eigentlich bei jedem so, eigene GedCom-Tags verwendet werden.

Um den Verlust von Daten vorzubeugen, ist es sinnvoll sich eine kleine GedCom datei zu erstellen und diese dann mit dem Editor von Windows zu öffnen.

Alle selbst definierten Tags beginnen mit einem Unterstrich ( _ ).

Sollte das Programm, in welches importiert werden soll, die Möglichkeit bieten, dann kann man ja aussuchen in welches Feld die Daten importiert werden sollen.

Fehler Nr. 2 den man macht!

Auch für diesen Fehler gilt …

Ich hab ihn früher auch gemacht.

Immer wieder hört oder liest man die Empfehlung sich jeweils ein Programm zu suchen für:

  • die Eingabe der Daten
  • den Ausdruch als Familienchronik oder Ortsfamilienbuch
  • und eines für den Stammbaumdruck.

Meine ganz klare Meinung dazu:

Das ist gefährlich und leichtsinnig

Denn bei dem ständigen Hin- und Hergetausche gehen auf jeden Fall Daten verloren.

Selbst wenn man sich die Mühe macht vor dem Import die Tags anzupassen – wo will man die Daten denn unterbringen?

Im Notizfeld wäre ja eine Möglichkeit. Aber dann müsste man auch wieder jeden Eintrag nach dem Import überprüfen um die Daten dann auch wieder richtig einzusortieren.

Hat man dann auch noch Medien mit hinterlegt wird das ganze Unterfangen am Ende an der überflüssigen Arbeit scheitern.

Wer schon einmal mehrere Tausend Einträge auf ihre Richtigkeit überprüfen musste weiß wovon ich spreche.

Manchen Fehler macht man nur einmal!

So. Das war es erst einmal. Bestimmt kommt noch mal etwas zu dem Thema.

Schreiben Sie einen Kommentar

Consent Management mit Real Cookie Banner