#1  
Alt 14.11.2021, 09:42
TempusFugit TempusFugit ist offline
Benutzer
 
Registriert seit: 14.11.2021
Beiträge: 29
Standard Software zur Transkription von Dokumenten

Ich habe erst kürzlich mit der Ahnenforschung angefangen und arbeite mich gerade in die altdeutsche Schrift ein, damit ich einige der Familiendokumente übersetzen kann.

Bisher mit Papier und Bleistift, aber da ich mir die Vorgabe gemacht habe, alles digital zu verwalten, suche ich nach einer Lösung hierfür.

Gefunden habe ich bisher Transkribus, was zwar einen sehr guten Eindruck macht, aber offline nicht zu verwenden ist, da alle Dokumente hochgeladen werden müssen. Für mich daher aus Datenschutzgründen nicht nutzbar.

Dann gibt es noch Diptychon, was auch brauchbar aussieht, aber nicht öffentlich zum Download steht; außerdem scheint es seit 2016 ungepflegt.

Wichtig wäre für mich gute Zuordnung der Wörter (evtl sogar Buchstaben) zum Original, zB nebeneinander.

Das mit einer Textverarbeitung zu machen geht bei kürzeren Dokumenten, aber ich habe hier auch alte Verträge mit 8-10 Seiten, und da nervt es, immer herumscrollen zu müssen, um das Bild dem Text zuzuordnen.

Super wäre es, wenn das unter Linux laufen würde.
Mit Zitat antworten
  #2  
Alt 14.11.2021, 10:58
Benutzerbild von kkhno
kkhno kkhno ist offline männlich
Erfahrener Benutzer
 
Registriert seit: 15.07.2011
Ort: Unterfranken, Lk. Würzburg
Beiträge: 239
Standard

Hallo,

schau dir mal GenSciber an. Das Programm ist für nicht-kommerzielle Nutzung kostenlos und es gibt es für Linux und Windows. Es ist recht mächtig, mit Template-Verwaltung und recht großem Funktionsumfang.

Grüße, kkhno
Mit Zitat antworten
  #3  
Alt 14.11.2021, 11:05
Benutzerbild von kkhno
kkhno kkhno ist offline männlich
Erfahrener Benutzer
 
Registriert seit: 15.07.2011
Ort: Unterfranken, Lk. Würzburg
Beiträge: 239
Standard

Ach ja,
da gibt es auch noch Transcript, allerdings nur für Windows. Die letzte Beta-Version von 2020.

Grüße,
kkhno
Mit Zitat antworten
  #4  
Alt 14.11.2021, 11:09
Benutzerbild von LutzM
LutzM LutzM ist offline männlich
Erfahrener Benutzer
 
Registriert seit: 22.02.2019
Ort: Greifswald
Beiträge: 2.048
Standard

Moin,
Transkribus hab ich auch mal versucht. Es ist aber so seltsam in der Bedienung, dass es mit der Einarbeitung sehr mühsam ist. Und für das Gekrakel in den Kirchenbüchern ist es m.M.n. auch nicht zu gebrauchen. Schön geschriebene Briefe mit ausreichendem Zeilenabstand, können ganz gut funktionieren, aber für unsere Zwecke ist es eher nicht zu gebrauchen.

Ich mache aus den Bildern eine pdf und schreibe dann, in anderer Farbe, das über die Wörter, was ich lesen konnte. Sicher nicht das hohe C, aber was besseres ist mir noch nicht eingefallen. Beispiel.
__________________
Lieben Gruß

Lutz

--------------
mein Stammbaum
suche Eising * um 1880 aus/bei Creuzburg/Ostpreußen, sowie (August & Hellmut) Wegner und (Friederike) Lampe * um 1840 aus/bei Kleinzerlang/Prignitz
Mit Zitat antworten
  #5  
Alt 14.11.2021, 11:16
Benutzerbild von kkhno
kkhno kkhno ist offline männlich
Erfahrener Benutzer
 
Registriert seit: 15.07.2011
Ort: Unterfranken, Lk. Würzburg
Beiträge: 239
Standard

Zu dem Thema gab es übrigens in 2016 bereits einen Thread.

kkhno
Mit Zitat antworten
  #6  
Alt 14.11.2021, 13:53
TempusFugit TempusFugit ist offline
Benutzer
Themenstarter
 
Registriert seit: 14.11.2021
Beiträge: 29
Standard

Na da habe ich ja ein paar Sachen zum Testen, danke.
Vielleicht kommt ja was an den Umfang der Erstgenannten heran.
Mit Zitat antworten
  #7  
Alt 14.11.2021, 18:40
KarOrl KarOrl ist offline
Benutzer
 
Registriert seit: 18.10.2020
Beiträge: 75
Standard

Zitat:
Zitat von TempusFugit Beitrag anzeigen
Na da habe ich ja ein paar Sachen zum Testen, danke.
Vielleicht kommt ja was an den Umfang der Erstgenannten heran.
@TempusFugit: Das Ergebnis würde mich interessieren, wie alles, was die Arbeit vereinfacht. Ich kann mir allerdings nicht vorstellen, daß ein Programm die "Klauen" so mancher Standesbeamten bzw. Pfarrer entziffern kann. Aber wer weiß.


Gruß
Mit Zitat antworten
  #8  
Alt 14.11.2021, 21:24
TempusFugit TempusFugit ist offline
Benutzer
Themenstarter
 
Registriert seit: 14.11.2021
Beiträge: 29
Standard

Zitat:
Zitat von KarOrl Beitrag anzeigen
@TempusFugit: Das Ergebnis würde mich interessieren, wie alles, was die Arbeit vereinfacht. Ich kann mir allerdings nicht vorstellen, daß ein Programm die "Klauen" so mancher Standesbeamten bzw. Pfarrer entziffern kann. Aber wer weiß.


Gruß
Mir geht es nicht um eine automatische Texterkennung. Transkribus scheint das nach einem Training zu können, aber dafür habe ich (noch) zu wenige und zu verschiedene Dokumente. Und dann habe ich immer noch Datenschutzbedenken. Mein Ziel wäre es, Zeilen/Wörtern eine Transkription zuzuordnen.
Für alle die Webtrees nutzen: ähnlich dem Faces Plugin, mit dem man Bereiche auf einem Foto einer Person zuordnet.

Mein Testdokument ist ein Protokoll, da es so ziemlich alles abdeckt: teils ein-, teils zweispaltig, verschiedene Schriftgrößen, Druck- und Handschrift, Normal- und Fettschrift und in den Spalten verschieden ausgerichtete Textblöcke.

Das mag etwas zu ambitioniert erscheinen, aber schlechter wäre es nun ein Program zu wählen, und später herauszufinden was nicht geht.

Probiert habe ich (auf die Schnelle) mal GenScriber und Transcript. Bei beiden kann ich den Text nur ein bisschen formatieren, aber richtig zuordnen geht nicht. Zugegeben, eine Zuordnung per Buchstaben wie bei Diptychon ist vielleicht überzogen, aber etwas in die Richtung wäre nett. Andererseits ist das eine Software speziell für die Paläographie; da spielen Details eine wichtige Rolle.

Omeka-S mit Scripto steht noch aus. Da muß ich mir erst eine Test-VM aufsetzen wenn ich wieder ein paar Tage frei habe.

Notfalls kann ich das auch in einem Wiki machen, das ist im Prinzip ähnlich zu GenScriber und Transcript wie ich finde.
Mit Zitat antworten
  #9  
Alt 14.11.2021, 22:18
gki gki ist offline
Erfahrener Benutzer
 
Registriert seit: 18.01.2012
Beiträge: 4.394
Standard

Hallo,

such mal nach "xournal". Damit kann Text "auf" bestehenden PDF speichern. Hab ich mal verwendet. Hat auch funktiniert, aber ich bin dazu übergegangen, kurze Textzusammenfassungen zu erstellen. Weniger Aufwand.
__________________
Gruß
gki
Mit Zitat antworten
  #10  
Alt 15.11.2021, 16:02
TempusFugit TempusFugit ist offline
Benutzer
Themenstarter
 
Registriert seit: 14.11.2021
Beiträge: 29
Standard

So, ich habe mich heute doch noch an Omeka-S mit Scripto versucht und dafür schnell einen Server aufgesetzt.

Leider schlug die Testmöglichkeit fehl, da bei der Konfiguration des Scripto Moduls in Omeka-S die API URL des MediaWikis nicht akzeptiert wurde, obwohl diese korrekt ist. Damit ist das erst mal auf Eis.
Mit Zitat antworten
Antwort

Lesezeichen

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.

Gehe zu

Alle Zeitangaben in WEZ +2. Es ist jetzt 16:46 Uhr.