Re: einfaches dokumentanarchiv

Startseite
Anhänge:
Nachricht
+ (text/plain)
+ OpenPGP_0x09790B7F404ACC18.asc (application/pgp-keys)
+ OpenPGP_signature (application/pgp-signature)
Nachricht löschen
Nachricht beantworten
Autor: Ralph Lindner
Datum:  
To: list
Betreff: Re: einfaches dokumentanarchiv
Am Di.. 05.01.2021 um 12:32 schrieb Sven Velt:
> In wie fern kann Nextcloud bei OCR, Tagging und dann danach suchen
> helfen? Da ist mein Nextcloud-Wissen einfach zu gering...


Meiner Meinung nach gehören sowohl Textinformationen (Content) als auch
Beschreibung und andere Metadaten in das Dokument und nicht in eine
externe Datenbank (zumindest nicht als Ursprung der Daten). Dafür gibt
es ja auch den PDF Archivstandard PDF/A
(https://de.wikipedia.org/wiki/PDF/A). Was man bräuchte ist eine
Funktionalität der Nextcloud, welche die Metadaten der PDF/A ausliest
und für eine schnelle Suche aufbereitet. Keine Ahnung, ob es so was gibt
- würde mich aber brennend interessieren.
Für Bilder bräuchte man ebensolches - auch da gibt es Metadaten, die für
eine Indizierung ausgelesen und aufbereitet werden sollten.
Und dann bräuchte man - bei professionellem Einsatz und höherem
Dokumentanfall - noch eine Möglichkeit automatisisert die PDF-Metadaten
zu generieren - aber das ist eine andere Baustelle.

Da auch ich noch nicht so weit bin (archiviere über eine simple
Ordnerstruktur mit sprechenden Dateinamen) würde mich eine solche
Schnittstelle zu einer erweiterten NextCloud-Suchfunktion auch sehr
interessieren.

Zusätzlich kann man auch jetzt schon einfach manuell Tags in Nextcloud
einsetzen.
Ich wundere mich, dass ihr anscheinend noch so viel Papier in eurem
Dokumenteingang habt. Ich erhalte Rechnungen fast ausschließlich als PDF
mit Textcontent. Mehr als 2mal scanne ich keine Dokumente mehr im Monat,
so dass sich das Einschalten des Scanners dafür kaum lohnt. (Mache ich
mit CamScanner am Handy).

Viele Grüße
Ralph