Am Di.. 05.01.2021 um 12:32 schrieb Sven Velt:
> In wie fern kann Nextcloud bei OCR, Tagging und dann danach suchen
> helfen? Da ist mein Nextcloud-Wissen einfach zu gering...
Meiner Meinung nach gehören sowohl Textinformationen (Content) als auch 
Beschreibung und andere Metadaten in das Dokument und nicht in eine 
externe Datenbank (zumindest nicht als Ursprung der Daten). Dafür gibt 
es ja auch den PDF Archivstandard PDF/A 
(
https://de.wikipedia.org/wiki/PDF/A). Was man bräuchte ist eine 
Funktionalität der Nextcloud, welche die Metadaten der PDF/A ausliest 
und für eine schnelle Suche aufbereitet. Keine Ahnung, ob es so was gibt 
- würde mich aber brennend interessieren.
Für Bilder bräuchte man ebensolches - auch da gibt es Metadaten, die für 
eine Indizierung ausgelesen und aufbereitet werden sollten.
Und dann bräuchte man - bei professionellem Einsatz und höherem 
Dokumentanfall - noch eine Möglichkeit automatisisert die PDF-Metadaten 
zu generieren - aber das ist eine andere Baustelle.
Da auch ich noch nicht so weit bin (archiviere über eine simple 
Ordnerstruktur mit sprechenden Dateinamen) würde mich eine solche 
Schnittstelle zu einer erweiterten NextCloud-Suchfunktion auch sehr 
interessieren.
Zusätzlich kann man auch jetzt schon einfach manuell Tags in Nextcloud 
einsetzen.
Ich wundere mich, dass ihr anscheinend noch so viel Papier in eurem 
Dokumenteingang habt. Ich erhalte Rechnungen fast ausschließlich als PDF 
mit Textcontent. Mehr als 2mal scanne ich keine Dokumente mehr im Monat, 
so dass sich das Einschalten des Scanners dafür kaum lohnt. (Mache ich 
mit CamScanner am Handy).
Viele Grüße
Ralph