Die Idee mit den Extended File Attributes ist ja schön, aber es würde doch den Prinzip einer revisionssicheren Langzeitarchivierung widersprechen, wenn Metadaten in einer nur vom zugrunde liegenden Dateisystem definierten und nicht standardisierten Form vorliegen. So weit ich weiß, ist nicht sichergestellt, dass beim Kopieren auf andere Datenträger die Extended File Attributes erhalten bleiben. Gibt es eigentlich eine Standardisierung? Und wenn ja, wer hat die Absicht, diese zu ignorieren/beachten? Der Weg über PDF/A scheint mir da schon sinnvoller zu sein. Zum Problem der Signierung und der Änderung von Metadaten: Soweit ich die Version 3 verstanden habe, können in dieser Container integriert werden. Was ich jetzt nicht gefunden habe ist eine Antwort auf die Frage, ob die Signierung auf der Ebene der Container erfolgt/erfolgen kann oder nur für die Datei selbst. Wenn ersteres geht, und sich die Metadaten außerhalb des signierten Containers befinden, dann müsste es ja möglich sein die Metadaten der PDF zu ändern so lange man den (signierten) Container nicht antastet. ... oder eben doch Blockchain!!! Das scheint mir tatsächlich ein sinnvoller Anwendungsbereich zu sein :-) Können wir jetzt für diese Diskussion Förderungsmittel der EU beantragen? Aber wir sind nun schon sehr weit vom konkreten Ziel - "wie archiviert man im Kleinbetrieb seine Rechnungen?" - abgehoben. Viele Grüße Ralph Am 05.01.2021 um 13:17 schrieb Sven Velt: > Hio! > > On 05.01.21 12:58, Ralph Lindner wrote: >> Am Di.. 05.01.2021 um 12:32 schrieb Sven Velt: >>> In wie fern kann Nextcloud bei OCR, Tagging und dann danach suchen >>> helfen? Da ist mein Nextcloud-Wissen einfach zu gering... >> >> Meiner Meinung nach gehören sowohl Textinformationen (Content) als auch >> Beschreibung und andere Metadaten in das Dokument und nicht in eine >> externe Datenbank (zumindest nicht als Ursprung der Daten). > > 100% bei Dir! Daher auch die Frage nach den Extended-Attributes, weil > man damit eben auch Meta-Daten an die Datei anhängen kann, ohne die > Datei selbst zu ändern - bei signierten PDF(/A)s kommt es dann nämlich > AFAIK zu Problemen. Und im Regelfall MUSST Du immer irgendwas an > Meta-Daten an eine PDF anhängen. > > Ich gehe allerdings nicht davon aus, dass NextCloud wiederum mit den > ExtAttr des Dateisystems was anfangen kann, selbst wenn man diese direkt > auf dem NextCloud-Server im FS dranklebt... > >> Dafür gibt >> es ja auch den PDF Archivstandard PDF/A >> (https://de.wikipedia.org/wiki/PDF/A). Was man bräuchte ist eine >> Funktionalität der Nextcloud, welche die Metadaten der PDF/A ausliest >> und für eine schnelle Suche aufbereitet. Keine Ahnung, ob es so was gibt >> - würde mich aber brennend interessieren. > > Nicht nur die Metadaten, sondern (siehe meine erste Mail) auch den > Inhalt (ggf. durch OCR durchsuchbar) der PDFs. > >> Und dann bräuchte man - bei professionellem Einsatz und höherem >> Dokumentanfall - noch eine Möglichkeit automatisisert die PDF-Metadaten >> zu generieren - aber das ist eine andere Baustelle. > > Step by Step 😁 > >> [...] >> Ich wundere mich, dass ihr anscheinend noch so viel Papier in eurem >> Dokumenteingang habt. Ich erhalte Rechnungen fast ausschließlich als PDF >> mit Textcontent. Mehr als 2mal scanne ich keine Dokumente mehr im Monat, >> so dass sich das Einschalten des Scanners dafür kaum lohnt. (Mache ich >> mit CamScanner am Handy). > > Inzwischen ist es weniger, aber immer noch genug, dass sich der Aufbau > meiner "Lösung" immer noch rentieren würde... > > Bye > > Sven > > PS: Meine "Lösung" wäre also wenn dann überhaupt der erste Schritt, das > Papier ins PDF mit OCR-Content zu bringen. Den Upload in die NextCloud > könnte man dann aber auch noch automatisieren und dann von da aus > weitermachen. > -- Lindner Agentur ::: Inhaber: Ralph Lindner agentur-lindner.de ::: UST-ID: DE132700454 Mobil 0176 4554 9037 :: Tel. 0911 2879 779 Schußleitenweg 77b ::: 90451 Nürnberg : DE -- Mailing-Liste der Linux User Schwabach (LUSC) e.V. Vor und beim Posten bitte => http://lusc.de/List-Netiquette <= und => http://lusc.de/List-Howto <= beachten. Danke!