You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Eventuell sind meine Überlegungen etwas zu viel verlangt und geht nicht mit deiner bisherigen Strategie einher. Aber ich würden einfach mal meine Gedanken mit dir teilen, was mir so die letzten Tage während der YAML Pflege sowie Tests in den Sinn kam.
(Und wie gesagt, ich finde dies ein Hammer Projekt und bin sehr motiviert, meine Dokumentation mit diesem Projekt vollständig zu digitalisieren! Nur ab und an stoße ich noch an meine Grenzen der praktischen Machbarkeit.)
Challenge
Die Pflege der YAML Regeln ist gerade bei vielen unterschiedlichen Fällen recht aufwendig.
Ich laufe immer wieder in das Problem (gerade bei einer komplexeren YAML Datei), dass sich verschiedene Regeln ungewollt überschneiden. D.h. wenn ich den Begriff Rechnung und Mahnung im gleichen Dokument finde, wird die Mahnung z.B. "2023-01-23 - Rechnung Mahnung Handels GmbH" benannt. Oder der Arztbericht eines Arztes beinhaltet den Namen eines weiteren Arztes, dann wird der Arztbericht "2020-06-16 - Arztbericht Chirurgie Mustermann Hausarzt Maier" benannt.
Rahmenbedingungen
Alle Dokumente möchte ich gern gleichermaßen benennen: YYYY-MM-DD - <Dokumentart> <Tag> <Absender>
Dokumentenart und Absender werden nahezu immer definiert. Tags hingegen sind optional und werden wie bisher über YAML Regeln zusätzlich befüllt, wenn entsprechende Begriffe im Dokument gefunden wurden.
Abhängig von der Dokumentenart möchte ich die Dateien in den entsprechenden Zielordner verschieben.
Ich habe unzählige Dokumente verschiedener Art: Rechnungen, Quittungen, Belege, Lieferscheine, Rezepte, Arztberichte, Versicherung, Kontoauszüge, Steuerbescheid, und und und ...
Es gibt unterschiedlichste Absender: Ärzte, Krankenhäuser, Shops, Versicherungen, Banken, etc.
Vorschlag / Feature Request
Die Syntax für die Dokumenten-Umbenennung könnte weiterhin über das Profil geschehen:
Für Dokumentenart sowie Absender sollten jeweils eine Variable existieren: z.B. §doctype, §sender
Dokumentenart: Ideal wäre es, wenn ich für die Dokumentenart eine einfache Allow-List definieren könnte *. Eventuell sollte hier auch noch der targetfolder definiert werden, z.B.
(Rechnung OR Liquidation) Rechnung [/Ausgaben/Rechnungen]
(Quittung) Quittung [/Augaben/Quittungen]
(Beleg) Beleg [/Ausgaben/Belege]
(Lieferschein) Lieferschein [/Ausgaben/Lieferschiene]
(Rezept AND Arznei) Rezept [/Gesundheit/Rezepte]
(Arztbericht OR Befund) Arztbericht [/Gesundheit/Berichte]
(Laborbericht OR Labordatenblatt) Laborbericht [/Gesundheit/Berichte]
(Überweisungsschein) Laborbericht [/Gesundheit/Berichte]
...
Als Dokumentenart kann natürlich nur EINE bestimmte definiert werden. Da es vorkommen kann, dass in einem Dokument Suchstrings unterschiedlicher Dokumentenarten vorhanden sind, müsste man z.B. die Anzahl der Findings zählen und die höhere Anzahl gewinnt ODER das erste Finding gewinnt. Das gleiche könnte gelten für den Absender.
Absender: Bei dem Absender würde gern selbst einen kurzen und sprechenden Namen vergeben können, welcher beim Dateinamen verwendet wird, z.B. Augenarzt Müller, Dermatologie Schulze, Hausarzt Maier, Hotel Mercure, Charité Berlin, etc.
Wenn es ein Shop ist, dann schreibe ich den Namen des Shops (ggf. aber anders als im Dokument erkannt)
Ideal wäre es, wenn ich für die Dokumentenart eine einfache Allow-List definieren könnte *, z.B.
(Dr. med. Müller OR August Müller) Augenarzt Müller
(Dr. AND Schulze OR Dermatologie Schulze)
(Dipl.-med Johanna Maier) Hausarzt Maier
(Labor AND Berlin Nord) Labor Berlin Nord
(Charité AND Universitätsmedizin Berlin) Charité Berlin
(Media Markt) Media Markt
(Tchibo GmbH AND Bremen) Tchibo
(Hornbach Baumarkt GmbH) Hornbach
(Intersport AND GmbH) Intersport
(amazon.de OR Amazon) Amazon
(Hôtel Mercure OR mercure.com) Hotel Mercure
...
Als Absender darf natürlich nur EINER definiert werden. Bei mehreren Findings sollte die gleiche Regel wie bei der Dokumentart (s.o.) angewendet werden.
* Die Allow-List wäre deutlich einfacher zu pflegen statt der aufwendigen Regeln in YAML Syntax.
Vorangestellt in der Allow-List sollte man auch einfach per AND / OR Operatoren die Suchstrings definieren können), wobei ich vorangestellt die suchstrings definieren kann.
Die Allow-List könnte vielleicht auch als Textdatei oder Datenbank ausgelagert werden.
Benefit / Vorteile
Mit diesem Konzept könnte vielleicht die Komplexität aus der YAML Regeldatei herausgezogen und in eine eigenständige Auflistung für Dokumententypen / Absendern aufgebaut werden (die auch einfacher zu pflegen sein sollte). Ich könnte mir vorstellen, dass nach langer Zeit die Absender Liste auf über 1000 Einträge anwachsen könnte. Das ist mit den YAML Regeln m.E. kaum zu bewältigen. Und die Allow-Lists könnte man auch viel einfacher teilen oder von einer Synology auf eine andere übertragen (anstatt der individuellen YAML).
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
-
Hallo Stephan,
Eventuell sind meine Überlegungen etwas zu viel verlangt und geht nicht mit deiner bisherigen Strategie einher. Aber ich würden einfach mal meine Gedanken mit dir teilen, was mir so die letzten Tage während der YAML Pflege sowie Tests in den Sinn kam.
(Und wie gesagt, ich finde dies ein Hammer Projekt und bin sehr motiviert, meine Dokumentation mit diesem Projekt vollständig zu digitalisieren! Nur ab und an stoße ich noch an meine Grenzen der praktischen Machbarkeit.)
Challenge
Rahmenbedingungen
Rechnungen
,Quittungen
,Belege
,Lieferscheine
,Rezepte
,Arztberichte
,Versicherung
,Kontoauszüge
,Steuerbescheid
, und und und ...Vorschlag / Feature Request
Dokumentenart
sowieAbsender
sollten jeweils eine Variable existieren: z.B.§doctype
,§sender
* Die Allow-List wäre deutlich einfacher zu pflegen statt der aufwendigen Regeln in YAML Syntax.
Benefit / Vorteile
Mit diesem Konzept könnte vielleicht die Komplexität aus der YAML Regeldatei herausgezogen und in eine eigenständige Auflistung für Dokumententypen / Absendern aufgebaut werden (die auch einfacher zu pflegen sein sollte). Ich könnte mir vorstellen, dass nach langer Zeit die Absender Liste auf über 1000 Einträge anwachsen könnte. Das ist mit den YAML Regeln m.E. kaum zu bewältigen. Und die Allow-Lists könnte man auch viel einfacher teilen oder von einer Synology auf eine andere übertragen (anstatt der individuellen YAML).
Was denkst du darüber?
Beta Was this translation helpful? Give feedback.
All reactions