-

πŸ› OCR-D-GT-Ruleset

+

πŸ“œ OCR-D-GT-Ruleset

-
Das OCR-D-GT-Ruleset ist ein Regelsatz, der verschiedene Schreibweisen von Buchstaben - in - verschiedenen Level der Transkription dokumentiert. Es sind drei Level vorgesehen: +
+

OCR-D-GT-Ruleset Transkription

-
    - -
  • Die erste Spalte enthΓ€lt die Schreibweise, die spezifische drucktechnische - Aspekte und typographischen Besonderheiten nicht beachten (Level 1).
  • - -
  • die zweite Spalte enthΓ€lt die Schreibweise, die Drucktechnischen - Gegebenheiten wiedergeben und eine Interpretation von Zeichen orientiert - sich am Gebrauch im Sprach- und Schriftsystem (Level 2).
  • - -
  • die dritte Spalte enthΓ€lt die Schreibweise, die eine Interpretation von - Graphen vollstΓ€ndig unterlΓ€sst. Der Graph wird als ein Codepoint unter - Nutzung von standardisierten Kodierungen (Unicode), communitynormierten - Kodierungen (MUFI) und durch das Koordinierungsgremium festgelegten Kodierungen - abgebildet (Level 3).
  • -
-
- -

-            {"ruleset":[    
-               {"rule": ["a","a","a"], "type": "level"},
-               {"rule": ["aa","ã","ã"], "type": "level"},
-               {"rule": ["e","e","e"], "type": "level"}
-                        ]
-            }
-            
- -

Das OCR-D-GT-Ruleset wird im JSON-Format gespeichert.

- -

Das OCR-D-GT-Ruleset-JSON-Schema entspricht der Version 2020-12.

- -
    + $("body").append($temp); + var a = $(element).html().trim().replace(/
    /g, '\n').replace(/<\/?[^>]+>/g, ''); + var x = htmlDecode(a); + $temp.val(x).select(); + document.execCommand("copy"); + $temp.remove(); + } +
    {"ruleset":[
    +             {"rule": ["a","a","a"], "type": "level"},
    +             {"rule": ["aa","ã","ã"], "type": "level"},
    +             {"rule": ["e","e","e"], "type": "level"}
    +            ]
    +}
    +
+ +
Das Ruleset im XML-Format:
<levelrules>
+  <ruleset>
+    <range>AlphPresForm</range>
+    <rule>ff</rule>
+    <rule>ff</rule>
+    <rule>ff</rule>
+    <type>level</type>
+  </ruleset>
+</levelrules>
Das Element <range> ist ein optionales + Element. In den Rulesets, die auf dem MUFI Datenset basieren ist dieses Element zu + finden.
+ + -
  • OCR-D-GT-Ruleset-JSON-Schema
  • + -