Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Transkription/Notation des Kürzungs- bzw. Notationsstrichs #86

Open
cthomasdta opened this issue Feb 26, 2020 · 7 comments
Open

Transkription/Notation des Kürzungs- bzw. Notationsstrichs #86

cthomasdta opened this issue Feb 26, 2020 · 7 comments

Comments

@cthomasdta
Copy link
Member

cthomasdta commented Feb 26, 2020

Gibt es hierzu starke Meinungen, z.B. @StefanDumont ?:

Der Kürzungs- oder Geminationsstrich wird im ehd-Korpus durchgehend mit dem Unicode-Zeichen „U+0305 COMBINING OVERLINE“ notiert, vgl. https://edition-humboldt.de/richtlinien/frameworks/basis/text/symbole_ehd.html?hl=Geminationsstriche. Dies ist abweichend von der DTA-Konvention, die „U+0303 COMBINING TILDE“ zur Wiedergabe dieses Zeichens vorschlägt, vgl. http://www.deutschestextarchiv.de/doku/basisformat/trNasalstrich.

Hintergrund dieser Entscheidung könnte die Überlegung sein, dass die „COMBINING TILDE“ gemäß Unicode-Spezifikation durchaus als Nasalstrich verwendet werden kann, jedoch eher im Bereich der IPA- und Sprachnotation (Betonungszeichen), während die „COMBINING OVERLINE“ demgegenüber neutraler einen „overscore“, ‚Überstrich‘, beschreibt. Die Funktion des Zeichens als Abkürzungsstrich wird durch die Auflösungspraxis dokumentiert, indem z. B. „Son̅e“ zu „Sonne“ dokumentiert aufgelöst werden kann.

Innerhalb des DTA-Korpus müssen dagegen einfache Verdopplungen wie „n̅“ zu „nn“ oder „m̅“ zu „mm“, aber auch Kürzungen wie "ſonnẽſchein" zu "Sonnenschein", nicht manuell vorgenommen werden, sondern werden durch die computerlinguistische Analyse erkannt und für die Suche und weitere Textverarbeitung automatisch expandiert. Insofern wäre es nicht ganz ohne, auch im DTA U+0305 anstelle von U+0303 zu verwenden, weil dann auch die Expansion umgestellt werden muss. Aber das ist ein nachgeordnetes Problem, sollten wir alle als Steuerungsgruppe diese Änderung sinnvoll finden.

Zur derzeitigen Verwendung im DTA-Korpus siehe
U+0303: http://kaskade.dwds.de/dstar/dta/dstar.perl?fmt=kwic&corpus=&limit=100&ctx=8&q=%24u%3D%2F%5Cx%7B0303%7D%2F&_s=submit
vs. U+0305: http://kaskade.dwds.de/dstar/dta/dstar.perl?fmt=kwic&corpus=&limit=100&ctx=8&q=%24u%3D%2F%5Cx%7B0305%7D%2F&_s=submit

@textloop
Copy link
Collaborator

Keine starke Meinung und auch nur eine Tendenz, die ich beobachtet habe: Projekte, in denen mir das bisher begegnet ist, haben in solchen Fällen als Abkürzungszeichen „U+0303 COMBINING TILDE“ genutzt.

@cthomasdta
Copy link
Member Author

Keine starke Meinung und auch nur eine Tendenz, die ich beobachtet habe: Projekte, in denen mir das bisher begegnet ist, haben in solchen Fällen als Abkürzungszeichen „U+0303 COMBINING TILDE“ genutzt.

Rückfrage, wie siehst du das: Ist es möglich, dass diese sich in dem Punkt an den DTA-Richtlinien orientiert haben oder sind es ganz unabhängig davon entstandene Festlegungen?

BTW: Fontane-Notizbücher nutzt übrigens <g ref="#mgem">mm</g>, aber das erscheint mir persönlich unnötig umständlich.

@textloop
Copy link
Collaborator

Könnte schon sein, ja. Aber in den Vorlagen sieht es oft auch einfach mehr nach einer Tilde aus.

@cthomasdta
Copy link
Member Author

Ok, danke! Dann müssen das die Typographie(-Geschichte)-Expert*innen entscheiden (kann ja sein, dass damals schon in Ermangelung des 'richtig(er)en' Zeichens die Tilde aus dem Setzkasten gegriffen wurde). Also @StefanDumont, Frederike et al.

@textloop
Copy link
Collaborator

textloop commented Mar 23, 2020

Vielleicht wird aber auch nur auf die Tilde zurückgegriffen, weil sie allein in anderen Zusammenhängen auch als ein Abkürzungszeichen/Auslassungszeichen stehen kann.

Genau, auf das Urteil der Experten bin ich da auch gespannt!

@cthomasdta
Copy link
Member Author

Link auf ehd-Richtlinien korrigiert, danke @susannehaaf für den Hinweis. Ich würde mich freuen, wenn wir das beim nächsten Treffen der SG besprechen könnten.

@susannehaaf
Copy link
Member

Beschluss DTABf-SG: Tilde einheitlich verwenden; Overline optional; entsprechend im teiHeader dokumentieren

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

3 participants