Gemeinsame Normdatei | |
---|---|
| |
Gründung | 2012 |
Bestand | 8630754[1] (Stand: Juni 2020) |
Ort | Frankfurt am Main |
ISIL | DE-588 |
Betreiber | Deutsche Nationalbibliothek u. a. |
Die Gemeinsame Normdatei (GND) ist eine Normdatei für Personen, Körperschaften, Kongresse, Geografika, Sachschlagwörter und Werktitel, die vor allem zur Katalogisierung von Literatur in Bibliotheken dient, zunehmend aber auch von Archiven, Museen, Projekten und in Web-Anwendungen genutzt wird. Sie wird von der Deutschen Nationalbibliothek (DNB), allen deutschsprachigen Bibliotheksverbünden, der Zeitschriftendatenbank (ZDB) und zahlreichen weiteren Institutionen kooperativ geführt. Normdaten erleichtern die Katalogisierung, bieten eindeutige Sucheinstiege und die Möglichkeit der Vernetzung unterschiedlicher Informationsressourcen.
Die GND löste am 19. April 2012 die bis dahin getrennt geführten Normdateien Personennamendatei (PND), Gemeinsame Körperschaftsdatei (GKD), Schlagwortnormdatei (SWD) und die Einheitssachtitel-Datei des Deutschen Musikarchivs (DMA-EST-Datei) ab. Seit Juli 2014 werden die Normdaten nach den RDA-Regeln erfasst, die unter anderem auch von der Library of Congress verwendet werden.[2]
Die Gemeinsame Normdatei wurde von 2009 bis 2012 in einem gemeinsamen Projekt der Deutschen Nationalbibliothek, der deutschsprachigen Bibliotheksverbünde sowie der Zeitschriftendatenbank entwickelt. Ziel des Projekts war die Zusammenführung der bisher getrennt geführten Normdateien GKD, PND und SWD sowie der DMA-EST-Datei. Dabei sollten ein gemeinsames Datenformat realisiert und die vorhandenen Regelwerksunterschiede harmonisiert werden.
Der Erstellung von Normdatensätzen lagen früher unterschiedliche Regelwerke zugrunde. Dies waren die „Regeln für die alphabetische Katalogisierung“ (RAK-WB und RAK-Musik) für die Formalerschließung sowie die „Regeln für den Schlagwortkatalog“ (RSWK) für die Inhaltserschließung. Die uneinheitlichen Regeln zur Bildung der Vorzugsbenennung für die Formal- und Inhaltserschließung führten insbesondere im Bereich Körperschaften, Kongresse und Geografika zu redundanten Datensätzen in der GKD und der SWD. Daher wurden für die GND für die Fälle, in denen die Regeln der Formal- und Inhaltserschließung voneinander abweichen, Übergangsregeln erarbeitet, die eine gemeinsame Nutzung der Normdatensätze ermöglichen. Die Übergangsregeln berücksichtigten so weit wie möglich bereits die Regelungen der RDA (Resource Description and Access).
Auch die Datenformate der Normdateien, sowohl die Internformate als auch die Austauschformate, unterschieden sich teilweise beträchtlich. Das Austauschformat der GND basiert auf MARC 21 Authority. Durch die Zusammenführung aller Normdatensätze in der GND konnten die zuvor bestehenden Formatunterschiede überwunden werden. Bereits vorhandene parallele Datensätze aus den unterschiedlichen Normdateien können jedoch erst im Laufe der Zeit zusammengeführt werden.
Im Projekt Virtual International Authority File (VIAF) wird die GND mit anderen Normdateien virtuell zu einer internationalen Normdatei verbunden.
Die Gemeinsame Normdatei enthält rund 8,7 Mio. Datensätze (Stand: 13. Oktober 2020) folgender Entitätentypen:
Code | Entitätentyp | Datensätze (Juni 2013) |
(2015)[3] | (2016)[4] | (2017)[5] | (2018)[6] | (2019)[7] | (Februar 2020)[8] | (Juni 2020)[9] | (13. Okt. 2020)[10] |
---|---|---|---|---|---|---|---|---|---|---|
p | Personen (individualisiert) | 2.882.000 | (keine Angabe) | (keine Angabe) | (keine Angabe) | (keine Angabe) | (keine Angabe) | 5.251.171 | 5.350.953 | 5.421.947 |
n | Personennamen (nicht individualisiert) | 4.628.000 | (keine Angabe) | (keine Angabe) | (keine Angabe) | (keine Angabe) | (keine Angabe) | 7.046.133 | weggefallen | weggefallen |
-- | Personen und Personennamen (gesamt) | (7.510.000) | 8.669.790 | 10.546.959 | 11.551.274 | 12.032.087 | 12.265.826 | 12.297.304 | (5.350.953) | - |
k | Körperschaften | 1.172.000 | 1.240.852 | 1.498.606 | 1.493.823 | 1.487.938 | 1.490.830 | 1.491.072 | 1.491.358 | 1.490.757 |
v | Konferenzen und Veranstaltungen | 587.000 | 619.610 | 769.067 | 786.180 | 803.612 | 826.579 | 829.548 | 836.410 | 842.725 |
g | Geografika | 293.000 | 289.449 | 295.027 | 300.138 | 305.543 | 310.860 | 311.357 | 313.058 | 314.492 |
s | Sachbegriffe | 202.000 | 205.586 | 207.149 | 209.003 | 211.339 | 212.775 | 212.895 | 213.257 | 213.528 |
w | Werke | 193.000 | 244.480 | 287.204 | 331.310 | 367.574 | 405.899 | 410.736 | 425.718 | 442.181 |
-- | gesamt | (9.957.000) | 11.269.767 | 13.604.012 | 14.671.728 | 15.208.093 | 15.512.769 | 15.552.912 | 8.630.754 | 8.725.630 |
Die hier aufgeführten Entitätentypen entsprechen in Bibliotheken sogenannten Satzarten (Datensatzart).
In der Gemeinsamen Normdatei wird zu jeder Entitätenbeschreibung eine eindeutige Identifikationsnummer (Grundlage für den Uniform Resource Identifier), eine normierte Vorzugsbenennung, abweichende Namensformen und verschiedene beschreibende Attribute verzeichnet. Die Attribute werden möglichst als Relationen zu anderen Normdatensätzen abgelegt, wobei die Art der Beziehung jeweils codiert ist.[11] Beispiele für relationierte Attribute sind Geburts- und Sterbeorte von Personen sowie ihre Berufe. Für Körperschaften können u. a. Vorgänger- und Nachfolgerbeziehungen, aber auch administrative Überordnungen angegeben werden.
Auf diese Weise entsteht ein Netz von miteinander in Beziehung stehenden Datensätzen (Linked Data), das sich besonders für die Nutzung im Web eignet, die Navigation innerhalb der Normdatei erlaubt und somit die Recherchemöglichkeiten für Nutzer verbessert.
Ende August 2019 wurde die Vergabe von Tn-Nummern eingestellt.[12] Ein Jahr später, ab dem 19. Juni 2020, wurden die Verknüpfungen der Tn in den Titeldaten rückwirkend gelöst. Statt der Verknüpfungen gibt es nur noch Textstrings. Seit Juli 2020 sind die Namensdatensätze nicht mehr Bestandteil der Gemeinsamen Normdatei.[13]
Abgesehen von Personennamen kann jede Satzart durch die Angabe eines Entitätencodes[14] in sich weiter differenziert werden. So kann ein Geografikum beispielsweise ein Bauwerk oder ein Staat sein. Insgesamt stehen rund 50 Entitätentypen zur Verfügung.
Code | Definition[15] |
---|---|
g | Geografika |
gib | Bauwerke und Bauensembles, Monumentalplastiken, Denkmäler, Grabmäler u. ä. gemäß RSWK §730,1 |
gif; gik | Gliedstaaten (sie werden immer mit „gik“ doppelt codiert) |
gik | Gebietskörperschaften und Verwaltungseinheiten |
gil; gik | Länder, Staaten (selbstständig) (sie werden immer mit „gik“ doppelt codiert) |
gin | Natürliche geografische Einheiten, biogeografische und paläografische Einheiten, Namen von geografischen Teileinheiten mit Himmelsrichtung bzw. mit anderen Wendungen gemäß RSWK § 205, 1 und 2 |
gio | Kleinräumige Geografika innerhalb eines Ortes, ausgenommen Bauwerke und Bauensembles |
gir; gik | Geistliche Reichsfürstenrtümer (bis 1803), Verwaltungseinheiten der Ostkirche (sie werden immer mit „gik“ doppelt codiert) |
giv; gik | Verwaltungseinheiten, die gemäß der EH-G-03 einen instantiellen Oberbegriff von dem Gattungsbegriff der Verwaltungseinheit bekommen (sie werden immer mit „gik“ doppelt codiert) |
giw | Grenzen, Wege, Linien |
gix | Estraterrestrika |
giz | Alle geografischen Namen, die sich keinem der anderen Entitäten-Untertypen zuordnen lassen, Regionen und Gebiete gem. RSWK § 204a, einschließlich des Umlands einzelner Städte und Gemeinden |
gxz | Fiktive Orte |
k | Körperschaften |
kif | Firmen (ab Januar 2016) |
kim | Musikalische Körperschaften (ab Januar 2016) |
kio | Organe von Gebietskörperschaften |
kip | Projekte und projektähnliche Vorhaben und Programme |
kiv; kir | Religiöse Verwaltungseinheiten (z. B. Diözesen der Katholischen Kirche; Ausnahme: Verwaltungseinheiten der Ostkirche, Verwaltungseinheiten der Ostkirche werden mit „gir“ und „gik“ codiert) (sie werden immer mit „kir“ doppelt codiert) (ab Januar 2016) |
kiz | Alle übrigen Körperschaften, die keinem anderen speziellen Entitätentyp zugehören |
kxz | Fiktive Körperschaften |
p | Personen |
pif | Familien |
pik | Regierende Fürsten, Mitglieder regierender Fürstenhäuser |
pip | Pseudonyme |
pis | Sammelpseudonyme |
piz | Personennamen, die keinem anderen speziellen Entitätentyp zugehören |
pxg | Götter |
pxl | Literarische Gestalten, Sagengestalten |
pxs | Geister |
s | Sachbegriffe |
sab; saz | Musikalische Besetzung (gemäß RDA 6.15) (sie werden immer mit „saz“ doppelt codiert) (ab Januar 2016) |
sad; saz | Datenträger (gemäß RDA 3.4.1.3 D-A-C-H) (sie werden immer mit „saz“ doppelt codiert) |
saf; saz | Formangaben zu Art des Inhalts (gemäß RDA 7.2.1.3 D-A-C-H) (sie werden immer mit „saz“ doppelt codiert) |
sag; saz | Musikalisches Genre (gemäß RDA 6.14.2.5.2 D-A-CH) (sie werden immer mit „saz“ doppelt codiert) (ab Januar 2016) |
sam; saz | Musikalische Ausgabeform (gemäß RDA 7.20.1.3 D-A-C-H) (sie werden immer mit „saz“ doppelt codiert) |
saz | Allgemeinbegriffe, d. h. alle Sachschlagwörter, die keinem anderen speziellen Entitätentyp zugehören |
sie | Ethnografika |
sif | Verkehrsmittel mit Individualnamen |
sih | Historische Einzelereignisse |
sip | Produkte und Markennamen außer Softwareprodukte („siw“) |
sis | Sprachen |
siu | Personengruppen, die keine Körperschaft sind |
siw | Softwareprodukte |
siz | Alle individuellen Sachverhalte, die als Sachbegriffe erfasst werden und sich keinem der anderen Entitäten-Untertypen zuordnen lassen, z. B. Wettbewerbe |
slz | Buchstaben, Morpheme, Wörter als Gegenstand linguistischer Untersuchungen |
snz | Nomenklatur Biologie – Chemie |
sxz | Fiktive Sachbegriffe |
szz | Alle Zweifelsfälle für alle Entitäten |
u | |
uiz | Unkörperschaften (nur in Altdaten) |
v | Konferenzen und Veranstaltungen |
vie | Konferenzen, Veranstaltungen |
vif | Konferenzfolgen bzw. -reihen, Veranstaltungsfolgen bzw. -reihen w |
w | Werke |
wid | Druckermarken |
wie | Expression |
wif | Fassung eines Werks der Musik (ab Juli 2014 nicht mehr verwendet) |
wim | Werke der Musik |
win | Sammlungen |
wip | Provenienzmerkmale |
wis | Schriftdenkmäler |
wit | Werke |
Die Gemeinsame Normdatei wird bei der Deutschen Nationalbibliothek gehalten. Die Bibliotheksverbünde haben den GND-Grundbestand einmalig in ihre Verbundsysteme eingespielt und beziehen seitdem die Aktualisierungen der Normdatei über das OAI-Verfahren. Die GND wird nicht nur von Bibliotheken, sondern auch von Archiven (bisher v. a. von wissenschaftlichen und Literaturarchiven), Museen und Redaktionen von Nachschlagewerken bearbeitet und erweitert. Die Mitarbeit erfolgt entweder über Bibliotheksverbünde oder nach Absprache mit der Deutschen Nationalbibliothek. Die Nutzung durch staatliche und kommunale Archive läuft (Stand 2015) erst an.
Die GND-Normdaten stehen auf der Webseite der DNB in den Formaten MARC 21 Authority, MARC21-xml und RDFxml entgeltfrei unter der Lizenz CC0 1.0 zur Verfügung.
Im Dezember 2012 wurde unter dem Namen Institutionenübergreifende Integration von Normdaten (IN2N) ein Kooperationsprojekt zwischen der Deutschen Nationalbibliothek (DNB) und dem Deutschen Filminstitut (DIF) gestartet. Ziel des von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projektes ist es, Institutionen außerhalb des Bibliothekswesens bei der Nutzung der GND zu unterstützen und in die Erschließung einzubeziehen.[16] Unter anderem wurden im Rahmen des Projektes bereits die Datensätze aus filmportal.de mit den Personenartikeln aus Wikipedia abgeglichen.[17]
Ende 2014 wurden die Normdaten des DIF in die GND eingespielt. In den Monaten davor wurden unter anderem bereits Daten des Ibero-Amerikanischen Instituts (Berlin) und der Forschungsstelle Osteuropa an der Universität Bremen in die GND übernommen. Seit dem 6. Mai 2016 können Wikipedianer, die an einer entsprechenden Schulung teilgenommen haben, über das „GND-Webformular“ Normdaten für Personen anlegen. Die dazugehörige Bibliothekskennung lautet Wikimedia Deutschland (DE-B1592).
Kategorien: Normdatei | Werk unter einer Creative-Commons-Lizenz | Bibliothekswesen | Deutsche Nationalbibliothek