Abgleich der Konzepte in Schema und Doku
Um zu prüfen, für welche Konzepte in der Doku noch Lücken bestehen, hatten wir ja einen kurzen Abgleich geplant. Hier mein Vorgehen:
- Konzepte holen aus der Doku: heuristisch mit
grep -o 'xml:id="[[:alnum:]]*"' heiEDITIONS_taxonomy.xml | sort -u | sed s/xml:id=//g | tr -d '"' > output-taxonomy.txt
(Datei:output-taxonomy.txt) - Konzepte aus dem Schema mit
grep -o 'hc:[[:alnum:]]*' tei_hes.rng | sort -u | sed s/hc://g > output-tei_hes_rng.txt
(Datei:output-tei_hes_rng.txt) - und darauf ein
diff -y --color output-taxonomy.txt output-tei_hes_rng.txt
Hier die Ausgabe ohne Farbe: diff.txt Wir haben sowohl Konzepte, die in der Doku fehlen; als auch solche, die nicht im RNG-Schema sind. Da müssen wir also noch einmal prüfen, bevor ich ein Shellskript daraus bastele.