Reihe „Digitale Werkzeuge“: OpenRefine

In dieser Reihe stellen wir digitale Hilfsmittel vor, die für die Arbeit an der Universität Erfurt nützlich sein können – für die Forschung, kollaboratives Arbeiten oder die (Selbst)Organisation. Bei Fragen rund um diese Themen steht Ihnen die Koordinatorin für Digital Humanities der Universität Erfurt zur Verfügung, deren Büro in der Universitätsbibliothek angesiedelt ist (https://www.uni-erfurt.de/bibliothek/forschungsunterstuetzende-dienste/digital-humanities/).

Heute geht es um

OpenRefine

– ein interaktives Tool zur Bereinigung und Aufbereitung größerer Mengen von Daten. Die Open-Source-Software bietet zahlreiche Möglichkeiten, die größtenteils ohne weitere Programmierkenntnisse in einer tabellenartigen Benutzeroberfläche ausgeführt werden können. Diese hat mit Zeilen und Spalten große Ähnlichkeiten mit Excel-Tabellen (ein „OpenRefine-Projekt“ = eine Tabelle) und stellt verschiedene Arten von Filtern und Facetten zur Verfügung. Das Tool läuft im Browser (auch ohne Internetverbindung) lokal auf dem Rechner.

In OpenRefine können u.a. die Datenformate TSV, CSV, Excel, JSON, XML und RDF verarbeitet werden, außerdem können SQL-Exporte erstellt werden, um die Daten in einer Datenbank weiterzubearbeiten bzw. auszuwerten. Darüber hinaus bietet das Tool die Möglichkeit, die eigenen Daten mit anderen Datenquellen abzugleichen, anzureichern und zu verlinken, z.B. mit Wikidata oder mit der Gemeinsamen Normdatei (GND).

Durch die Arbeit mit OpenRefine bekommt man ein neues Gespür für seine Daten („Exploration“), kann mit ihnen spielen, Inkonsistenzen oder Fehler entdecken.

Hier ein Beispiel für eine Anwendung: Aus einem großen Datenset

  • werden alle leeren Suchanfragen gelöscht
  • werden Leerzeichen am Anfang und Ende der Sucheingabe gelöscht
  • wird der gesamte Text in Kleinbuchstaben umgewandelt.

Alle Operationen geschehen in der Regel nur mit den selektierten Daten. Veränderungen basieren auf einer Kopie des Datensets, so dass sie leicht rückgängig gemacht werden können, Operationsabfolgen können gespeichert und auf andere Datensätze angewendet werden.

OpenRefine ist ein Tool, das bei der Konsolidierung und Transformation von Daten Arbeitsschritte vereinfacht oder bei größeren Datenmengen überhaupt erst ermöglicht.

http://openrefine.org/

https://librarycarpentry.org/lc-open-refine/

https://histhub.ch/histhub-lab-tutorials-zu-openrefine/

Screenshot aus der bisher unpublizierten Abschlussarbeit von Dr. Verena Feistauer im Rahmen der Laufbahnprüfung für Bibliotheksreferendarinnen und Bibliotheksreferendare am Institut für Bibliotheks- und Informationswissenschaft der Humboldt-Universität zu Berlin: „Wie suchen Nutzer*innen wirklich? Eine Analyse der Suchanfragen im Verbund der Öffentlichen Bibliotheken Berlins (VÖBB)“, S. 10, Abb. 1.

 

 

Tag der Bibliotheken

Zum heutigen „Tag der Bibliotheken“ wird zum 20. Mal der Preis „Bibliothek des Jahres“ verliehen. Die Auszeichnung ist der einzige nationale Bibliothekspreis in Deutschland und geht in diesem Jahr an die Zentral- und Landesbibliothek Berlin (ZLB).

Das Konzept der ZLB basiert auf drei Schwerpunkten: Sie ist Ort der Informations- und Wissensversorgung, Arbeitsort der Produktivität und Forum der Stadtgesellschaft. Die Bibliothek reagiert damit konsequent auf die gesellschaftlichen und medialen Veränderungen der heutigen Zeit. Bewertet wurden bei der Auswahl durch die Fachjury unter anderem die Attraktivität der Serviceangebote, Vernetzung und gesellschaftliches Engagement sowie der kreative Einsatz digitaler Möglichkeiten – die Art der Umsetzung in der ZLB kann Vorbild für viele andere Bibliotheken sein.

Die UB Erfurt gratuliert herzlich zu dieser besonderen Auszeichnung. Wir wünschen allen Nutzerinnen und Nutzern, die (heute vielleicht besonders zahlreich) in unserem Haus lesen, arbeiten, ausleihen und Fragen stellen, einen schönen „Tag der Bibliotheken“!

Quelle: Zentral- und Landesbibliothek Berlin, https://www.zlb.de/

Studieneinführungstage vom 7. bis 11. Oktober

Wie in jedem Jahr leistet die UB Erfurt auch in diesem Oktober ihren Beitrag zu den Studieneinführungstagen (STET) der Universität. Wir erwarten ca. 1200 Studienanfänger, die von den Mitarbeiterinnen und Mitarbeitern eine Einführung in die Bibliotheksbenutzung erhalten. Zudem stellt die Bibliothek ihre Gruppenarbeitsräume für Tutorenbesprechungen zur Verfügung.
Da es erfahrungsgemäß in diesen Tagen unruhiger als gewöhnlich in der Bibliothek ist, bitten wir alle Benutzerinnen und Benutzer um Verständnis.
Wir wünschen den Erstsemestern einen guten Start ins Studium.