﻿{"id":3886,"date":"2019-11-19T09:55:00","date_gmt":"2019-11-19T08:55:00","guid":{"rendered":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/?p=3886"},"modified":"2019-11-19T14:24:02","modified_gmt":"2019-11-19T13:24:02","slug":"openrefine","status":"publish","type":"post","link":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/openrefine\/","title":{"rendered":"Reihe &#8222;Digitale Werkzeuge&#8220;: OpenRefine"},"content":{"rendered":"<p>In dieser Reihe stellen wir digitale Hilfsmittel vor, die f\u00fcr die Arbeit an der Universit\u00e4t Erfurt n\u00fctzlich sein k\u00f6nnen \u2013 f\u00fcr die Forschung, kollaboratives Arbeiten oder die (Selbst)Organisation. Bei Fragen rund um diese Themen steht Ihnen die Koordinatorin f\u00fcr Digital Humanities der Universit\u00e4t Erfurt zur Verf\u00fcgung, deren B\u00fcro in der Universit\u00e4tsbibliothek angesiedelt ist (<a href=\"https:\/\/www.uni-erfurt.de\/bibliothek\/forschungsunterstuetzende-dienste\/digital-humanities\/\">https:\/\/www.uni-erfurt.de\/bibliothek\/forschungsunterstuetzende-dienste\/digital-humanities\/<\/a>).<\/p>\n<p>Heute geht es um<\/p>\n<h3>OpenRefine<\/h3>\n<p>\u2013 ein interaktives Tool zur Bereinigung und Aufbereitung gr\u00f6\u00dferer Mengen von Daten. Die Open-Source-Software bietet zahlreiche M\u00f6glichkeiten, die gr\u00f6\u00dftenteils ohne weitere Programmierkenntnisse in einer tabellenartigen Benutzeroberfl\u00e4che ausgef\u00fchrt werden k\u00f6nnen. Diese hat mit Zeilen und Spalten gro\u00dfe \u00c4hnlichkeiten mit Excel-Tabellen (ein \u201eOpenRefine-Projekt\u201c = eine Tabelle) und stellt verschiedene Arten von Filtern und Facetten zur Verf\u00fcgung. Das Tool l\u00e4uft im Browser (auch ohne Internetverbindung) lokal auf dem Rechner.<\/p>\n<p>In OpenRefine k\u00f6nnen u.a. die Datenformate TSV, CSV, Excel, JSON, XML und RDF verarbeitet werden, au\u00dferdem k\u00f6nnen SQL-Exporte erstellt werden, um die Daten in einer Datenbank weiterzubearbeiten bzw. auszuwerten. Dar\u00fcber hinaus bietet das Tool die M\u00f6glichkeit, die eigenen Daten mit anderen Datenquellen abzugleichen, anzureichern und zu verlinken, z.B. mit Wikidata oder mit der Gemeinsamen Normdatei (GND).<\/p>\n<p>Durch die Arbeit mit OpenRefine bekommt man ein neues Gesp\u00fcr f\u00fcr seine Daten (\u201eExploration\u201c), kann mit ihnen spielen, Inkonsistenzen oder Fehler entdecken.<\/p>\n<p>Hier ein Beispiel f\u00fcr eine Anwendung: Aus einem gro\u00dfen Datenset<\/p>\n<ul>\n<li>werden alle leeren Suchanfragen gel\u00f6scht<\/li>\n<li>werden Leerzeichen am Anfang und Ende der Sucheingabe gel\u00f6scht<\/li>\n<li>wird der gesamte Text in Kleinbuchstaben umgewandelt.<\/li>\n<\/ul>\n<p>Alle Operationen geschehen in der Regel nur mit den selektierten Daten. Ver\u00e4nderungen basieren auf einer Kopie des Datensets, so dass sie leicht r\u00fcckg\u00e4ngig gemacht werden k\u00f6nnen, Operationsabfolgen k\u00f6nnen gespeichert und auf andere Datens\u00e4tze angewendet werden.<\/p>\n<p>OpenRefine ist ein Tool, das bei der Konsolidierung und Transformation von Daten Arbeitsschritte vereinfacht oder bei gr\u00f6\u00dferen Datenmengen \u00fcberhaupt erst erm\u00f6glicht.<\/p>\n<p><a href=\"http:\/\/openrefine.org\/\">http:\/\/openrefine.org\/<\/a><\/p>\n<p><a href=\"https:\/\/librarycarpentry.org\/lc-open-refine\/\">https:\/\/librarycarpentry.org\/lc-open-refine\/<\/a><\/p>\n<p><a href=\"https:\/\/histhub.ch\/histhub-lab-tutorials-zu-openrefine\/\">https:\/\/histhub.ch\/histhub-lab-tutorials-zu-openrefine\/<\/a><\/p>\n<p><img loading=\"lazy\" class=\"alignnone size-medium wp-image-3887\" src=\"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-content\/uploads\/2019\/11\/OpenRefine_Ott-850x426.jpg\" alt=\"\" width=\"850\" height=\"426\" \/><\/p>\n<p>Screenshot aus der bisher unpublizierten Abschlussarbeit von Dr. Verena Feistauer im Rahmen der Laufbahnpr\u00fcfung f\u00fcr Bibliotheksreferendarinnen und Bibliotheksreferendare am Institut f\u00fcr Bibliotheks- und Informationswissenschaft der Humboldt-Universit\u00e4t zu Berlin: \u201eWie suchen Nutzer*innen wirklich? Eine Analyse der Suchanfragen im Verbund der \u00d6ffentlichen Bibliotheken Berlins (V\u00d6BB)\u201c, S. 10, Abb. 1.<\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>In dieser Reihe stellen wir digitale Hilfsmittel vor, die f\u00fcr die Arbeit an der Universit\u00e4t Erfurt n\u00fctzlich sein k\u00f6nnen \u2013 f\u00fcr die Forschung, kollaboratives Arbeiten oder die (Selbst)Organisation. Bei Fragen rund um diese Themen steht Ihnen die Koordinatorin f\u00fcr Digital <a class=\"more-link\" href=\"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/openrefine\/\">weiterlesen  <span class=\"screen-reader-text\">  Reihe &#8222;Digitale Werkzeuge&#8220;: OpenRefine<\/span><span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":13,"featured_media":3888,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":[],"categories":[1,272,283],"tags":[110,285,284,286],"post_mailing_queue_ids":[],"_links":{"self":[{"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/posts\/3886"}],"collection":[{"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/users\/13"}],"replies":[{"embeddable":true,"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/comments?post=3886"}],"version-history":[{"count":6,"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/posts\/3886\/revisions"}],"predecessor-version":[{"id":3895,"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/posts\/3886\/revisions\/3895"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/media\/3888"}],"wp:attachment":[{"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/media?parent=3886"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/categories?post=3886"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www2.uni-erfurt.de\/bibliothek\/blog\/wp-json\/wp\/v2\/tags?post=3886"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}