Die Meurers – Wie öffnen wir die Datensätze?

Im Juni 2023 ist der Knowledge Graph für den Deutschlandtourismus „ans Netz gegangen“ und spätestens seit dem Tag herrscht eine solide Grundpanik in den deutschen Destinationen bezüglich der Datensätze, genauer gesagt der offenen Datensätze. Es wurde viel Hirnschmalz und Herzblut seitens der ODTA in die Entwicklung gelegt, Systeme wurden von Software- Unternehmen entwickelt und Datenbanken aufgebaut. Nun ist der DACH-Raum weitestgehend technisch gut ausgestattet, aber wie sieht es mit den Inhalten aus? Der neue Sportwagen steht in der Garage bereit, wurde aber noch nicht aufgeladen. Und so richtig weiß man auch noch nicht, wohin die Reise geht.

Mangel an offenen Datensätzen

Es ist kein Geheimnis; es mangelt in nahezu jeder Region an offenen Daten. Die Gründe hierfür sind durchaus unterschiedlich, aber es gibt ein paar Faktoren, die sehr oft eine Rolle spielen:

  • Die Masse an Datensätzen,
  • Fotos,

  • interne Ressourcen

  • und Finanzierung.
Ich sehe den Wald vor lauter Daten nicht mehr

Nach der Implementierung der neuen Datenbank stehen viele vor dem gleichen Problem: Jede Menge Daten, die leider nicht mehr aktuell oder unvollständig sind. Es fehlen Infos und Fotos mit offenen Lizenzen. Nun gilt es, diese Datensätze zu vervollständigen und darüber hinaus auch noch neue zu generieren. Aber wie bekommt man so eine Aufgabe in einer überschaubaren Zeit mit den zur Verfügung stehenden personellen und finanziellen Ressourcen überhaupt bewältigt?

Planung ist alles

Ok, fast alles, denn wir wissen alle, dass sich im Laufe eines Projektes immer wieder Dinge ändern können. Und dann muss man flexibel sein. Aber dennoch ist es unglaublich wichtig, sich vorab die richtigen Gedanken zu machen:

  • Welche Datenqualität strebe ich an?
  • Wie sieht meine Datenstruktur aus? Welche Kategorien habe ich überhaupt?
  • Was sind meine wichtigsten Kategorien? Prioritäten?
  • Habe ich eine einheitliche Bildsprache? Gibt es einen Styleguide? Was ist mit Personen auf Fotos?
  • Welcher Textstil soll in der Datenbank verwendet werden?
  • Wieviel Zeit brauche ich geschätzt pro Datensatz?
  • Wieviel Personal und Zeit habe ich zur Verfügung?
  • Wieviel Budget habe ich?
  • Was kann ich auslagern an externe Anbieter?
  • Wie kann ich das Projekt finanzieren?
  • Gibt es Fördermittel?
Ausschreibungen sind nicht schlimm

Die oben angeführten Fragen erleichtern auch, eine nötige Ausschreibung zu formulieren und das eigene Ziel klar zu definieren sowie viele Rückfragen von potentiellen Bietern zu verhindern. Ein wichtiger Punkt, um den Ablauf für alle Seiten transparent und möglichst einfach zu gestalten.

Theorie und Praxis

Kommen wir von der Theorie zur Praxis. An einem Beispiel aus dem Jahr 2021 verdeutlichen wir die Schritte zur Planung eines Großprojektes. Inzwischen haben sich einige Dinge geändert, was heute einiges leichter und schneller machen würde. Die Technik schreitet voran und es gibt inzwischen gewisse Automatismen. Dennoch bleiben viele Fragen und Entscheidungen gleich und es wird auch heute noch zum großen Teil so ablaufen.

Beispiel: Der Landkreis Wolfenbüttel / Das Nördliche Harzvorland

Bereits 2021 konnten wir den Landkreis Wolfenbüttel dabei unterstützen, genau diese Aufgabe – Datensätze öffnen und neue anlegen – zu lösen, denn die Ausdehnung des Gebietes ist viel zu groß, als dass die Mitarbeiter:innen das in einer überschaubaren Zeit aus eigener Kraft hätten bewältigen können.

Denn es ging nicht nur um das Vervollständigen von bereits vorhandenen Datensätzen, sondern auch um das Aufspüren von neuen, touristisch relevanten POIs. Somit war recht schnell klar, dass die Befüllung der Datenbank für den „ersten Schwung“ und das Öffnen der Datensätze nur mit externer Hilfe zu lösen war.

In einem mehrmonatigen Projekt haben wir es geschafft, die Anzahl der offenen Datensätze um 340% zu steigern.

Grund dafür war eine enge Zusammenarbeit mit der Destination, eine gute Planung und eine klare Priorisierung. Glücklicherweise hatte die Region im Vorfeld bereits eine neue Strategie mit klar definierten Zielgruppen erstellt. Daraus konnten wir recht schnell die Gewichtung der Datensätze festlegen und unsere Arbeit auf die wichtigsten Inhalte konzentrieren. Anfangs waren wir so hoch motiviert, dass wir dachten, wir könnten alles erfassen, was die Region zu bieten hat. Doch bereits in den ersten Tagen unserer Arbeit vor Ort wurden wir schnell eines Besseren belehrt. Die Themen Gastronomie und Unterkünfte sind umfangreicher und schwieriger zu erfassen, als alle anderen Kategorien. Daher hatten wir gemeinsam entschieden, diese aus unserem Projekt auszuschließen und uns auf die wichtigsten POIs für die Strategie des Landkreises zu konzentrieren, damit wir in unserer zur Verfügung stehenden Zeit auch wirklich das gesamte Gebiet bearbeiten konnten.

Ebenfalls hilfreich und notwendig waren im Vorfeld die Überlegungen zu Bildsprache und Textstil. Das sind Dinge, die unbedingt vorab geklärt werden müssen, damit die Datensätze ein einheitliches Bild ergeben. Wie sollen POIs fotografisch festgehalten werden? Wie ist die Farb-/ Lichtstimmung auf den Fotos? Gibt es Dos and Don’ts? Wie sieht es mit Personen auf den Fotos aus? Im Falle unseres Projektes im Landkreis Wolfenbüttel haben wir uns gemeinsam mit dem Tourismusverband abgestimmt und klare Richtlinien definiert. Hierfür haben wir am Anfang des Projektes in einem Workshop einen Styleguide entwickelt, welcher als Referenz für alle Datensätze seitdem gültig ist.

Die unendlichen Weiten des Internets

Eine gründliche Recherche vorab zahlt sich zusätzlich aus. Gerade wenn man auf der Suche nach neuen POIs ist, wird man häufig schon bei Google und Co. fündig. Eine gute Grundlage für uns, später bei der Arbeit „im Feld“ interessanten POIs nachzugehen. In der Regel durchforsten wir die wichtigsten Quellen: Google, Google Maps, Wikipedia, Websites der einzelnen Orte, passende Themenportale und Social Media Kanäle.

Herausforderungen

Wie schon oben erwähnt, spart eine gute Planung eine Menge Zeit und Geld. Aber selbst der beste Plan muss manchmal spontan angepasst werden. So haben wir z.B. das Thema Öffnungszeiten total unterschätzt. Natürlich wussten wir im Vorfeld, dass das immer ein schwieriger Part sein wird, aber wir haben während unserer Arbeit selbst im Jahre 2021 immer noch Angaben recherchiert wie z.B. „Geöffnet bis Sonnenuntergang“, „bei schönem Wetter“, „auf Anfrage“ oder unser bisheriger Favorit „Ruhetag flexibel“, selbstverständlich alles mit einem Zettel an der Tür kommuniziert. Das ist natürlich nicht die Regel, aber auch keine Seltenheit. Hier mussten wir ein wenig nachrecherchieren, um den Datensatz dann zu öffnen. Und manchmal fällt dann eventuell auch die Entscheidung, dass dieser POI nicht den Weg in die Datenbank findet.

Zurück in die Zukunft

Das war unser Projekt in 2021. Natürlich entwickelt sich die Software stetig weiter. So gibt es inzwischen ein paar Tools, die einem helfen können, Arbeitsabläufe zu vereinfachen und dadurch effizienter zu arbeiten. So können z.B. Öffnungszeiten von Google Maps nun automatisch abgefragt werden. Das ist gerade beim Thema Gastronomie enorm hilfreich. Ebenso die KI- gestützte Erstellung der beschreibenden Texte. Sicherlich muss man diese Texte auf ihre Richtigkeit überprüfen, aber gerade die Basis-Infos zu einem POI lassen sich dank dieser Technik deutlich schneller erstellen.

April bis Juni wäre super

Aber was ist mit dem Herbst? Und dem Winter? Auch bei der zeitlichen Planung sind ein paar Dinge vorab zu berücksichtigen. Zwar können Texte rund ums Jahr geschrieben und Orte online und auch vor Ort recherchiert werden, aber bei den Fotos sieht es da anders aus. Hier ist man, mal abgesehen von dem doch recht oft gewünschten schönen Wetter, abhängig von den Jahreszeiten, der Strategie und der Zielsetzung.

Nicht nur die Jahreszeit und das Wetter können Fotoshootings beeinflussen, sondern auch so banale Dinge wie „Gelber Sack“ oder andere Mülltage, welche eine nette, malerische Straße in eine Deponie verwandeln können. Und das sieht auf Fotos nie vorteilhaft und einladend aus. Vielleicht gibt es auch bestimmte Events im Jahr, welche unbedingt mit erfasst werden sollen. Es lohnt sich also, im Vorfeld zu überlegen, was genau gebraucht wird. Und ob das überhaupt ein offener Datensatz sein soll.

Nicht zuletzt sind die internen Ressourcen, welche so ein Projekt erfordert, auch mit einzuplanen. Wann sind meine Mitarbeiter:innen im Urlaub? Gibt es besonders stressige Phasen, in denen solche Projekte keinen Platz finden? Wie kann ich das sinnvoll aufteilen? Wir haben die besten Erfahrungen damit gemacht, den Zeitraum für solch ein Projekt möglichst groß anzulegen, damit all diese Faktoren mit eingeplant werden können. Mit einer guten Planung und Struktur ist so ein Projekt über mehrere Monate oder sogar Jahre zu bewältigen.

Werde ich jemals fertig?

Spoiler Alert: Glücklicherweise nein. Denn wer nach dem ersten Schwung an Daten aufhört, die Datenbank zu pflegen und zu aktualisieren, hat nicht nur Zeit und Geld vergeudet, sondern auch eine riesige Chance verpasst.

Mit einer gut gepflegten Datenbank stehen einer Region so viele Wege offen, sich am stetig wandelnden Markt optimal zu positionieren, dass es einfach schade wäre, diese Möglichkeiten nicht zu nutzen. Ja, die Pflege der Datenbank bedeutet Personalaufwand; bedeutet Zeit und Geld. Doch die Frage sollte hier nicht sein, ob sich eine

Region das leisten kann, Personal und Geld dafür zur Verfügung zu stellen, sondern eher die Frage danach, ob sie es sich leisten kann, dies nicht zu tun.

Der Berg ist zu groß?

Puh, jetzt klingt das schon wieder so kompliziert. Und ehrlich gesagt, so ganz banal ist es ja auch nicht. Daher können wir nur jeder Region empfehlen, sich externe Hilfe zu suchen, damit man gemeinsam diesen Wust an Details besser strukturieren und organisieren kann, damit Budget, Personal und Nerven bestmöglich eingesetzt werden.