• 5. Februar 2020

Internationalisierung und Mehrsprachigkeit – Discoverize Branchenportal Update 8.8.24

Internationalisierung und Mehrsprachigkeit – Discoverize Branchenportal Update 8.8.24

Internationalisierung und Mehrsprachigkeit – Discoverize Branchenportal Update 8.8.24 962 901 Kai Jung

Seit Anfang des Jahres sind wir dabei, die Branchenportale auf Mehrsprachigkeit vorzubereiten. Deswegen ist die krumme Versionsnummer 8.8.24 für diesen Update-Artikel kein Zufall. Diesmal möchten wir nämlich nicht erst nach Fertigstellung über ein neues Feature berichten, sondern bereits von unseren Erfahrungen auf dem Weg dahin. Damit wollen wir unseren Portalbetreibern auch einen kleinen Einblick geben, wie wir neue Features entwickeln. Mit der Version 8.8.24 haben wir jetzt den Schalter ausgerollt, mit dem die Mehrsprachigkeit (als beta-Feature) auf den Portalen aktiviert werden kann. Hier unsere Erkenntnisse und Fragen nach dem ersten Zwei-Wochen-Sprint zum Thema Mehrsprachigkeit.

Unser Ausgangspunkt war die Frage:

Wie können Portalbetreiber von Branchenportalen möglichst einfach Mehrsprachigkeit aktivieren und relevanten Content (SEO) in den gewünschten Zielsprachen produzieren?

Einfacher Zugriff auf Sprachressourcen

Technologisch haben wir uns deswegen schnell darauf geeinigt, sämtliche Sprach-Ressourcen Datenbank-basiert abzulegen, obwohl unser Technologie-Stack hier auch etliche Alternativen wie z. B. Ressourcen-Dateien vorsieht. Jedoch können wir über die Datenbank am einfachsten und flexibelsten Schnittstellen für Benutzer und Benutzergruppen realisieren (wie später beispielsweise für Übersetzer oder Editoren). Zusätzlich ist dann auch ein Export / Import z. B. für manuelle Übersetzungen grundsätzlich möglich und auch der Austausch von Ressourcen über verschiedene Portale hinweg könnte später gebaut werden, z. B. über unsere Meta-Portal-Lösung.

Relevanter Content durch automatisierte Übersetzungen

Von Anfang hatten wir einen starken Focus darauf, möglichst schnell so viel wie möglich an Content in allen Zielsprachen des Branchenportals zur Verfügung zu stellen. Deswegen wollten wir automatisierte Übersetzungen so früh wie möglich integrieren. Als die zwei Hauptrisiken von automatisierten Übersetzungen haben wir zum einen potentiell hohe Kosten ausgemacht und zum anderen die Übersetzungsqualität, die vielleicht nicht ausreichen könnte.

Risiko 1: Kosten von automatischer Übersetzung

Die Einheit für Übersetzungskosten sind normalerweise Kosten pro Zeichen (cost per character). Diese unterscheiden sich je nach Anbieter. Als Übersetzungs-Provider haben wir die Dienste von Google, Bing (Microsoft) und DeepL zum Vergleich herangezogen.

Die Anbieter rechnen meistens mit Vielfachen von Millionen Zeichen. Bei Google Translate konsten 1 Millionen Zeichen dann beispielsweise 20$ im Monat, bei Bing ungefähr die Hälfte, DeepL rechnet immer mit 500 Zeichen, für die 0,01€ anfallen (Stand Februar 2020). Hinzu kommen teilweise noch (geringe) monatliche Beträge, aber auch monatliche Freigrenzen, die z. b. bei Bing schon 2 Millionen Zeichen beinhalten (also den Gegenwert von 20$).

Um die Größenordnung besser abschätzen zu können, haben wir den Content eines etablierten Branchenportals herangezogen und versucht, die Kosten für den bisherigen Gesamtcontent (also wenn initial ein etabliertes Portal in einer zweiten Sprache starten möchte) und die Kosten für den Content im letzten Monat zu bestimmen. Die Zeichen haben wir über den realen Content und Datenbankauswertungen gezählt:

CategoryLast 30 daysAlltimeNotes
Blog99,6691,251,665
Areas174,791
Entries (description + directions + tagline) modified last 30 days122,881785,516all other text properties not counted (probably <10-20%?)
Static content blocks20,361715,463
Ratings (active)23,574841,878
Posts (active)1,69558,732
Total268,1813,828,045
Google Translate5.36$
=> 0$ (free contingent) 
76.56$20$ per 1 Mio. characters, ca. 10$/month free
Bing2.68$
=> 0$ (free contingent)
38.28$10$ per 1 Mio. characters, 2M chars free per month
DeepL5.36 €76.56€ 5 EUR / Monat + Preis ab 0,01€ pro 500 Zeichen (20€ pro 1 Mio)

Das Portal hätte also monatlich ca. 300,000 Zeichen an Content und läge damit bei Bing oder Google noch im freien Bereich (zumindest für eine zusätzliche Sprache).

Risiko 2: Übersetzungsqualität

Um die Übersetzungsqualität besser einschätzen zu können, haben wir im Rahmen des Beta-Features die Einstellungen gebaut, um mehrere Sprachen zu aktivieren und gleichzeitig einen Übersetzungs-Dienst, der sämtliche fehlende Ressourcen in allen Sprachen des Portals automatisiert übersetzt. Dieser läuft im Hintergrund und prüft regelmäßig, ob es Änderungen oder neue Ressourcen gibt, die noch nicht übersetzt sind.

Für das Experiment haben wir angefangen, den Verwaltungsbereich der Unternehmen auf die neuen Sprach-Ressourcen umzustellen. Zwischen den verfügbaren Sprachen kann dann einfach per Klick gewechselt werden:

Umschalten zwischen Sprachen

Automatisierte Übersetzung des Verwaltungsbereichs eines Unternehmens auf Englisch (Google Translate)

Unternehmensverwaltung in automatisierter Übersetzung auf Englisch

Automatisierte Übersetzung des Verwaltungsbereichs eines Unternehmens auf Portugiesisch (Google Translate)

Unternehmensverwaltung in automatisierter Übersetzung auf Englisch

Zur Info: übersetzt wurde hier jeweils nur die Navigationsleiste und die Seite zum Editieren der persönlichen Daten des Unternehmensverwalters.

Fazit: zumindest die Englischen Übersetzungen scheinen recht brauchbar zu sein. Wichtige Schlüsselbegriffe, insbesondere einzelne Feldnamen oder Navigationspunkte würden wahrscheinlich sowieso manuell überprüft / korrigiert werden. Bestimmte Listen, wie die Anreden (salutations) in den obigen Bildern funktionieren natürlich nicht so gut, da diese doch sehr kultur-spezifisch sind und eine reine Übersetzung hierfür vielleicht gar nicht ausreicht.

Ausblick

Im kommenden Sprint wollen wir weiter an der Übersetzbarkeit der Unternehmens-Verwaltung arbeiten. Unternehmen sollen ihre Einträge komplett in ihrer bevorzugten Sprache bearbeiten können. Außerdem sollen die Detailseiten der Unternehmen dann auch ein den verfügbaren Sprachen angezeigt werden.

Darüber hinaus werden wir prototypisch erste Experimente machen, wie Portalbetreiber am besten verfügbare Ressourcen editieren und übersetzen können.

Außerdem wird es ein Internationalisierungs-Portal geben. Dieses ist ein Staging-Portal, also ein Test-Portal. Damit können wir den aktuellen Stand der Mehrsprachigkeit zeigen, ausprobieren und leichter Feedback einsammeln.

Hier geht es zur Fortsetzung Erfahrungen mit Mehrsprachigkeit in Sprint 2.

Hinterlasse eine Antwort

Unverbindlichen Beratung anfragen

Gerne besprechen wir in einem Vorgespräch in ca. 15 Minuten Ihre Portalidee und ob und wie sich diese mit discoverize umsetzen ließe. Entweder per Telefon oder gerne auch in Person bei uns im Büro.



9-12 Uhr12-15 Uhr15-18 Uhr

Kontakt zum discoverize Team

Bei allen Fragen rund Branchenportale, Beratung, Strategie helfen wir gerne weiter.