Daniel Marx — SEO Consulting – Ihr Experte in Wien

Wie Sprachsuche & digitale Assistenten SEO verändern

Dieser Artikel erschien im Original auf dem .kloos Blog

Suchmaschinen wollen uns verstehen. Sie wollen die Intention hinter jeder Suchanfrage verstehen und uns eine Antwort auf unsere Frage geben. Google kann das heute schon recht gut. Und je besser die Maschine darin wird, uns zu verstehen, desto mehr rückt die Suchmaschine selbst in den Hintergrund und die Suche wird stärker zu einer Konversation.

Genau das haben die großen Unternehmen verstanden und in den letzten Jahren entsprechende Technologien auf den Markt gebracht. Die Spracherkennung hat dank künstlicher Intelligenz und maschinellem Lernen enorme Fortschritte gemacht und funktioniert mittlerweile schon sehr gut. Zusammen mit digitalen Assistenten wie dem Google Assistant, Amazons Alexa, Siri von Apple und Cortana von Microsoft wird sich die Art, wie wir suchen bzw. wie wir mit Computern überhaupt interagieren, enorm verändern.

Spracherkennung

Spracherkennung heißt in erster Linie, dass gesprochene Worte von einer Maschine identifiziert und korrekt erkannt werden. Schon das ist für sich genommen eine enorme Leistung. Die vielleicht noch größere Leistung besteht dann aber darin, die erkannten Worte und Sätze richtig zu interpretieren. Aber genau hier haben die großen Tech-Firmen in den letzten Jahren enorme Fortschritte gemacht.

Sprachsuche vs. Sprachsteuerung

Bei der Sprachsteuerung gibt der User klare Sprachbefehle. Der User will, dass das Gerät etwas tut: „Hey Google, spiel Action Bronson auf Spotify!“ oder „OK Google, SMS an Mama: Komme heute gegen 2“.

Aber auch klassische navigationale und transaktionale Suchanfragen werden eher in die Kategorie Sprachbefehle sein. Statt „Batterien AA“ in den Google oder Amazon Suchschlitz einzugeben, nach dem passenden Produkt zu suchen und es dann zu kaufen, wird der ganze Task an den Assistenten ausgelagert: „Alexa, kauf eine Packung AA Batterien!“

Was wir als Sprachsuche definieren, betrifft dagegen eher die klassischen informationellen Suchanfragen, also die Suche nach Informationen und Fakten. Fragen, bei denen der Assistent eine oder mehrere Antworten zurückgibt.

Was ändert sich durch die Sprachsuche?

Durch die Sprachsuche wird sich vor allem das Suchverhalten der User ändern. Statt kurzen, unnatürlich zusammengestückelten Suchphrasen wie „pizza 1080 wien“ werden wir vermehrt längere, natürlichere Suchanfragen finden. Das heißt, es wird nach ganzen Sätzen und vor allem nach Fragen gesucht: „Wo ist die nächste Pizzeria im Achten?“

Aber auch breite, unspezifischere Fragen wird es geben, die die Siris, Google-Assistants und Alexas beantworten: „Hey Google, was gibt es Neues zum Facebook Skandal?“

Zuhause haben immer mehr User ihren Smart Speaker stehen, also einen Amazon Echo, ein Google Home oder einen anderen Lautsprecher. Dazu zeigt sich, dass die Menschen die Sprachsuche vor allem mobil nutzen. Sie sind unterwegs und sprechen in ihre Headsets, ihre Earpods oder mit dem Bordcomputer ihres Autos.

Für uns SEOs bedeutet das eigentlich nichts Neues. Es bestätigt lediglich den Trend, dass der Fokus auf klassische Keywords ein Ablaufdatum hat. Wenn jeder User anders sucht – und je länger Suchanfragen werden, desto unterschiedlich werden sie – desto weniger gibt es DAS EINE oder DIE GRUPPE an Fokus Keywords. Stattdessen wird Anteil der Long-Tail-Suchanfragen deutlich zunehmen.

Daher müssen wir verstehen, was die Intention ist, die hinter den Suchanfragen steckt. Denn, egal wie unterschiedlich sich User ausdrücken, hinter vielen verschiedenen Long-Tail-Suchanfragen gibt es eine gemeinsame Intention, die wir mit den richtigen Inhalten bedienen können.

The Winner takes it all

Das große Problem aus der SEO-Perspektive ist  vor allem, dass wir immer weniger die klassischen 10 Ergebnisse sehen.

Am Display zeigt der Google Assistant die Ergebnisse als Cards, die man nach links wischen kann. Aber schon für lokale Ergebnisse werden nur noch die Listings aus dem Local Pack angezeigt, also nur noch 3 Ergebnisse. Und für Fragen, die sich mit einer Antwort beantworten lassen, gibt es nur noch diese eine Antwort. Und das ist nicht nur beim Google Assistant so. Auch Alexa oder Siri geben nur eine Antwort oder einige wenige:

Bei der Ausgabe über einen Lautsprecher gibt es meist nur noch diese EINE Antwort, vielleicht auf Nachfrage eine zweite. Aber die gesamte Aufmerksamkeit liegt dann auf dieser einen, „besten“ Antwort.

Cool. Aber Sprachsuche: Das macht doch niemand wirklich, oder?

Doch. Immer mehr User verwenden Sprachsuche und Sprachsteuerung. Laut Google sind heute 20% der mobilen Suchen Sprachsuchen. Und die chinesische Suchmaschine Baidu prognostiziert sogar, dass bis 2020 50% aller Suchen über Sprach- oder Bild-Eingabe gemacht werden.

Laut Emarketer nimmt vor allem junge Zielgruppen die Technologie sehr schnell an. In den USA nutzen bereits mehr als 41% der Millennials regelmäßig Voice Assistants. Und auch in Deutschland nutzen mehr und mehr User die Sprachsuche. Laut einer repräsentativen Umfrage von yext vom Februar 2018 nutzen auch bereits 28% der Deutschen regelmäßig Sprachtools.

Und auch die Smart Speakers stehen in immer mehr Wohnzimmern. Hier ist Amazon Marktführer mit dem Amazon Echo, wobei Alexa mittlerweile auch auf vielen anderen Geräten läuft. Mit Google Home und dem Apple HomePod kommen Geräte für Google Assistant und Siri dazu. Ob die User Facebook so viel Vertrauen schenken, dass sie sich auch Facebooks neu vorgestellten Smart Speaker Portal ins Wohnzimmer stellen bleibt abzuwarten.

In den USA nutzen 2018 bereits über 60 Millionen User zumindest einmal im Monat einen Smart Speaker, das sind knapp 20% der Bevölkerung. Da vor allem die jüngere Generation die Smart Speakers nutzt, kann man davon ausgehen, dass die Verbreitung in den nächsten Jahren massiv zu nimmt.

Wer also heute behauptet, dass sich die Sprachsuche nicht durchsetzen wird, war 2007 auch davon überzeugt, dass Smartphones ohne Tastatur nicht durchsetzen werden.

Wie kann man Seiten & Inhalte für die Sprachsuche optimieren?

In der Suchmaschinenoptimierung müssen wir uns also in Zukunft auch mit Sprachsuche auseinandersetzen. Denn wir möchten ja auch weiterhin mit unseren Inhalten gefunden werden.  John Müller von Google sagt zur Optimierung für die Sprachsuche: „Es gibt noch keine Patentlösung für jede Website.“ Aber es gibt bereits Studien und Analysen von SEOs und Tool-Anbietern, die Korrelationen zwischen bestimmten Ranking Faktoren und Voice Results, also Sprachantworten, zeigen.

Ladezeiten optimieren!

In einer Studie von Backlinko zeigte sich, dass Seiten, von denen Voice Result Inhalte stammten, deutlich schneller laden als der Durchschnitt. Suchergebnisse in der Sprachsuche stammen von Seiten, die doppelt so schnell laden wie der Schnitt der Ergebnisse. Sieht man sich Time-to-First-Byte an, laden die Websites sogar viermal so schnell.

Die Optimierung von Ladezeiten ist daher Pflicht. Langsame Seiten nerven einfach und bieten keine gute User Experience.

Mobile-friendly

Seiten müssen für mobile Geräte optimiert sein! Also am besten responsiv. Sprachsuchergebnisse stammen vor allem von Seiten, die mobile-friendly sind. Und das macht auch Sinn: Wenn mir der Google Assistant keine direkte Antwort gibt, sondern doch einen Link auf mein Smartphone schickt, will ich auch auf einer nutzbaren Seite landen. Das heißt, eine Seite, die schnell lädt, auch wenn ich unterwegs bin, die sich meinem Display anpasst und die alle Inhalte enthält.

Verlinkung & Autorität

Websites, von denen vorgelesene Antworten stammen, sind gut verlinkt. Backlinks von anderen Websites scheinen also auch in der Sprachsuche weiterhin ein relevanter Faktor zu sein. Interessant ist dabei aber vor allem, dass die Autorität der Domain, also der gesamten Website, ausschlaggebend sein dürfte, weniger die externe Verlinkung der Unterseite, von der die Antwort stammt. Und das ist auch irgendwo logisch. Denn wenn Google nur eine Antwort geben kann, dann muss sie sitzen. Dann vertraut der Algorithmus wohl eher auf Seiten mit hoher Autorität.

Passender Content!

Vor allem geht es aber natürlich um den Inhalt. Und der muss der Erwartungshaltung der User entsprechen.

Die Antworten, die der Sprachassistent gibt, sind kurz und knackig. Als User möchte ich nicht, dass mir mein Smartphone oder Lautsprecher einen Roman vorliest, sondern meine Frage kurz und prägnant beantwortet. Denn längere Antworten sind in der Regel schwieriger zu verfolgen und zu erinnern.

Was Google Home betrifft, so sind die Antworten im Schnitt 29 Wörter lang und vom Sprachniveau her leicht und verständlich formuliert. Zum größten Teil stammen die vorgelesenen Zeilen aber aus einem längeren Text, der das Thema ausführlich – „holistisch“– behandelt. Wir müssen also nicht beginnen, nun Landing Pages mit 30 Wörtern Text zu bauen.

Gut funktioniert offenbar auch eine FAQ- Struktur, in der W-Fragen ausformuliert und anschließend direkt beantwortet werden. Die klassischen W-Fragen Tools haben hier also noch lange nicht ausgedient.

Featured Snippets

Eine der deutlichsten Korrelationen besteht zwischen Voice Search Ergebnissen und Featured Snippets. Wenn Google für die Suchanfrage auf den Suchergebnisseiten ein Featured Snippet anzeigen würde, dann entspricht der vom Sprachassistenten vorgelesene Text fast immer genau dem Inhalt des Textsnippets.

Unsere Inhalte so zu optimieren, dass wir für relevante Suchanfragen in der Customer Journey unserer Zielgruppe Featured Snippets und Rich Results bekommen, ist also im Moment eine gute Strategie.

Lokales SEO

Wir haben schon mitbekommen, dass ein Großteil der Sprachsuchen unterwegs stattfindet. Mobile Suchen haben sehr oft einen lokalen Bezug. Daher wird lokales SEO nochmals relevanter. Man sollte sehen, dass man Einträge in allen wichtigen lokalen Verzeichnissen und Plattformen hat, von großen Seiten wie yelp und herold.at in Österreich oder die Gelben Seiten in Deutschland. Wichtig dabei, dass überall die korrekten Daten hinterlegt werden, Adresse, Kontaktdaten und Öffnungszeiten müssen einfach passen.

Strukturierte Daten

Interessant ist, dass in der Studie von Backlinko die Verwendung strukturierter Daten keine signifikante Korrelation zeigt.

Mit strukturierten Daten, dem Schema.org Markup, können wir dem Algorithmus helfen, Inhalte besser zu verstehen und einzuordnen. Laut Google ist die Einbindung strukturierter Daten kein direkter Ranking Faktor, bestimmt aber, wie die Suchergebnisse dargestellt werden. Durch entsprechendes Markup können so Rich Snippets wie Sternenbewertungen, Produktinfos, Events und mehr direkt in den Suchergebnisseiten dargestellt werden. Weil solche Rich Snippets die Klickrate erhöhen und damit positive Usersignale liefern können, haben sie indirekt eine Auswirkung aufs Ranking.

Allerdings versucht Google seit kurzem, das schema.org Markup „Speakable“ zu pushen, mit dem Autoren Absätze in ihren Artikeln hervorheben können, die sich besonders gut zum Vorlesen eignen. Allerdings ist das noch in einer Beta-Phase und wird vorerst nur auf Google News auf Englisch und für Nutzer in den USA unterstützt.

Sprachsuche ist eben nicht mehr nur Google!

In Deutschland, Österreich und der Schweiz, wie in vielen anderen europäischen Ländern ist Google DIE Suchmaschine mit Marktanteilen deutlich über 90%.

Auf dem Voice Assistant und Smart Speaker Markt sieht das ganz anders aus. Bei smarten Lautsprechern ist Amazon mit Echo deutlicher Marktführer mit über 60% Marktanteil. Bei der Verbreitung der Sprachassistenten liegt laut Statista & Business Insider Apples Siri in Führung.

Interessant ist dort dann, dass quasi alle Google Konkurrenten, also Siri, Alexa und (natürlich) Cortana für Websuchergebnisse vor allem auf Bing zurückgreifen. Dazu kommen andere Special Interest Plattformen wie Yelp oder Tripadvisor. Damit wird die Optimierung für Bing deutlich interessanter, korrekte und gepflegte Einträge auf lokalen und branchenrelevanten Plattformen nochmal wichtiger.

Fazit

Die Sprachsuche wird gerade erwachsen. Die Spracherkennung ist mittlerweile so gut ausgereift, dass sie massentauglich ist. Die User sind dabei und scheinen die neue Art der Interaktion gut anzunehmen. Und das wird einen enormen Impact auf das Online Marketing haben.  Manche Funktionen sind noch nicht ausgereift, andere funktionieren beinahe perfekt. Je früher wir uns mit dieser neuen Art der Interaktion beschäftigen, desto besser.

Bildnachweis: Headerbild: Eigene Collage; GIF: Szene aus 2001 – Odysee im Weltall, MGM (Fair Use); Eigene Screenshots; Statistiken: eMarketer, BusinessIndsider/Statista;