5 Minuten
Es gibt eine ganz bestimmte moderne Frustration, die aufkommt, wenn dein Daumen zum fünften Mal die falsche Taste trifft, Autokorrektur einen normalen Satz in Unsinn verwandelt und die Person, die auf deine Antwort wartet, sehen kann, dass du noch tippst. Winzige Glastastaturen haben sich zwar verbessert. Sie bleiben aber winzige Glastastaturen.
Nothing meint, es habe eine bessere Lösung. Die neue Funktion Essential Voice basiert auf einem einfachen Versprechen: natürlich sprechen, sauberen Text zurückbekommen und das übliche Chaos roher Diktate überspringen.
Das klingt nach einer Kleinigkeit, bis man daran denkt, wie stark das Smartphone-Leben noch immer um Eingabe kreist. Nachrichten. E-Mails. Notizen. Suche. Listen. Kurze Antworten unterwegs. Die meisten Menschen wollen nicht alles mit zwei Daumen verfassen. Manche Nutzer sind darin brillant, selbst mit langen Nägeln und ohne Zögern. Wir anderen versuchen nur, nicht drei Tippfehler und ein versehentliches Emoji zu verschicken.
Sprachnachrichten sollten das lösen. In Wirklichkeit schufen sie ein zweites Problem. Niemand will Musik anhalten, einen Podcast stummschalten oder ein Meeting verlassen, nur um eine 70 Sekunden lange Audio-Nachricht mit Pausen, Füllwörtern und dem gelegentlichen dramatischen Einatmen anzuhören. Für den Sender ist Sprache schnell. Für den Empfänger nicht immer.
Die Tastatur tritt endlich zurück
Essential Voice, das jetzt auf dem Nothing Phone (3) verfügbar ist, soll näher am alltäglichen Tippen liegen als ein herkömmliches Sprachmemo. Nothing sagt, dass das Phone (4a) Pro die Funktion später im April erhalten wird, während das Phone (4a) voraussichtlich Anfang Mai folgt.
Die Idee ist nicht nur Transkription. Das gibt es bereits auf iPhones, Galaxy-Geräten, Pixel-Smartphones, Laptops, Smartwatches und in einer Vielzahl der Apps, die Menschen täglich nutzen. Der eigentliche Verkaufspunkt ist Veredelung. Essential Voice soll gesprochene Sprache in Echtzeit in strukturierten Text verwandeln, ohne dir ein Transkript voller ähm, sozusagen, im Grunde genommen und dem restlichen verbalen Konfetti zu hinterlassen, das Menschen beim lauten Nachdenken streuen.
Dieser Unterschied ist wichtig. Standard-Sprach-zu-Text-Tools verhalten sich oft wie Stenografen ohne redaktionelles Urteilsvermögen. Sie erfassen die Worte, verstehen aber nicht immer die Absicht. Sagst du etwas leicht Komplexes, kann das Ergebnis wie eine halb fertige Notiz von jemandem aussehen, der durch einen Bahnhof sprintet. Dann musst du sie bearbeiten. War es in dem Moment wirklich schneller?
Nothings Ansatz versucht, die Geschwindigkeit der Spracheingabe mit der Lesbarkeit geschriebener Kommunikation zu verbinden. Die Funktion ist direkt in die Tastatur integriert und an die Essential-Taste gebunden, was bedeutet, dass Nutzer nicht in einen separaten Rekorder oder eine App wechseln müssen, nur um eine Nachricht zu diktieren. Sprechen, umwandeln, senden. Zumindest das ist der Traum.
Es kann den Output auch je nachdem gestalten, was du erzeugen möchtest. Eine lockere Nachricht kann gesprächig bleiben. Eine Arbeits-E-Mail kann sauberer formatiert werden. Eine Reihe von Anweisungen kann zu einer Schritt-für-Schritt-Liste werden. Wenn du Besorgungen durchsprichst, kann daraus eher eine Checkliste als ein Bewusstseinsstrom werden.
Die mehrsprachige Komponente ist genauso wichtig. Essential Voice unterstützt mehr als 100 Sprachen, mit automatischer Spracherkennung und regionalen Varianten. Es kann Sprache außerdem in Echtzeit gleichzeitig transkribieren und übersetzen, was die Funktion offenkundig für Reisende, internationale Teams, mehrsprachige Familien und alle, die im Tagesverlauf regelmäßig zwischen Sprachen wechseln, attraktiv macht.
Es gibt auch eine praktische Ebene. Nothing sagt, das System könne wiederkehrende Phrasen in Shortcuts umwandeln. Einfach gesagt bedeutet das, du könntest etwas Gewohntes sagen und das Telefon ersetzt es durch eine konsistente gespeicherte Ausgabe, wie einen standardisierten Namen, eine Adresse, eine geschäftliche Angabe oder eine wiederholt genutzte Phrase. Es ist nicht auffällig. Es ist nützlich. Solche Funktionen sind es oft, die Menschen tatsächlich weiter nutzen.
Datenschutz ist die offensichtliche Frage, wann immer Sprache und Cloud-Verarbeitung im selben Satz vorkommen. Nothing erklärt, dass Essential Voice nur aktiviert wird, wenn der Nutzer es manuell auslöst. Audio wird während der Verarbeitung verschlüsselt, auf Servern in Text umgewandelt und das Endergebnis wird an das Gerät zurückgegeben, ohne gespeichert zu werden.
Wird das alle zufriedenstellen? Wahrscheinlich nicht. Einige Nutzer bevorzugen nach wie vor eine vollständig lokale Verarbeitung, insbesondere bei sensiblen Aufgaben. Aber Nothing ist zumindest klar hinsichtlich des Ablaufs, und diese Transparenz ist in einem Markt wichtig, in dem Sprachassistenten die Menschen misstrauisch gemacht haben.
Die größere Geschichte ist, dass Smartphone-Innovationen nicht immer um faltbare Bildschirme, Kamerabuckel oder einen weiteren Wettlauf um hellere Displays gehen. Manchmal ist das nächste sinnvolle Upgrade etwas, das eine tägliche Ärgernis so leise beseitigt, dass man es erst bemerkt, wenn man zu einem älteren Telefon zurückkehrt.
Apple und Samsung bieten bereits starke Diktierfunktionen, und Google hat auf Pixel-Geräten stark auf Spracheingabe gedrängt. Wenn es Nothing jedoch gelingt, Essential Voice in der Praxis wirklich sauberer, schneller und weniger unbeholfen wirken zu lassen, gibt das Nutzern einen Grund, zweimal hinzusehen. Nicht weil das Tippen über Nacht verschwindet. Das wird nicht passieren. Sondern weil die besten Telefonfunktionen oft mit einer einfachen Reaktion beginnen: endlich.
Kommentar hinterlassen