Im Zeitalter moderner IT-Systeme und neuer Technologien ist es nicht verwunderlich, das ich mir einiges davon zu Nutzen mache, um meinen K.I.T.T. weiter zu perfektionieren.
Da ich selber in dem Beruf arbeite und mich bestens mit sowas auskenne, habe ich bereits jetzt schon KI-Technologie für K.I.T.T. im Einsatz.
Als ersten Step habe ich es geschafft, die legendäre Stimme von Gottfried Kramer, der K.I.T.T. in der Serie zum sprechen gebracht hat, mithilfe von KI-Technologie zu klonen! Die Stimme ist zu 98% wie bei dem im Original. Wo ich gerade noch dran bin sind diese gewissen Emotionen, die Gottfried Kramer bzw. K.I.T.T. in der Stimme hatte. Das zu realisieren wird aber noch etwas dauern.
Dennoch ist das Ergebnis beeindruckend und verleiht meinem K.I.T.T. so nochmal das gewisse Etwas, weil er auf Events die Leute zB persönlich Grüßen kann.
Einen großen Nachteil hat das ganze allerdings noch: Ich muss jeden Satz, den ich K.I.T.T. sprechen lassen möchte, im Vorfeld erstellen und dann in meine Sprachsteuerung “programmieren”. Das kostet viel Zeit und ist nicht wirklich smart – allerdings für den Moment ausreichend, da man ja nicht ständig die Sätze ändert, erweitert usw.
Allerdings ist das nicht mein Anspruch… was wäre, wenn K.I.T.T. wirklich intelligent wird?
Nun, das ist garnicht mal so unrealistisch. Es gibt ja schon KI’s wie ChatGPT, bei denen man Textbefehle eingeben kann und “schlaue Antworten” bekommt. Funfact: Wusstet ihr eigentlich, dass ChatGPT auch lügen kann?
Wie dem auch sei, mein Plan ist es, eine KI ähnlich wie ChatGPT an mein Sprachmodell zu koppeln. Sprich: Wenn ich einen Sprachbefehl sage, soll dies mittels KI beantwortet und dann mit meiner geklonten Stimme von Gottfried Kramer ausgegeben werden!
Als sei das noch nicht genug, sollen sich natürlich auch weiterhin die “Roten Sprachbalken” im Dashboard korrekt bewegen und die Ausgabe im Innenraum oder auch Außen im Auto wiedergegeben werden können – in ECHTZEIT.
Leider sind meine aktuellen Tests noch nicht soweit, dass das zuverlässig funktioniert. Es gibt bei der Sache nämlich ein paar große Probleme:
- Wie bringe ich die Spracheingaben dazu, nur das zu erkennen, was ich auch erkannt haben möchte? Aktuell würde alles gesprochene was das Mikro einfängt irgendwie bearbeitet werden wollen.
- Die Bearbeitung von Spracheingabe > Verarbeitung der Antwort > Umwandeln des Textes in die K.I.T.T.-Stimme dauert aktuell einfach noch zu lange. Rechenleistung des PCs im Auto sowie Internetzugang /Geschwindigkeit sind aktuell zu schwach (selbst mein High End Desktop PC im Büro braucht noch zu lange zum bearbeiten)
Deshalb wird das Szenario wohl noch einige Jahre auf sich warten lassen. Fürs erste reicht mir auch das, was ich bisher erreicht habe. Und selbst das ist schon unglaublich.