KI, die künstliche Intelligenz, die auch gerne mal als künstlicher Idiot verunglimpft wird, ist da. Und wird bleiben, solange niemand den großen Stecker zieht. Derzeit bastelt KI beziehungsweise basteln Leute mit ihr fleißig Videos: Auf YouTube gibt es mittlerweile so viele künstlich generierte Videos, dass ich mich wie ein kleines Kind auf Speed freue, wenn ich mal ein „echtes“ erwische. Aber wie kann nun sicher wissen, ob KI im Video verwendet wurde? 👾
Manchesmal springt einem überdeutlich ins Gesicht. Nein, vor allem ins Ohr! Da scheppert die Stimme so metallisch-krächzend, dass auf Anhieb alles klar ist. Die künstlichen Stimmen haben sich jedoch derartig verbessert, dass es heute leider nicht mehr so into-your-ear ist.
Ich selbst habe den Bogen sicher noch nicht hundertprozentig heraus. Vor zwei Wochen habe ich in der Kommentarspalte einem noch ein Kompliment gemacht, welch schönen österreichischen Akzent er doch hat. Ich fand die Stimme echt sexy! Einige Tage später ist der Groschen erst gefallen …

Erkennst du den Film? Schreib’s in die Kommentare!
Wie erkennt man also KI im Video? Ich habe drei Punkte entlarvt, die echt eindeutig sind.
1/ Wunderschöne Videos mit wunderschönen Welten
Ich schaue bzw. höre mir gerne Videos über Philosophie, Psychologie und Spiritualität an. Da fiel mir ein gewisser Typ Video Anfang diesen Jahres auf: Sie sind auf den ersten Blick einfach nur wunderschön. Um nicht zu sagen perfekt! Eine hübsche Illustration kommt nach der anderen, sie sind oft leicht animiert. Die Bilder der schon glatt surrealen, oft archetypisch-antik anmutenden und immer phantasievollen Szenen und Menschen sind meist in satten Farben dargestellt und auffallend kontrastreich.
Auffallend: Über den Videos liegt all zu oft ein hübscher Rausch-Filter, also ein minimal wahrnehmbares schwarzes oder weißes Flimmern. Ich weiß nicht, wie es dir geht, aber ich fand das anfangs das echt wunderhübsch! Bis es sich wiederholt hat. Und nochmal. Und nochmal. Denn das kommt eben alles aus derselben Maschine.
2/ Schöne Stimmen – mit komischen Betonungen
Am deutlichsten ist natürlich an der eigentlich menschlichen Stimme festzustellen, ob das Video künstlich generiert ist. Hier haben wir Menschen von Natur aus genügend feine Antennen in unseren Öhrchen installiert. Denn mit Stimmen haben wir ja tagtäglich zu tun!
Bei billig übersetzen Videos wird schnell überdeutlich, dass etwas nicht stimmen kann. Etwa, wenn ein polnischer Mund spricht und eine deutsche Übersetzung erst drei Sekunden später kommt. Solche unangenehm monoton-scheppernden Computerstimmen kennen die Älteren von uns aus den Neunzigern. Wenn man da das erste mal auf „Vorlesen“ am Computer geklickt hat, war es, als stünde der Terminator ne-bän ei-nämmm.

Mitterweile sind künstlich generierte Stimmen so verdammt gut, dass es immer schwieriger wird, sie auf Anhieb zu erkennen. Aber es geht schon, wenn man seine menschlichen Lauscher ganz deutlich spitzt … 🐰
Merkwürdige Betonungen
Hier kommt es auf die allerkleinsten Details an.
Die Rede ist hier nämlich nicht von Wörtern, die wir Deutsche von Haus aus gern falsch betonen, wie den handelsüblichen „Oregaaaaaano“ oder „Parameeeeeeeeter“. Wenn jemand das richtig ausspricht, hat er wohl schon eine Künstliche Intelligenz in sein Hirnkastel installiert?! ッ
Nein: Eine KI betont „normale“ Wörter total komisch. So wie niemals ein Mensch das Wort komisch betonen würde, nicht einmal jemand, der das erste Mal überhaupt in seinem Leben Deutsch spricht, nachdem er frisch aus seinem UFO auf die Erde mit dem Gesicht voraus geknallt ist und eben noch von einem Kieferorthopäden vernäht wird.
Zum Beispiel sagt die KI „ei-nìgermaßn“ anstatt „ei-ni-ger-ma-ßen“.
Kommt dir das zu feinjustiert und schwierig vor? Nun, die nächsten beiden Punkte sind wesentlich einfacher zu erkennen!
Überschaubare Modulation in der Stimme
KI-Stimmen sprechen heute echt sehr, sehr gut! Um sie zu durchschauen, braucht es einen kleinen Kniff:
Wenn ein Video beginnt – oder natürlich auch ein Podcast –, dann stelle dir gleich zu Beginn zwei Linien vor: Eine für den höchsten Ton der Stimme und eine für den tiefsten. Und dann achte mal darauf, ob die Stimme immer in diesem Spektrum bleibt.
Wenn ja, ist es eindeutig eine KI. Auch wenn sie sich noch so sehr bemüht, einen auf Homo Sapiens zu machen.

Denn wenn ein Mensch spricht, hat seine Stimme mal leichte Ausfälle: Vor allem nach oben hat eine menschliche Stimme gerne mal Ausreißer; ganz besonders, enn da Thema ein bisschen emotionaler wird. Oder weil eine Stimme nach 18 Minuten permanenter Sprechzeit etwas rauher wird …
Unnatürlich kurze „Atem“pausen
Hier ist es ähnlich wie bei der Sprachmelodie: KI ist insgesamt schon sehr sehr gut. Aber wenn du achtsam lauschst, wirst du feststellen, dass du als Mensch nach dem Satzende etwas länger pausiert hättest. Denn als Mensch muss man halt doch manchmal atmen. KI ist da immer einen Hauch zu schnell, auch wenn sie sich redlich bemüht. Auch hier geht es um feine Nuancen, die du aber leicht feststellen kannst, wenn du achtsam hinhörst.
Und geht es nicht vielleicht auch eben darum: Dass wir dank KI nun wieder lernen, genauer auf das Gesagte hinzuhorchen?
Und von einem echten Menschen wirst du auch mal scheinbar unangenehme Atem- oder auch Lippengeräusche hören, je nachdem, wie gut sein Mikro ist.
3/Große Gesichter und große Themen
In meinem geliebten Philo-Psycho-Spiri-Bereich fällt mir auf, wie neuerdings Videos auftauchen, die mit den am meisten bekannten Gesichtern in den Thumbnails ankommen: Alan Watts, Eckhart Tolle, Dolores Cannon, „Carl Jung“. Wo wir schon dabei sind: Jeder normale Mensch sagt doch „Gustav“ dazu oder eben „CG Jung“?
Und dann beginnt das Video und man kann sich freuen, wie einem ein „Carl Jung“, der natürlich längst tot ist, künstlich irgendwas Topaktuelles erzählt. Zum Beispiel wie toll Single-Frauen sind und welchen tiefenpsychologischen Schatz sie in sich bergen. Hier wird mit psychologischen Fallen gespielt, die dreckiger nicht sein könnten: Sie triggern direkt in die Sehnsüchte und Schmerzen von Menschen. Natürlich klickt man da. Hab ich ja auch 😅🙈
KI im Video legt leider, leider auch gerne mal einem Eckhart Tolle oder Meister Shi Heng Yi Worte in den Mund, die die beiden niemals von sich gegeben haben. Die beiden leben noch. Wie pervers ist das denn bitte? Und: Ist das überhaupt noch legal? Ich bezweifle es. Als ich es bei so einem Account mal nicht lassen konnte und wutentbrannt kommentiert habe, wie sie denn zu Urheberrechten stehen udn ob Eckhart Tolle weiß, was sie in seinem vermeintlichen Namen fabrizieren, kam natürlich nie eine Antwort …
Hier ist auf jeden Fall noch ein rechtlicher Rahmen, eine Gesetzgebung notwendig. Für mein Dafürhalten darf so ein Murks auch nicht mit längst Verstorbenen wie etwa Alan Watts oder Dolores Cannon passieren. Das ist einfach falsch, da werden Tatsachen angedichtet bis verdreht – und damit auch noch Profit gemacht.
KI-Videos schauen oder nicht?
Sollte man nun YouTube Content mit erkennbarer KI im Video überhaupt gucken? Theoretisch spricht ja nichts dagegen, wenn die Inhalte an sich gut sind – Inhalt ist Inhalt, sollte man meinen. Oder nicht, oder doch?
Was mir persönlich widerstrebt
Diese „KI-Accounts“ verdienen sicher nicht wenig Geld mit ihren Videos. Es scheint ein überaus profitables Geschäftsmodell zu sein: Wenig Aufwand, viel Gewinn!
Ich kann nur mutmaßen, mit welchem Aufwand die Videos erstellt werden. Dank all der Automatisierung schätze ich maximal eine Stunde, wenn man einen Workflow erst etabliert hat. Vielleicht läuft es ja so an: Erst lässt man sich das Skript von einer KI schreiben („Erstelle mir das Skript für ein 12:30-minütiges YouTube-Video, das viral geht. Nimm als Grundlage Texte von Carl Gustav Jung. Bereite das Video um ein aktuell angesagtes Thema auf“). Das Skript wird binnen Sekunden ausgegeben. Dieses füttert man in die nächste video-generierende KI: „Erstelle aus dem Skript ein hochwertiges Video, das die Inhalte ästhetisch ansprechend verpackt und zur Zielgruppe XYZ passt“. Bumms, fertig ist die Kiste! Hochladen auf YouTube, und ab geht’s mit den fünfzigtausend Followern. Wie viel verdient ein YouTuber gleich wieder mit monetarisierten Accounts?
Mit so etwas habe ich ein Problem, weil ich mir denke: Es gibt so viele Menschen, die sich den Arsch aufreißen für gute Videos und kaum etwas damit verdienen. Schlimm genug, dass es genügend Menschen gibt, die als lauteste Marktschreier- und Dampfplauderer daherkommen; jetzt flackt sich auch noch die KI wie ein ekelhaft fetter, tonnenschwerer Platzhirsch mit fast platzender Plautze an den YouTube-Waldrand. Versperrt den Blick auf die schönen Bäume dahinter, und von der Lichtung im Zentrum kann man gar nix mehr ahnen!
Der feinstoffliche Aspekt zum Schluss
Ich will Künstliche Intelligenz keineswegs per se verdammen. Mittlerweile nutze ich sie genügend oft selbst und bin froh darüber, wo sie mir überall geholfen hat. Diese Website hier wäre ohne Grok nicht in dieser Form online! Als ich letzte Woche massiv Probleme mit der Schriftdarstellung hatte, hat mir die KI verraten, welchen Code ich in die CSS-Datei eintragen muss. Ohne diese professionelle Hilfe hätte ich das niemals getan. Also: KI als Helferlein, ja klar!
Aber wenn KI Sachen kreiert, die wir konsumieren können, stelle ich immer wieder erstaunt fest, wie mich das müde macht. Auslaugt. Ja irgendwie stumpf macht und matt. Es zieht mir förmlich Energie!
Kennst du das auch?
Fühl mal hin!
Und da bin ich versucht, schnell an den Film Matrix zu denken. Ich will nicht so weit gehen, dass ich uns Menschen als Batterie für KI betrachten will, aber kann ich es ausschließen? Denn wer füttert die KI denn mit seinen Prompts? KI lernt durch unseren Input immer mehr und mehr und wächst dadurch ja auch.
Kann mir KI aber auch Energie ziehen, wenn ich ihr nur lausche? Mein Körper sagt tatsächlich: Ja.
Ob es dir auch so geht, musst du für dich selbst herausfinden. Wie du sie in Videos überhaupt erkennst, weißt du ja nun.
Titelbild: © Jakob Owens (Unsplash), modifiziert von mir(iam Lochner)
GIFs von GIPHY