Jeder, der schon mal mit KI-Sprachmodellen zu tun hatte, kennt es: man will eine bestimmte Antwort vom Chatbot - doch der weigert sich hartnäckig, diese zu geben. Es gibt aber Tricks, um LLMs und andere GenAI-Modelle gefügig zu machen: sogenannte Pompt Hacks, Jailbreaks oder Prompt Injections. Wir erklären, was hinter diesen Begriffen steckt, wie diese Methoden funktionieren und wir fragen: Ist es gut oder schlecht, wenn KI-Modelle nicht alle Fragen beantworten, die wir ihnen stellen?
In dieser Folge:
00:00 Intro
02:38 Was sind Prompt Hacks und wie funktionieren sie?
13:30 Wie Marie einen Chatbot dazu brachte, ihr 3000 Proteinriegel zu versprechen
19:47 Fritz und DeepSeek: Wer bestimmt, was KI-Modelle sagen?
30:10 Sollen Chatbots immer auf alle Fragen Antworten geben?
34:32 Was haben wir diese Woche mit KI gemacht?
Redaktion und Mitarbeit:
David Beck, Cristina Cletiu, Chris Eckardt, Fritz Espenlaub, Marie Kilg, Mark Kleber, Gudrun Riedl, Christian Schiffer, Gregor Schmalzried
Links und Quellen:
- Chevrolet of Watsonwille verkauft Chevy Tahoe für $1 https://www.theautopian.com/chevy-dealers-ai-chatbot-allegedly-recommended-fords-gave-free-access-to-chatgpt/
- Findet man in LLMs gefährlichere Informationen zu Biowaffen als in Google? https://www.rand.org/pubs/research_reports/RRA2977-2.html
- Der chinesische Chatbot DeepSeek und das Tiananmen-Massaker: https://www.linkedin.com/posts/peter-gostev_it-took-some-effort-but-i-managed-to-get-activity-7152042996635521024-2hBZ/
- KI macht Job-Interviews: https://www.micro1.ai/gpt-vetting
- Airline haftet für Fehler ihres Chatbots: https://www.theguardian.com/world/2024/feb/16/air-canada-chatbot-lawsuit
- Maries Theaterstück: Anna und Eve in der Neuköllner Oper https://www.neukoellneroper.de/performance/anna-eve/
- Was steckt hinter dem mysteriösen neuen Chatbot GPT2? https://news.ycombinator.com/item?id=40199715
https://arstechnica.com/information-technology/2024/04/rumors-swirl-about-mystery-gpt2-chatbot-that-some-think-is-gpt-5-in-disguise/
Kontakt:
Wir freuen uns über Fragen und Kommentare an podcast@br.de.
Unterstützt uns:
Wenn euch dieser Podcast gefällt, freuen wir uns über eine Bewertung auf eurer liebsten Podcast-Plattform. Abonniert den KI-Podcast in der ARD Audiothek oder wo immer ihr eure Podcasts hört, um keine Episode zu verpassen. Und empfehlt uns gerne weiter!