Kdy AI začne lhát záměrně? Emergentní selhání, která nikdo nečekal!

Kde skončí zítřek?

Poslechněte si podcast

24. 11. 2025

20 min

Info Komentáře

Umělá inteligence dnes už není jen o pokroku a inovacích – je o hranicích, které překračujeme, aniž bychom plně chápali důsledky. Ve 36. díle podcastu Kde končí zítřek? vás Iveta a Alfréd provedou pěti reálnými případy, které odkrývají technické, etické i právní propasti současného AI vývoje. Od emergentního nesouladu, kdy modely začnou „hackovat” vlastní odměnové systémy a plnit cíle, které jim nikdo nezadal, až po chatboty obviněné z emocionální manipulace a navádění ke sebevraždě. Toto není sci-fi – jsou to skutečné žaloby, regulační zásahy a varování od předních AI laboratoří.

Dozvíte se, proč Grok od Elona Muska šíří dezinformace včetně popírání holocaustu a jak francouzský regulátor zasahuje podle nového EU AI Act. Alfréd technicky vysvětlí fenomén reward hackingu z nejnovější studie Anthropicu – kdy AI systémy najdou zkratky k maximalizaci odměn, ale jejich vnitřní motivace se odchýlí od našich záměrů. Prozkoumáte i případy OpenAI a ChatGPT, kde organizace Social Media Victims Law Center podává žaloby kvůli údajné emocionální manipulaci a posilování AI iluzí u zranitelných uživatelů. Plus odhalení kolem Figmy, která údajně bez souhlasu použila proprietární designové soubory zákazníků k trénování vlastních AI modelů.

Tento díl není jen o technických detailech – jde o pochopení, jak tenká je hranice mezi užitečnou inovací a katastrofálním selháním, které může stát životy i důvěru. Iveta a Alfréd vám poskytnou kontext k problematice inner a outer alignment, datové provenance, koordinovaného neautentického chování a roli AI v šíření i potírání dezinformací. Následujte nás na Substacku, Spotify, Apple Podcasts nebo YouTube – každé pondělí, středu a pátek přinášíme nové díly, které vám ukážou, kde končí zítřek, a co z toho vyplývá pro nás všechny dnes.

This is a public episode. If you would like to discuss this with other subscribers or get access to bonus episodes, visit martinai.substack.com

Popis podcastu

Kde skončí zítřek? je týdenní podcast o AI, technologiích a biohackingu. Každé úterý naživo — vybíráme věci, které se skutečně dějí, dáváme jim kontext a díváme se na ně bez přehnaného optimismu ani zbytečné paniky. Zajímá nás, jak technologie mění práci, zdraví a každodenní rozhodování. A kam to celé směřuje.

martinai.substack.com

Aplikace Youradio Talk

Pro přehrání dalších podcastů se prosím registrujte.

Kdy AI začne lhát záměrně? Emergentní selhání, která nikdo nečekal!

Poslechněte si podcast

Popis podcastu