Mythos: Model, který Anthropic radši zamkl do trezoru

Prompt

Poslechněte si podcast

28. 4. 2026

52 min

Info Komentáře

Anthropic představil model Mythos, který podle firmy prolomil dosud neznámé softwarové bezpečnostní díry a zvládl kompletní simulaci velkého kybernetického útoku. Zároveň ho firma označila za tak nebezpečný, že ho veřejnosti raději vůbec neuvolní.

👇👇👇👇👇👇
Staňte se členy Voxpot Klubu! Přispějete tak na provoz nejen tohoto podcastu, získáte přístup na redakční Discord, k plným článkům a dalším klubovým bonusům. Vstup do Klubu najdete na https://www.voxpot.cz/klub/
👇👇👇👇👇👇

V bezpečnostních testech dokázal nový model Mythos údajně samostatně plánovat a provádět komplexní útoky, nacházet dosud nezdokumentované chyby v infrastruktuře a obcházet vlastní sandbox.

V novém dílu podcastu Prompt řešíme, jak se v Mythosu projevují dlouho diskutované problémy jako reward hacking a „řetěz myšlenek“, a proč se Anthropic pokouší měřit „emoce“ modelů.

Ptáme se, co z toho je reálný průlom ve výzkumu bezpečnosti, co naopak připomíná spíš PR, a proč část výzkumné scény tvrdí, že jsme s chápáním vnitřního fungování velkých jazykových modelů pořád na začátku.

Shownotes:
banger

Project Glasswing

Mythos System Card (244 stran)

Emotion Concepts paper

Attribution Graphs / Biology of LLM (mar 2025)

80,000 Hours — How scary is Claude Mythos?

Neel Nanda — mechanistic interpretability (EA Forum)

Steven Casper — reflections on Anthropic SAE research

Popis podcastu

Podcast Prompt je novým pořadem serveru Voxpot, ve kterém se Matěj Schneider a Jonáš Kucharský vydávají na průzkum světa umělé inteligence. Nečekejte ale jen technologické novinky – Prompt se zaměří i na širší společenské a politické souvislosti. Jak AI mění náš každodenní život? Jak probíhá vývoj modelů? Proč vývoj na poli AI může ovlivnit mezinárodní vztahy? První díl už brzy ve vašich podcastových aplikacích.

Aplikace Youradio Talk

Pro přehrání dalších podcastů se prosím registrujte.

Mythos: Model, který Anthropic radši zamkl do trezoru

Poslechněte si podcast

Popis podcastu