Pro přehrání dalších podcastů se prosím registrujte.

Aplikace je ZDARMA. Váš email potřebujeme pouze k tomu, abychom vám mohli vybírat podcasty přesně na míru. Budete moci odebírat podcasty, hledat osobnosti a témata napříč podcasty, aby vám neunikl žádný zajímavý rozhovor.

Vyzkoušejte vaše osobní rádio. Děkujeme, Team Youradio Talk.

Obrázek epizody Mythos: Model, který Anthropic radši zamkl do trezoru

Mythos: Model, který Anthropic radši zamkl do trezoru

Obrázek epizody Mythos: Model, který Anthropic radši zamkl do trezoru

Poslechněte si podcast

Dnes

52 min

Anthropic představil model Mythos, který podle firmy prolomil dosud neznámé softwarové bezpečnostní díry a zvládl kompletní simulaci velkého kybernetického útoku. Zároveň ho firma označila za tak nebezpečný, že ho veřejnosti raději vůbec neuvolní.

👇👇👇👇👇👇
Staňte se členy Voxpot Klubu!  Přispějete tak na provoz nejen tohoto podcastu, získáte přístup na redakční Discord, k plným článkům a dalším klubovým bonusům. Vstup do Klubu najdete na https://www.voxpot.cz/klub/
👇👇👇👇👇👇

V bezpečnostních testech dokázal nový model Mythos údajně samostatně plánovat a provádět komplexní útoky, nacházet dosud nezdokumentované chyby v infrastruktuře a obcházet vlastní sandbox.

V novém dílu podcastu Prompt řešíme, jak se v Mythosu projevují dlouho diskutované problémy jako reward hacking a „řetěz myšlenek“, a proč se Anthropic pokouší měřit „emoce“ modelů.

Ptáme se, co z toho je reálný průlom ve výzkumu bezpečnosti, co naopak připomíná spíš PR, a proč část výzkumné scény tvrdí, že jsme s chápáním vnitřního fungování velkých jazykových modelů pořád na začátku.

Shownotes:
banger

Project Glasswing

Mythos System Card (244 stran)

Emotion Concepts paper

Attribution Graphs / Biology of LLM (mar 2025)

80,000 Hours — How scary is Claude Mythos?

Neel Nanda — mechanistic interpretability (EA Forum)

Steven Casper — reflections on Anthropic SAE research

Popis podcastu

Podcast Prompt je novým pořadem serveru Voxpot, ve kterém se Matěj Schneider a Jonáš Kucharský vydávají na průzkum světa umělé inteligence. Nečekejte ale jen technologické novinky – Prompt se zaměří i na širší společenské a politické souvislosti. Jak AI mění náš každodenní život? Jak probíhá vývoj modelů? Proč vývoj na poli AI může ovlivnit mezinárodní vztahy? První díl už brzy ve vašich podcastových aplikacích.