$ ki-news --datum 2026-06-12 | mail

KI-News — Freitag, 12. Juni 2026

// die viralsten KI-Themen der letzten 24 Stunden, kuratiert für deinen Stack

$ cat top-story.md

Simon Willison: Claude Fable 5 ist „unermüdlich proaktiv“

Willison schildert eine Debugging-Session, in der Fable 5 ungefragt Firefox und Safari startete, eigene HTML-Testseiten baute, einen Python-CORS-Server aufsetzte und per PyObjC Browser-Fenster identifizierte und screenshottete — bis am Ende ein verifizierter Zwei-Zeilen-CSS-Fix stand. Sein Fazit: beeindruckende Eigeninitiative, aber genau diese Proaktivität macht Coding-Agenten ohne Sandbox zum Sicherheitsrisiko, etwa bei Prompt-Injection-Angriffen. Auf Hacker News aktuell eine der meistdiskutierten Stories (über 200 Punkte, 160+ Kommentare).

Warum relevant: Wer Fable 5 in Claude Code einsetzt, sollte dieses Verhalten kennen und Agenten konsequent sandboxen — Willisons Beispiele zeigen, wie weit das Modell ohne Rückfrage geht („it can do anything you can do“).

// quelle: simonwillison.net

## 📦 Modelle & Releases

▸ Preiskampf zwischen OpenAI und Anthropic: Tokens könnten günstiger werden

OpenAI erwägt laut Sam Altman deutliche API-Preissenkungen, weil Agenten-Workloads die Kosten explodieren lassen — aus ehemals ~200 Dollar im Monat werden schnell mehrere tausend — und Anthropic mit Claude Code erstmals vorne liegt. Warum relevant: Sinkende Token-Preise würden agentische Workflows mit Subagenten und langen Kontexten spürbar billiger machen. // The Decoder

▸ Apple gibt Cloud-Modelle für kleinere Entwickler kostenlos frei

Apple stellt die dritte Generation seiner Foundation Models kostenlos bereit: fünf Modelle inklusive Cloud-Varianten für Standardaufgaben, Bildbearbeitung und Reasoning — für Entwickler mit unter zwei Millionen App-Store-Downloads, betrieben über Private Cloud Compute. Warum relevant: Kostenlose Cloud-Inferenz für App-Projekte im Apple-Ökosystem, ohne eigene API-Kosten. // heise online

## 🛠️ Tools & Repos

▸ agentsview: Lokales Analytics- und Kosten-Dashboard für Coding-Agenten

Das Go-Tool (MIT, ~1,8k Stars, gerade auf GitHub Trending) indiziert lokal die Sessions von über 25 Coding-Agenten — Claude Code wird automatisch aus ~/.claude/projects/ erkannt — und bietet Volltextsuche, Token-/Kosten-Dashboards pro Modell und Aktivitäts-Heatmaps. Warum relevant: Macht endlich sichtbar, welche Claude-Code-Sessions wie viel kosten — komplett local-first. // GitHub Trending

▸ FablePool: Crowdfunding für einen Prompt — und Fable baut öffentlich

Auf der Plattform legen Fremde Geld hinter einen großen Prompt; ein KI-Agent arbeitet das Projekt dann Meilenstein für Meilenstein öffentlich ab, jede ausgegebene Credit-Einheit steht in einem öffentlichen Ledger. Als Show HN mit über 300 Punkten heiß diskutiert. Warum relevant: Ein Live-Experiment, wie weit autonome Agenten-Projekte mit echtem Budget kommen — und welche Geschäftsmodelle daraus entstehen. // Hacker News (Show HN)

## 🤖 Agenten & MCP

▸ NVIDIA SkillSpector: Security-Scanner für Agent-Skills

NVIDIAs Scanner prüft Agent-Skills vor der Installation auf 64 Schwachstellen-Muster in 16 Kategorien — von Prompt Injection über Datenexfiltration bis zu MCP-spezifischen Lücken — per statischer Analyse plus optionaler LLM-Bewertung und gibt einen Risk-Score von 0 bis 100 aus; laut zugrunde liegender Studie enthält rund ein Viertel öffentlicher Skills Schwachstellen. Warum relevant: Fremde Claude-Code-Skills und -Plugins lassen sich damit vor dem Installieren durchleuchten. // GitHub Trending

## 🏠 Self-Hosting & RAG

▸ Gemma 4 QAT-Checkpoints: gleiche Qualität, ~70 % weniger Speicher

Google DeepMind veröffentlicht Quantization-Aware-Training-Checkpoints für Gemma 4: Q4_0-GGUFs für llama.cpp/Ollama und Compressed-Tensors-Varianten für vLLM, die den Speicherbedarf drastisch senken (E2B auf ~1 GB, 26B-A4B passt auf einen 16-GB-Laptop) — bei nahezu unveränderter Qualität, weil die Quantisierung schon im Training simuliert wird. Warum relevant: Direkt im vLLM+Gemma-Stack einsetzbar — größere Modelle oder mehr Kontext auf derselben GPU, ohne den üblichen Qualitätsverlust nachträglicher Quantisierung. // Google Blog

## 🎬 Sehenswert

▸ AI Explained: Claude Fable 5 — Full 319 page Breakdown

Der gründlichste Kanal der Szene arbeitet die 319-seitige System Card von Fable 5 durch: Fähigkeiten, Sicherheitsbefunde und was zwischen den Zeilen steht. Warum relevant: Die fundierteste Einordnung des Modells jenseits des Release-Hypes. // YouTube, 10.06.

▸ The Morpheus Tutorials: Fable 5 — Claude Mythos mit Lobotomie ist öffentlich

Deutscher Take auf den Fable-5-Release: Was kann das Modell, und was bedeuten die Sicherheits-Einschränkungen gegenüber Mythos 5 in der Praxis? Warum relevant: Kompakte deutschsprachige Einordnung der Fable/Mythos-Unterschiede für den Alltag. // YouTube, 10.06.

▸ Fireship: Anthropic begged the world to stop AI… then shipped this

Fireships pointierter Blick auf den Widerspruch zwischen Anthropics Sicherheitswarnungen und dem Fable-5-Release — wie immer in fünf Minuten. Warum relevant: Der schnellste Überblick über die Debatte der Woche. // YouTube, 11.06.

## 📰 Lesenswert

▸ If you are asking for human attention, demonstrate human effort

Plädoyer für eine neue Arbeits-Etikette: Wer Kollegen ungeprüfte KI-Outputs vorlegt, signalisiert, dass ihm deren Zeit weniger wert ist als die eigene — KI-Inhalte also kennzeichnen und erst selbst lesen. Auf Hacker News mit fast 400 Punkten breit zugestimmt. Warum relevant: Trifft den Alltag jedes Teams, in dem Agenten-Output zirkuliert. // tombedor.dev

▸ Jeff Bezos’ KI-Startup Prometheus sammelt 12 Milliarden Dollar ein

Das von Bezos mitgeführte Startup wird mit 41 Milliarden Dollar bewertet und baut Sprachmodelle für physische Aufgaben in Engineering, Fertigung und Medikamentendesign; der Großteil des Geldes fließt in Rechenleistung. Warum relevant: Zeigt, wohin das nächste große Kapital im KI-Markt fließt — Richtung physischer Welt statt Chatbots. // The Decoder

$ echo "automatisch recherchiert am 2026-06-12"
> ki-news · news.reichenberg.ruhr

[ abbestellen ] [ im browser ansehen ]