Die viralsten KI-Themen der letzten 24 Stunden, kuratiert fĂŒr deinen Stack.
â Top-Story
Anthropic hat heute Claude Fable 5 und Claude Mythos 5 freigegeben â das erste Mythos-Klasse-Modell fĂŒr die breite Ăffentlichkeit und laut Anthropic State of the Art auf nahezu allen getesteten Benchmarks (Software-Engineering, Wissensarbeit, Vision, Forschung). Sicherheitskritische Anfragen (Cybersecurity, Biologie) beantwortet stattdessen Opus 4.8 â das greift in unter 5 % der Sessions. Preis: 10 $/50 $ pro Mio. Input-/Output-Tokens; bis 22. Juni ist Fable 5 in Pro-, Max-, Team- und Enterprise-PlĂ€nen ohne Aufpreis enthalten, danach nur noch gegen Usage-Credits. Auf Hacker News mit ĂŒber 1.200 Punkten die mit Abstand gröĂte Story des Tages.
Warum relevant: Bis 22. Juni kannst du Fable 5 im Pro/Max-Plan kostenlos in Claude Code testen (ab Version 2.1.170) â das Zeitfenster lohnt sich fĂŒr einen direkten Vergleich mit Opus 4.8 an deinen echten Projekten.
(Anthropic · weitere Quellen: The Decoder, TechCrunch)
Apple hat auf der WWDC den kompletten KI-Neustart von Apple Intelligence vorgestellt: Die neue Siri basiert auf einer eigens angepassten Gemini-Architektur und durchsucht Mails, Nachrichten und Fotos auf dem GerĂ€t â EU-iPhones bleiben zum Start aber auĂen vor. Warum relevant: Falls du Apple-GerĂ€te nutzt, heiĂt es abwarten â der EU-Rollout ist offen, und die Diskussion um DMA-bedingte Feature-Verzögerungen geht in die nĂ€chste Runde. (heise online)
Xiaomi serviert sein 1T-Parameter-Modell dank FP4-Quantisierung, DFlash-Speculative-Decoding und der TileRT-Runtime mit Spitzen um 1.200 Tokens/s â auf handelsĂŒblichen GPUs, nicht auf Spezial-Silizium; der FP4-DFlash-Checkpoint ist auf Hugging Face offen verfĂŒgbar (608 HN-Punkte). Warum relevant: Die Technik-Kombination FP4 + Speculative Decoding zeigt, wohin Inference-Optimierung geht â Konzepte, die mittelfristig auch in vLLM landen dĂŒrften. (Xiaomi MiMo Blog · MarkTechPost)
Der heute mit +1.800 Sternen auf GitHub Trending durchstartende Vektorindex setzt auf TurboQuant-Quantisierung, ist in Rust geschrieben und bringt Python-Bindings mit (10.000 Sterne gesamt). Warum relevant: FĂŒr deine RAG-Pipeline einen Blick wert â als leichtgewichtige Embedded-Alternative zu Qdrant fĂŒr kleinere Kollektionen oder als Benchmark-Vergleich. (GitHub)
Angreifer kompromittierten mindestens 70 Microsoft-Repos auf GitHub (v. a. Azure-Tooling); die Malware griff Credentials ab, sobald die Pakete in KI-Coding-Tools wie Claude Code, Gemini CLI oder VS Code geöffnet wurden â Microsoft hat betroffene Repos vorĂŒbergehend offline genommen. Warum relevant: Wenn du Azure-nahe Pakete oder MCP-Server aus diesen Repos nutzt, jetzt Dependencies prĂŒfen und ggf. Tokens rotieren. (TechCrunch)
Die Releases der letzten Tage bringen Fable-5-Support (2.1.170), ein --safe-mode-Flag zum Start ohne CLAUDE.md/Plugins/Hooks/MCP, den /cd-Befehl zum Verzeichniswechsel ohne Prompt-Cache-Verlust, das fallbackModel-Setting mit bis zu drei Fallbacks sowie Glob-Patterns in Deny-Regeln. Warum relevant: --safe-mode ist das neue Mittel der Wahl, um Probleme mit eigenen Hooks/Skills sauber zu isolieren â und Fallback-Modelle fangen Rate-Limits in Automationen ab. (Claude Code Docs)
Der RC der nĂ€chsten MCP-Spec macht das Protokoll auf Kernebene stateless (skaliert damit auf gewöhnlicher HTTP-Infrastruktur), fĂŒhrt Extensions, Tasks fĂŒr langlaufende Jobs und server-gerenderte UIs (MCP Apps) ein und hĂ€rtet die OAuth-Autorisierung; final wird die Spec am 28. Juli. Warum relevant: Wer eigene MCP-Server betreibt, sollte jetzt gegen den RC testen â die Stateless-Umstellung betrifft Session-Handling direkt. (MCP Blog)
Google DeepMinds neues Open-Weights-Modell (Apache 2.0) verarbeitet Text, Bilder, Audio und Video nativ ohne separate Encoder, lĂ€uft mit 16 GB VRAM/Unified Memory und erreicht fast das Niveau des 26B-VorgĂ€ngers. Warum relevant: Der natĂŒrliche Upgrade-Pfad fĂŒr dein vLLM+Gemma-Setup â gleiche Hardware, dazu Audio/Video-VerstĂ€ndnis fĂŒr neue RAG-AnwendungsfĂ€lle. (Google Blog · The Decoder)
Das Patch-Release bringt Support fĂŒr JetBrains' offenes MoE-Code-Modell Mellum v2, behebt CUTLASS-Initialisierungsprobleme bei DeepSeek-V4, beschleunigt quantisierte Inferenz (W8A8/W4A16) auf AMD-Zen-CPUs und fixt einen HĂ€nger beim Multi-Node-Serving mit Ray. Warum relevant: Routine-Update fĂŒr deinen Inference-Server â besonders falls du quantisierte Modelle auf CPU-Backends testest. (GitHub)
Das Release behebt zwei SicherheitslĂŒcken (Whitelist-Bypass in der REST-Authentifizierung, Heap-Read ĂŒber manipulierte Snapshots) sowie eine potenzielle Endlosschleife im Optimizer bei Multi-Vektoren. Warum relevant: Dein Qdrant sollte zeitnah auf 1.18.2 â gerade wenn die REST-API ĂŒber das LAN hinaus erreichbar ist. (GitHub)
Knowledge Bases lassen sich jetzt automatisch mit lokalen Ordnern, GitHub-Repos und S3-Buckets synchronisieren (mit Delta-Erkennung), bekommen verschachtelte Ordnerstrukturen und ein Filesystem-Tool, mit dem Modelle KB-Inhalte per ls/cat/grep durchsuchen; Skills sind nun pro Chat zuschaltbar. Warum relevant: Der KB-Sync könnte Teile deiner eigenen Ingestion-Skripte ersetzen â Delta-Erkennung inklusive. (GitHub)
Die Command-Injection in LiteLLMs MCP-Test-Endpoints (CVSS 8.7) steht jetzt im CISA-KEV-Katalog und lĂ€sst sich mit der Starlette-LĂŒcke âBadHost" (CVE-2026-48710) zu unauthentifiziertem RCE verketten; Abhilfe: LiteLLM â„ 1.83.7 und Starlette â„ 1.0.1. Warum relevant: Falls irgendwo in deinem Stack ein LiteLLM-Proxy lĂ€uft (auch als OpenWebUI-Backend), sofort patchen â Starlette steckt zudem in vielen Python-API-Stacks. (The Hacker News · Help Net Security)
Bermans Einordnung des Fable-5/Mythos-5-Launches vom heutigen Tag â erste EindrĂŒcke, Benchmarks und was die Safeguards in der Praxis bedeuten. Warum relevant: Schneller Ăberblick zur Top-Story, bevor du selbst Credits investierst. (YouTube)
Fireships gewohnt zugespitzter Blick auf den Spagat, dass Anthropic erst vor Gefahren der KI warnt und Tage spĂ€ter sein bislang stĂ€rkstes Modell veröffentlicht. Warum relevant: Die Gegenperspektive zum Launch-Hype in fĂŒnf Minuten. (YouTube)
Eine Woche nach Anthropic hat auch OpenAI vertraulich einen S-1 bei der SEC eingereicht (âWir erwarten, dass es leakt, also kĂŒndigen wir es einfach an"); Analysten erwarten ein Listing möglicherweise ab September bei ĂŒber einer Billion Dollar Bewertung. Warum relevant: Beide groĂen Modellanbieter werden börsennotiert â das dĂŒrfte Preis- und Produktpolitik (Stichwort Usage-Credits) spĂŒrbar prĂ€gen. (The Decoder · OpenAI)
Automatisch recherchiert am 2026-06-09 · KI-News · news.reichenberg.ruhr
Newsletter abbestellen ·
Im Browser ansehen