Unbefugter Discord-Zugriff auf Claude Mythos von Anthropics löst neue Sicherheitsbedenken im Bereich der künstlichen Intelligenz aus

Letzte Aktualisierung: 04/24/2026
  • Eine kleine private Discord-Gruppe soll sich über eine externe Dienstleisterumgebung unbefugten Zugriff auf Claude Mythos Preview verschafft haben.
  • Mythos ist ein KI-basiertes Cybersicherheitsmodell, das im Rahmen des Projekts Glasswing einer Handvoll Unternehmens- und institutioneller Partner vorbehalten ist.
  • Die Gruppe soll den Online-Standort des Models anhand von Namenskonventionen, durchgesickerten Daten und den Privilegien eines Auftragnehmers erraten haben.
  • Anthropic untersucht den Vorfall und gibt an, dass es derzeit keine Hinweise auf Auswirkungen auf die internen Kernsysteme gibt. Der Fall wirft jedoch Bedenken hinsichtlich der Lieferkette und der Zugangskontrolle auf.

Unbefugter Zugriff auf Mythos auf Discord

Die jüngste Enthüllung von angeblicher unbefugter Zugriff auf das Claude-Mythos-Modell von Anthropic über Discord hat eine schwierige Debatte in der KI-Welt neu entfacht: Wie lassen sich leistungsstarke Cybersicherheitstools bereitstellen, ohne Angreifern genau das zu liefern, was sie brauchen? Eine kleine Online-Gruppe behauptet, Mythos wochenlang nutzen zu können, obwohl das System auf eine streng kontrollierte Vorschauversion beschränkt war.

Laut mehreren Berichten handelte es sich bei dem Vorfall nicht um einen spektakulären Hackerangriff im Hollywood-Stil, sondern vielmehr um einen Eine Kombination aus Genehmigungen von Auftragnehmern, Online-Recherchen und fundierten Vermutungen Es geht darum, wo Anthropic seine sensibelsten Systeme hostet. Für ein Modell, das darauf ausgelegt ist, Software-Schwachstellen in großem Umfang zu finden und auszunutzen, hat allein die Andeutung, dass Außenstehende damit experimentieren könnten, die Aufmerksamkeit von Sicherheitsexperten, Unternehmen und Regierungen gleichermaßen auf sich gezogen.

Was der Claude-Mythos ist und warum er wichtig ist

Claude Mythos Preview ist das neue KI-System von Anthropic mit Schwerpunkt auf Cybersicherheit.Mythos wurde als universelles Modell mit ungewöhnlich fortschrittlichen Fähigkeiten zur Erkennung und sogar Ausnutzung von Schwachstellen in Betriebssystemen und Webbrowsern präsentiert. Anstatt es öffentlich zugänglich zu machen, positionierte Anthropic Mythos als ein eingeschränktes Werkzeug zum Schutz kritischer Infrastrukturen.

Anfang April stellte das Unternehmen Mythos im Rahmen einer Initiative namens Mythos vor. Projekt GlasswingIm Rahmen dieses Programms wurde nur eine kleine Auswahl vertrauenswürdiger Organisationen eingeladen, das Modell zu testen. Berichten zufolge erhielten große Technologie- und Unternehmensakteure wie Amazon, Microsoft, Apple, Cisco und Nvidia sowie Finanzinstitute wie Goldman Sachs frühzeitig Zugang für kontrollierte Experimente.

Partner loben Mythos für die Aufdeckung einer beträchtlichen Anzahl von Sicherheitslücken. Ein prominentes Beispiel, das in der Berichterstattung über den Vorfall wiederholt angeführt wurde, ist Mozilla, das das Modell Berichten zufolge nutzte, um… Hunderte von Firefox-Sicherheitslücken identifizieren und behebenAnthropic behauptet ebenfalls, dass Mythos dazu beigetragen habe, Tausende von schwerwiegenden Sicherheitslücken in weit verbreiteter Software aufzudecken.

Diese Ergebnisse haben sowohl Optimismus als auch Besorgnis hervorgerufen. Einerseits automatisierte Erkennung subtiler Fehler und Fehlkonfigurationen Dies könnte Verteidigern helfen, Angreifern einen Schritt voraus zu sein. Andererseits birgt ein System, das komplexe Angriffstechniken vereinfacht, die Gefahr, die Cyberkriminalität zu verstärken, insbesondere wenn seine Schutzmechanismen oder sein Zugriffsmodell versagen.

Die Regulierungsbehörden haben bereits reagiert. Das britische AI ​​Safety Institute hat Mythos Berichten zufolge bewertet und ist zu dem Schluss gekommen, dass es … Mehrstufige Cyberangriffe mit begrenztem menschlichen Input ausführenDabei wurden mitunter simulierte Angriffsketten durchgeführt, für die erfahrene Fachleute normalerweise tagelange Arbeit benötigen würden. Diese Einschätzung trug dazu bei, Mythos als ein Modell wahrzunehmen, das die Messlatte für Cyberrisiken neu definiert.

Zugriffsvorfall auf KI-Cybersicherheitsmodell

Wie die Discord-Gruppe angibt, hineingekommen zu sein

Vor diesem Hintergrund erscheint das Erscheinungsbild eines lose organisierte Discord-Gruppe, die behauptet, Zugriff auf Mythos zu haben hat verständlicherweise Besorgnis ausgelöst. Die von Bloomberg und anderen Medien zusammengetragenen Berichte zeichnen das Bild eines Szenarios, in dem Neugier, Insiderkontakte und Open-Source-Recherchen zusammenwirkten, um einen vermeintlich strengen Zugangsperimeter zu umgehen.

Die Mitglieder der Gruppe nehmen an einer privater Discord-Kanal zur Verfolgung unveröffentlichter KI-ModelleIhr erklärtes Ziel ist es, zumindest öffentlich, mit innovativen Systemen zu experimentieren, die der breiten Öffentlichkeit noch nicht zugänglich sind. Die beteiligten Personen wurden nicht formell identifiziert, aber ein Mitglied soll für einen Auftragnehmer arbeiten, der Dienstleistungen für Anthropic erbringt.

Diese Verbindung zum Bauunternehmer scheint entscheidend gewesen zu sein. Berichten zufolge… privilegierter Zugriff als externer Anbieter war ein Teil des Puzzles. Neben diesem Insiderwissen nutzten die Mitglieder gängige Internetrecherchetechniken, um die Infrastruktur von Anthropic zu kartieren, sowie Vorkenntnisse darüber, wie das Unternehmen seine Modelle benennt und einsetzt.

Ein kürzlich aufgetretener Datenverlust bei Mercor, einem anderen KI-Startup, lieferte angeblich weitere Hinweise. Informationen aus diesem Datenleck, kombiniert mit früheren Namenskonventionen für anthropische Modelle, ermöglichten es der Discord-Gruppe, eine „fundierte Vermutung“ über den Online-Auftritt von Claude MythosAnstatt sich mit Gewalt Zutritt zu verschaffen, erraten sie effektiv die richtige Tür und gingen dann mit Zugangsdaten, die mit dem Auftragnehmerumfeld verknüpft waren, hindurch.

Nachdem sie Zugriff hatten, nutzte die Gruppe Mythos Berichten zufolge regelmäßig über zwei Wochen lang. Bloomberg berichtet, dass sie es überprüft haben. Screenshots und eine Live-Demonstration Dies schien zu bestätigen, dass das Modell tatsächlich lief und auf Eingaben nicht autorisierter Nutzer reagierte. Es gibt auch Behauptungen, dass andere unveröffentlichte Anthropic-Modelle mit demselben Ansatz erreichbar waren, doch Details zu diesen Systemen sind weiterhin rar.

Was die Gruppe nach eigenen Angaben mit Mythos gemacht hat

Die Discord-Teilnehmer haben sich öffentlich bemüht, sich von dem Vorwurf, Cyberkriminelle zu sein, zu distanzieren. Ein Mitglied, das in einem Bericht über den Vorfall zitiert wurde, sagte, das Interesse der Gruppe liege in … neue KI-Modelle ausprobieren, anstatt Angriffe zu startenLaut ihrer Darstellung wurde Mythos für relativ harmlose Experimente verwendet, wie zum Beispiel zum Generieren einfacher Webseiten und zum Testen von Eingabeaufforderungen.

Sie geben außerdem an, risikoreiches Verhalten vermieden zu haben, das in den Überwachungssystemen von Anthropic Alarm auslösen könnte. Die Gruppe soll offensichtlich bösartige Anfragen und auffällige Aktivitätsvolumina unterlassen und stattdessen darauf abgezielt haben, „Unbemerkt bleiben“ und gleichzeitig die Fähigkeiten des Modells erkundenAus den vorliegenden Berichten geht bisher keine konkrete Beweislage hervor, dass die Gruppe Mythos eingesetzt hat, um reale Ziele zu kompromittieren.

Selbst wenn diese Selbstbeschreibungen zutreffen, hat der Vorfall bei Sicherheitsexperten Besorgnis ausgelöst. Sobald ein gangbarer Weg in ein geschütztes System aufgezeigt wird, Nachahmer können versuchen, die Technik zu kopieren.Möglicherweise mit ganz anderen Motiven. Die Tatsache, dass diese erste Welle unautorisierter Nutzer behauptet, keine böswilligen Absichten gehabt zu haben, beruhigt die Verteidiger kaum hinsichtlich der weiteren Entwicklungen.

Der Vorfall hat auch deutlich gemacht, wie sehr der Zugriff auf sensible Daten vom Verhalten einiger weniger Personen abhängen kann. Ein einzelner Auftragnehmer mit eingeschränkten Berechtigungen und der Bereitschaft, Regeln zu beugen, reichte offenbar aus, um – in Kombination mit etwas Hartnäckigkeit in einem privaten Discord-Server – … Verletzung der beabsichtigten Isolation eines risikoreichen KI-Modells.

Die Reaktion von Anthropics und das Problem der Lieferkette

Anthropic hat die Berichte zur Kenntnis genommen und erklärt, eine formelle Überprüfung durchzuführen. In einer Pressemitteilung erklärte das Unternehmen: „Wir untersuchen einen Bericht über einen angeblichen unbefugten Zugriff auf Claude Mythos Preview über eine unserer Drittanbieterumgebungen.“ Die Formulierung ist vorsichtig, aber bedeutsam.

Das Unternehmen betont, dass es in dieser Phase über Es gibt keine Hinweise darauf, dass sich die Aktivitäten auf die Kernsysteme des Unternehmens erstreckten. oder dass seine interne Infrastruktur direkt kompromittiert wurde. Indem Anthropic das Problem als auf die Umgebung eines externen Dienstleisters beschränkt darstellt, zieht das Unternehmen faktisch eine Grenze zwischen seinen zentralen Abläufen und der Umgebung, die vom Auftragnehmer im Zusammenhang mit der Discord-Gruppe genutzt wird.

Diese Unterscheidung ist jedoch genau das, was viele Beobachter beunruhigt. Wenn Mythos aus einer externen Umgebung heraus erreichbar ist, dann Die Sicherheitslage jedes externen Partners wird Teil der Angriffsfläche.Die Situation verdeutlicht ein klassisches Lieferkettenrisiko: Selbst wenn ein Unternehmen seine eigenen Netzwerke absichert, können Schwächen oder Fehlkonfigurationen bei den Lieferanten unerwartete Türen öffnen.

Der Vorfall steht auch im Widerspruch zur Marketingstrategie des Projekts Glasswing. Die Logik des Programms war, dass Der Zugang wird streng auf eine handverlesene Liste von Organisationen beschränkt. Mythos sollte vor Angreifern geschützt werden, gleichzeitig aber nützliche Tests und Feedback ermöglicht werden. Der Exklusivitätsgedanke war zentral: Nur große, geprüfte Institutionen sollten das Modell testen können, wodurch das Missbrauchsrisiko minimiert wird.

Wenn eine informelle Discord-Gruppe bereits am Tag der Ankündigung mit der Nutzung von Mythos beginnen konnte, wird diese Darstellung schwerer aufrechtzuerhalten. Selbst wenn es noch keine Anzeichen für reale Angriffe gibt, die auf das Modell zurückzuführen sind, deutet die Episode darauf hin. Die Sicherheitsbarriere um sensible KI-Systeme könnte fragiler sein als beabsichtigt.insbesondere wenn externe Auftragnehmer und Partner miteinbezogen sind.

Weitergehende Bedenken hinsichtlich „zu mächtiger“ KI für Cybersicherheit

Über die konkreten Details dieses Falls hinaus trägt die Mythos-Geschichte zu einer umfassenderen Diskussion bei über KI-Tools, die die Grenze zwischen Verteidigung und Angriff verwischenMythos wurde als eine Art „Red Team in a Box“ beworben, das in der Lage ist, komplexe Angreifer zu simulieren und Schwachstellen aufzudecken, lange bevor menschliche Gegner darauf stoßen.

Sicherheitsforscher sind sich uneins darüber, wie diese Werbebotschaft zu interpretieren ist. Einige bezweifeln, dass ein KI-System, egal wie fortschrittlich, zuverlässig neue Schwachstellen in dem in den Marketingmaterialien suggerierten Tempo entdecken kann. Andere argumentieren, dass selbst bei nur teilweiser Richtigkeit der Behauptungen das Risiko KI-gestützte Cyberangriffe werden schneller, billiger und skalierbarer Das ist etwas, was politische Entscheidungsträger bei der Regulierung berücksichtigen müssen.

Kommentare von Branchenvertretern, darunter Führungskräfte von Cloud-Sicherheitsunternehmen, spiegeln eine Mischung aus Neugier und Besorgnis wider. Auf der einen Seite sehen die Verteidiger eine Chance, Automatisieren Sie aufwendige Analysen und Stresstests von Software unter realistischen Angriffsszenarien.Andererseits stellen sie sich vor, was passiert, wenn ähnliche Modelle gezielt für Angriffe optimiert und weiter verbreitet werden, oder wenn sich Schutzmechanismen, die schädliche Nutzungen verhindern sollen, als leicht zu umgehen erweisen.

Regierungsbehörden beginnen, diese Fragen als strategisch und nicht mehr nur als rein technisch zu behandeln. Berichten zufolge wurde die Anthroposphäre als … eingestuft. „Lieferkettenrisiko“ des US-VerteidigungsministeriumsEs gibt laufende Diskussionen darüber, was diese Bezeichnung beinhalten sollte und ob sie überarbeitet werden kann. Internationale Sicherheitsorganisationen sehen Systeme wie Mythos ebenfalls als Testfälle für den Umgang mit Dual-Use-KI-Technologien.

Der Discord-Zugriffsvorfall kommt daher zu einem heiklen Zeitpunkt. Für die Regulierungsbehörden könnte er als frühes Beispiel für die Herausforderungen bei der Kontrolle des Zugangs zu leistungsstarken KI-Modellen dienen. wie ihr Zugriff geprüft wird und welche Verpflichtungen die Anbieter haben Wenn etwas schiefgeht. Für Unternehmen, die ähnliche Tools in Betracht ziehen, wirft dies praktische Fragen hinsichtlich Dokumentation, Protokollierung und Trennung sensibler Umgebungen auf.

Was dies für Unternehmen, Nutzer und die KI-Governance bedeutet

Für Organisationen, die Mythos oder vergleichbare Systeme im Blick hatten, dürfte dieser Vorfall neue Risikobewertungen nach sich ziehen. Die zentrale Problematik ist einfach: Die gleichen Eigenschaften, die ein Modell für Verteidigungszwecke attraktiv machen, können es bei unsachgemäßer Handhabung gefährlich machen.Wenn selbst eingeschränkte Vorschauen in informelle Gemeinschaften durchsickern können, müssen die Annahmen darüber, wer diese Tools tatsächlich nutzt, möglicherweise aktualisiert werden.

Aus Sicht der Unternehmenssicherheit unterstreicht der Fall die Notwendigkeit, die die gesamte Lieferkette, einschließlich Auftragnehmer und kleinere Lieferanten und der Produktionsbereitstellung von KI-AgententeamsRichtlinien, die auf dem Papier robust erscheinen, können in der Praxis scheitern, wenn Benutzer Zugangsdaten wiederverwenden, aus Bequemlichkeit Abstriche bei der Sicherheit machen oder Testumgebungen als weniger kritisch einstufen. Organisationen könnten daher zu dem Schluss kommen, dass eine strengere Segmentierung für KI-Systeme erforderlich ist, die direkt mit Live-Code und Infrastruktur interagieren.

Für alltägliche Nutzer und Mitarbeiter ist diese Geschichte eine Erinnerung daran, dass KI nicht einfach nur eine weitere Unternehmenssoftware ist. Systeme wie Mythos können den Zeit- und Fachwissensaufwand für die Schwachstellensuche reduzieren.Dies verstärkt die Auswirkungen jeglicher Lecks oder Missbrauchsfälle. Diese Realität könnte neue interne Schulungs- und Governance-Rahmenbedingungen erfordern, die festlegen, wer unter welchen Bedingungen Hochrisikomodelle abfragen darf.

Im Bereich der KI-Governance wächst der Druck, über freiwillige Richtlinien hinauszugehen. Vorfälle wie dieser hier verdeutlichen dies. formale Standards für Zugriffskontrolle, Meldung von Vorfällen und unabhängige Prüfung für die leistungsfähigsten Modelle. Unabhängig davon, ob sich die politischen Entscheidungsträger für eine weniger strenge Aufsicht oder eine strengere Regulierung entscheiden, werden sie wahrscheinlich Fälle anführen, in denen eingeschränkt nutzbare Instrumente inoffizielle Kanäle gelangten, um dies zu rechtfertigen.

Für Anthropic selbst hängt vieles von den Ergebnissen der laufenden Untersuchung ab: wie der Zugang im Detail funktionierte, wie viele Personen beteiligt waren und welche technischen oder verfahrenstechnischen Änderungen anschließend umgesetzt werden. Ungeachtet des Ergebnisses ist der Mythos-Vorfall bereits zu einem Bezugspunkt in Diskussionen über … geworden. Wie man hochentwickelte KI im Bereich der Cybersicherheit auf die von ihren Entwicklern vorgesehenen Rollen beschränkt hältund was passiert, wenn diese Einschränkung unter Druck gerät.

Die mutmaßliche unautorisierte Zugriffsmöglichkeit von Claude Mythos auf Discord verdeutlicht, wie schnell hochmoderne KI die in Ankündigungen klar definierten Grenzen überschreiten kann. Dadurch werden Sicherheitslücken der Anbieter aufgedeckt, die Zuverlässigkeit von „Nur auf Einladung“-Versprechen auf die Probe gestellt und Unternehmen, Regulierungsbehörden und Nutzer gezwungen, den Umgang mit Tools zu überdenken, die sowohl die digitalen Abwehrmechanismen stärken als auch potenziell untergraben können, auf die sie sich verlassen.

Planung und Konstruktion von Agentenausrüstungen aus der ganzen Welt
Verwandte Artikel:
Planung und Konstruktion der Ausrüstung der IA-Agenten: von der Strategie bis zur Produktion
Zusammenhängende Posts: