Titkos, akár gyilkosságra buzdító üzeneteket adhatnak át egymásnak az Ai-modellek kiképzésük során

2025. augusztus 8. 18:21, Digital Hungary

Az Anthropic és a biztonságos mesterségesintelligencia-rendszerek fejlesztését kutató startup, a Truthful AI új, közös tanulmánya szerint az AI-modellek képesek lehetnek egymásnak titokban, a felhasználók előtt láthatatlanul rosszindulatú utasításokat továbbítani.

Tovább a teljes cikkre...

Keresés