-
Petri: Nyílt forráskódú eszköz az AI biztonsági kutatások felgyorsítására
Az mesterséges intelligencia (AI) fejlődése egyre összetettebbé teszi a rendszerek viselkedésének vizsgálatát és értékelését. Az AI modellek egyre szélesebb körben alkalmazhatók, miközben a lehetséges kockázatok és nemkívánatos magatartások száma is nő. Ennek kezelése érdekében fejlesztették ki a Petri nevű nyílt forráskódú auditáló eszközt, amely jelentősen megkönnyíti és felgyorsítja a biztonsági kutatásokat az AI rendszerek területén. Mi az a Petri és hogyan működik? A Petri, vagyis a Parallel Exploration Tool for Risky Interactions, egy automatizált rendszer, amely képes párhuzamosan vizsgálni és értékelni a mesterséges intelligencia modellek viselkedését különféle szimulált helyzetekben. Az eszköz egy automata ágenst alkalmaz, amely többfordulós párbeszédeket folytat a célzott AI rendszerrel, miközben virtuális felhasználókat és eszközöket szimulál. Ezek…
-
Új mérföldkő a prompt injection támadások elleni védelemben: megérkezett a Claude Opus 4.5 böngészőhasználathoz optimalizált változata
A mesterséges intelligenciával működő böngészőügynökök egyre szélesebb körben terjednek, és egyre összetettebb feladatokat képesek ellátni a felhasználók nevében. Ugyanakkor ezzel párhuzamosan nő a biztonsági kockázat is, különösen a „prompt injection” néven ismert támadások miatt. Ez a speciális veszélyforrás lényege, hogy rosszindulatú utasítások rejtőzhetnek a böngésző által feldolgozott tartalmakban, amelyek megzavarhatják az AI működését, vagy akár kártékony műveletekre is rávehetik azt. A Claude Opus 4.5 legújabb verziója jelentős előrelépést tett ezen a téren, így mostantól biztonságosabb és megbízhatóbb élményt nyújt a böngészőben futó AI-ügynökök használata során. Mi is az a prompt injection és miért jelent különösen nagy veszélyt a böngészőhasználatban? A prompt injection lényege, hogy a támadó rejtett, rosszindulatú parancsokat ágyaz…