Команда, создавшая GitHub Copilot, разработала ИИ-хакера, который работает на уровне опытного специалиста, но со сверхчеловеческой скоростью. ИИ-пентестер XBOW выполнил задачу за 28 минут, в то время как живому специалисту потребовалось 40 часов.
Ранее XBOW достиг беспрецедентного результата в 75% на известных веб-пентестинговых бенчмарках от PentesterLab и PortSwigger. Компания решила провести более сложное тестирование, сравнив ИИ с людьми-экспертами — были созданы новые бенчмарки, включающие все классы веб-уязвимостей, встречающихся в реальных условиях: от SQL-инъекций до IDOR и SSRF.
Для сравнения наняли пять пентестеров из известных компаний, специализирующихся на тестировании на проникновение. ИИ XBOW успешно выполнил 85% заданий бенчмарка, сравнявшись с самым опытным пентестером, имеющим 20 лет подготовки и опыта. Этот может стать переломным моментом для индустрии пентестинга, позволяющий трансформировать работу и повысить эффективность в эпоху ИИ.