Фёдор Колесов пишет:

Фёдор Колесов

Application Security engineer в Okko

· 25.03 · ред.

Как работает статический анализ кода / SAST

SAST — это статический анализ безопасности приложения. Он проверяет код без запуска программы и ищет уязвимости, опасные конструкции и ошибки обработки данных.

Важно не путать его со смежными проверками вроде secrets scanning, IaC scanning или SCA: они часто идут рядом, но это не сам SAST в чистом виде.

Если говорить проще, SAST отвечает на вопрос: “Есть ли в коде опасная логика ещё до запуска приложения?”

━━━━━━━━ Основные виды SAST-анализа ━━━━━━━

Обычно под SAST имеют в виду не один подход, а сразу несколько: ➢ сопоставление по шаблонам и дереву кода; ➢ анализ потоков данных / taint flow; ➢ семантический графовый и запросный анализ; ➢ абстрактную интерпретацию; ➢ символьное исполнение; ➢ анализ байткода и бинарных файлов; ➢ гибридные enterprise-движки.

━━━━━━━━ 1. Шаблонный анализ ━━━━━━━

Это самый понятный и массовый вариант. Инструмент разбирает код в структуру и ищет уязвимые паттерны: опасные вызовы, отключённые проверки, небезопасную работу с SQL, HTML, путями или командами. Хорошо подходит для CI и быстрого покрытия проекта, но хуже понимает сложную логику движения данных между функциями. Инструменты: Semgrep, SonarQube.

━━━━━━━━ 2. Анализ потоков данных / taint flow ━━━━━━━

Здесь уже отслеживается путь данных: откуда они пришли, через что прошли и куда в итоге попали. Такой анализ лучше находит реальные source-to-sink сценарии: SQLi, XSS, command injection, path traversal. Но он тяжелее и сложнее в масштабировании. Инструменты: CodeQL, Semgrep Pro, Fortify, Checkmarx, коммерческие security-возможности Sonar

━━━━━━━━ 3. Семантический графовый и запросный анализ ━━━━━━━

Код превращается в связную модель, после чего по ней выполняются запросы. Это уже поиск не просто по шаблону, а по комбинации условий и связей внутри приложения. Хорошо подходит для deep audit и variant analysis. Инструменты: Joern, CodeQL, Checkmarx.

━━━━━━━━ 4. Абстрактная интерпретация ━━━━━━━

Инструмент работает не с точными значениями, а с моделью возможных состояний программы. Это полезно для поиска null-related ошибок, утечек ресурсов и проблем lifecycle, но хуже заходит как основной AppSec-инструмент для веба. Инструменты: Infer, Fortify.

━━━━━━━━ 5. Символьное исполнение ━━━━━━━

Здесь анализируются ветки выполнения и условия достижения опасной точки. Подход сильный, но очень тяжёлый по времени и ресурсам. Особенно полезен для сложного C/C++ и low-level кода. Инструменты: Clang Static Analyzer, CodeChecker, Fortify.

━━━━━━━━ 6. Анализ байткода и бинарных файлов ━━━━━━━

Этот вариант анализирует уже не исходники, а bytecode, compiled packages или binary-файлы. Полезно, когда важен именно release-stage или исходники недоступны полностью. Инструменты: Veracode, Joern, Checkmarx.

━━━━━━━━ 7. Гибридные enterprise-движки ━━━━━━━

Это уже комбайны, где внутри сочетаются pattern matching, dataflow, семантический анализ, частично bytecode-анализ, а иногда ещё и SCA / IaC / secrets scanning. Удобно для enterprise, но обычно дорого и шумно без хорошего тюнинга. Инструменты: SonarQube, Semgrep AppSec Platform, Checkmarx One, Fortify, Veracode.

━━━━━━━━ Мини-итог ━━━━━━━

Если говорить субъективно, то лично мне в большинстве AppSec-задач хватает Semgrep и кастомных правил под свои кейсы. Он быстрый, понятный, легко встраивается в CI и хорошо подходит для практической работы с проектами.

У каждого свои задачи, свой стек и свои требования к глубине анализа. И в этом как раз плюс рынка: сегодня можно выбрать готовый инструмент под свой процесс или вообще собрать свой подход из нескольких решений.

#AppSec #DevSecOps #CyberSecurity #IT #SAST

Как работает статический анализ кода / SAST | Сетка — социальная сеть от hh.ru

2 коммента

Александр Рогов

· 25.03

Фёдор, серия постов просто огонь! Semgrep — моё открытие прошлого года. Написал кастомные правила для нашего Node.js-стека: ловим небезопасные eval(), неэкранированные шаблонные строки в SQL, и даже кастомный паттерн для обнаружения прямого доступа к req.body без валидации через Zod/Joi. Всё в CI — PR не мёржится без прохождения. Что интересно: с появлением AI-генерации кода SAST стал ещё важнее. Copilot/Claude генерируют код быстро, но не всегда безопасно. Автоматический SAST на каждый коммит — единственный способ не пропустить инъекцию в AI-сгенерированном коде.

Фёдор Колесов

· 25.03

Это круто, но не стоит забывать, что SAST-тулзы фолзят очень часто, а именно по статистике до 60%. Когда мне приходилось триажить тысячи алертов от Semgrep, я реализовал проект: локально развернул LLM, подключил её к CLI-агенту Qwen‑Code и скормил отчёт от Semgrep ИИ. На выходе получал более приятный отчёт за счёт возможностей taint flow и гибкости настройки. Я не делегировал ИИ сам триаж, я лишь сделал его более комфортным и смог сократить время разбора до пары часов при тысячах алертов.

еще контент автора

Фёдор Колесов

Application Security engineer в Okko

Как работает статический анализ кода / SAST

еще контент автора

войдите, чтобы продолжить

мы не знаем, безопасна ли ссылка