Reasoning-First Architecture
Илья Пицкалёв · основатель Zorky CRM · 29 мая 2026
В 2026 HR-tech почти единогласно делает одну и ту же ставку: LLM-агенты заменят recruiting matching к 2027 году. Josh Bersin рисует это как верхний слой (Layer 4) Talent Intelligence стека. Ставка очевидная и почти консенсусная.
Я ставлю против.
Не потому что я против AI — я работаю с AI каждый рабочий день, и в продукте, о котором пойдёт речь, каждая строка кода написана через Claude, ни одной не написал я руками. А потому что 135 000+ вакансий и 1,1 млн Telegram-сообщений, прошедших через мою систему с апреля 2026, показали мне обратное: детерминистическое reasoning-first ядро + LLM как augmentation (а не замена) выигрывает по точности, задержке, стоимости и соответствию EU AI Act. Эта статья — о том, почему.
Кто я и почему пишу
Я начинал в SEO в 2006. Двадцать лет наблюдения за тем, как content + structure + retrieval-алгоритмы формируют outcomes для миллиардов запросов в день. HR-tech matching устроен ровно так же: content (описания вакансий, резюме) + structure (роли, стек, грейды) + retrieval (алгоритмы) → outcome (нужный человек на нужном месте).
TD-CRM v2 — рекрутинговая CRM для рынка CIS-IT: 135 000+ вакансий (61 000+ открытых), 1,1 млн обработанных Telegram-сообщений, ~1 990 отслеживаемых каналов, 14 направлений, 15 стран. Система публично само-классифицирована как high-risk по EU AI Act, Annex III п.4. И построена она не инженером — я не пишу код. Я задаю архитектуру и продуктовые решения, имплементацию генерит Claude — паттерн, который Андрей Карпатый в марте 2026 назвал «agentic engineering». На том же паттерне Replit достиг оценки $3B в сентябре 2025. Я не первый, кто так строит — я просто открыто заявляю, что строю именно так.
И вот почему я решился писать против почти-консенсуса. Когда смотришь на 135 000 вакансий не сверху, а руками, видно простое: подавляющая часть матчинга решается детерминированно — стек, грейд, формат, гео, вилка. LLM реально нужен на парсинге грязного текста, не на самом решении. А индустрия закладывает LLM именно в решение. Двадцать лет в SEO я видел, чем это кончается, когда fuzzy-слой ставят туда, где нужна воспроизводимость и объяснимость. Для меня это не теоретический спор о трендах — это то, что я каждый день вижу в собственных данных.
В чём ставка индустрии неверна
LLM-first matching — неправильная ставка по четырём осям: точность, стоимость, соответствие регуляторике и трассируемость.
Точность. LLM-fuzzy matching несёт встроенную вариативность от вызова к вызову: та же пара кандидат/вакансия получает разный скор между прогонами. Для чат-бота приемлемо; для матчинга, где решение становится частью audit trail, — это дефект.
Стоимость. LLM-вызов на каждую попытку × тысячи матчей в день = счета в тысячи долларов в месяц, которых pre-revenue не выдержит. Детерминистический field-matching — практически нулевая маржинальная стоимость.
Соответствие регуляторике. EU AI Act, Annex III п.4 входит в enforcement в августе 2026. High-risk-системы обязаны вести лог решений с основанием каждого. Лог LLM-first: «сматчил, потому что так сказала модель». Лог reasoning-first: «пересечение стека 8/12, Senior (7 лет), Remote (true), пересечение вилки. Скор 0.84». Один из этих логов существует в audit trail. Другой — нет.
Трассируемость для DD. Юрист покупателя спрашивает «как именно сматчили?». LLM-first непрозрачен; reasoning-first объясним по построению. Рыночный сигнал — Eqtble → Paradox (февраль 2025): people-analytics без trading-grade данных классифицируется как HR-tech. Та же логика: LLM-fuzzy без трассируемых правил — не serious HR-tech.
Оговорка против straw-man: LLM — не «плохо». LLM в неправильном слое — вот что плохо.
Какая архитектура правильна
Reasoning-first означает: любое решение, которое должно быть защитимым — матчинг, скоринг, ранжирование — проходит через детерминистические правила первым. LLM используется ТОЛЬКО там, где нет детерминистической альтернативы (free-form парсинг текста), где неопределённость явно признана (confidence-скор + деградированный путь), и где вывод не идёт напрямую в финальное решение. В TD-CRM matching-скор считается явной формулой (пересечение стека + грейд + роль + формат + вилка), а не запросом «модель, оцени».
Монолит вместо микросервисов — осознанно: один основатель + Claude = нет команды нести overhead распределённых систем; детерминистическое ядро требует единого источника истины. По ADR-0001 — единый FastAPI + PostgreSQL + Redis + arq-воркер + SSR. Паттерн «Modern Monolith» в духе DHH / 37signals: не contrarian ради contrarian, а когерентно с reasoning-first.
По решению D10 система публично само-классифицируется как high-risk (Annex III п.4): лог решений (Loki + структурированное логирование), управление рисками, человеческий надзор (рекрутер проверяет все матчи, авто-действий нет), data governance. Само-классификация — упреждение находки DD; честное раскрытие строит доверие.
Coverage-gap: вертикальный pipeline как актив
LinkedIn заблокирован в России с ноября 2016 года. Глобальные вендоры talent-intelligence — Lightcast, Revelio Labs, People Data Labs — берут большинство данных из LinkedIn; их покрытие к востоку от линии Риги падает примерно на 40% (моя оценка, на основе их публичных заявлений). Это структурный gap, не временный.
Вместо этого — Telegram-MTProto pipeline: ~1 990 отслеживаемых CIS-IT каналов, 1,1 млн обработанных сообщений. Данные, которые глобальные вендоры физически не получат (санкции, заблокированные сервисы, технический доступ). Марк Касадо (a16z, 2019, «The Empty Promise of Data Moats») показал, что масштаб данных сам по себе — не сильный ров; а вот pipeline-IP труднее воспроизвести. Наш фокус на CIS-IT — не вынужденная слабость, а дифференцирующий актив.
Agentic engineering: кто и как это построил
Раскрою прямо: TD-CRM v2 построен на 100% через Claude. Я не пишу код — направляю архитектурные и продуктовые решения, Claude генерит имплементацию. Карпатый в марте 2026 разделил паттерн на «vibe coding» (поднимает порог для не-кодеров) и «agentic engineering» (сохраняет планку качества). Разница — в доказательствах строгости: 14 ADR в docs/adr/, observability (Loki + Grafana + Prometheus), еженедельный скан зависимостей (ADR-0013), публичный changelog из Conventional Commits, контракторское ревью security/PII-путей до сделки.
Replit достиг $3B в сентябре 2025 на этом паттерне (ARR $2.7M → $70M за 12 месяцев). Это уже валидировано рынком. Покупатель прочитает это как «основатель со строгостью + AI-leverage», а не «навайбкодил» — разница в плотности артефактов: эта серия ADR, changelog, runbook, observability и сама эта статья.
Угол покупателя
Если ты corp-dev аналитик в Greenhouse, Workable, iCIMS или Lightcast — эта статья и для тебя. Прямо: TD-CRM pre-revenue, 0 платящих клиентов, $0 ARR. Мы не цель поглощения в смысле «команда + клиентская база» — мы три отдельных актива.
Первый — pipeline-IP: 135 000+ вакансий, 1,1 млн сообщений, ~1 990 каналов с апреля 2026; данные, которые Lightcast/Revelio физически не соберут. Построить эквивалент = 18-24 месяца + санкционный риск + Telegram-API экспертиза. Второй — reasoning-first matching/scoring код, воспроизводимый в инфраструктуре покупателя. Третий — юрлицо Estonia OÜ (Q2 2026), EU-юрисдикция, без осложнений с происхождением.
Почему reasoning-first важен покупателю: enforcement EU AI Act с августа 2026 ударит по LLM-first продуктам болью compliance-ретрофита. Reasoning-first уже соответствует и уже отгружается — ускорение, а не доработка. Чего покупатель не получает: клиентскую базу (0), бренд, команду, ARR (0) — это не закладывается в цену. Сумма трёх активов — ниже $15M.
Закрытие
Это ставка: один solo-основатель + Claude как agentic engineer + несколько недель = reasoning-first архитектура + CIS-IT pipeline + 14 ADR. Ставка в том, что эта комбинация переиграет LLM-first глобальных агрегаторов в HR-tech matching к концу 2027. Публикую сейчас — чтобы зафиксировать ставку до результата, а не после.
Если есть аргументированная критика — пиши. Честный pushback ценнее молчаливого сомнения. И никакого «запросите демо» в конце: если статья не убедительна сама по себе, демо это не починит.