AI / LLM Engineer в IT — рынок СНГ и Европы
AI / LLM Engineer — самая молодая, но самая громкая роль внутри AI/ML/DS направления, выделившаяся в 2023 на волне ChatGPT / GPT-4 / Claude / Llama 2. Focus: integration больших языковых моделей (LLM) в продукт — НЕ обучение foundation-моделей с нуля (это Research), НЕ classical ML pipelines (это ML Engineer / Data Scientist), а прикладной LLM engineering: prompt engineering + RAG (Retrieval-Augmented Generation) + fine-tuning через LoRA / QLoRA + agent architectures + tool use + evaluation. Семейство ролей: AI Engineer (general — LLM integration в одну продуктовую feature: chatbot / summarization / classification / Q&A), LLM Engineer (LLM-deep — оптимизация серверной части: vLLM / TGI / SGLang serving, KV cache tuning, quantization, speculative decoding), Generative AI Engineer (broader — включает image / video / audio: Stable Diffusion / Flux / Suno / ElevenLabs), AI Agent Engineer (rising 2025-2026 — autonomous agents с tool calling, multi-step reasoning, LangGraph / AutoGen / CrewAI / Microsoft Semantic Kernel), Senior AI Engineer (multi-product LLM architecture + cost optimization). Стек 2026: Python (монопольно). LLM providers: OpenAI API (GPT-4 / GPT-4 Turbo / o1 / o3 — reasoning models 2024-2026), Anthropic API (Claude Sonnet 4 / Opus 4.5 — coding + long-context leader), Google Gemini (1.5 Pro / Flash — best multimodal), Mistral (open-weights Large), Cohere (Command R+ — RAG-optimized), Groq + Together AI + Fireworks + Replicate (fast inference of open models). Open LLM 2026: Llama 3 / 3.1 / 3.2 / 3.3 (Meta — open-weights leader), Mistral / Mixtral, Qwen 2.5 (Alibaba — sleeper hit 2024-2026), DeepSeek V3 / R1 (reasoning open-source), Phi 3 (Microsoft small-language-model), Gemma 2 (Google). Frameworks: LangChain (доминирует — 100K+ stars GitHub, despite criticism за complexity), LlamaIndex (RAG-focused — data ingestion + indexing mastery), Haystack (deepset), Semantic Kernel (Microsoft), AutoGen (Microsoft multi-agent), CrewAI (multi-agent — rising), LangGraph (LangChain agent extension — DAG-style), Dspy (Stanford — declarative LLM programming, growing). Vector databases: Pinecone (managed leader — premium), Weaviate (open-source — modular), Qdrant (Rust — fast self-hosted), Milvus (enterprise scale), Chroma (lightweight dev), pgvector (Postgres extension — production-friendly), Elasticsearch dense_vector + Redis Stack (hybrid). Embeddings: OpenAI text-embedding-3 + Cohere Embed v3 + sentence-transformers (open-source — BGE / E5 / Stella). Fine-tuning: LoRA + QLoRA (PEFT библиотека Hugging Face), full fine-tuning rare (cost prohibitive). RLHF / DPO: TRL library (Hugging Face). Serving: vLLM (PagedAttention — рекорд throughput), TGI (Text Generation Inference — Hugging Face), SGLang (programming model для serving + caching), Ollama (local), llama.cpp (CPU + edge). Evaluation: RAGAS, DeepEval, lm-evaluation-harness, Inspect AI (UK AISI), Promptfoo, LangSmith (LangChain trace + eval — best UX). Observability: Helicone, LangSmith, Langfuse (open-source), Arize Phoenix, Datadog LLM Observability. Cost: per-token tracking + prompt caching (Anthropic / OpenAI native + custom Redis layer). По данным Zorky CRM, открыто 8 активных вакансий (молодая ниша — пул будет расти), медиана $14614/мес. Топ-стек: salesforce, figma, go, databricks, docker. 50.0% — удалёнка. AI Engineer — премиум $6500-11000/мес Senior, в frontier-AI labs (Anthropic / OpenAI / Cohere / Mistral) — $12000-22000+, топ-выбросы $30000-50000+ для Foundation Model engineering.
Сравнение с другими специализациями
Внутри направления AI / ML / DS есть 6 специализаций. Текущая (AI / LLM Engineer) отмечена синим — сравните её по числу открытых вакансий и медиане зарплат с соседними.
Динамика спроса
AI Engineer — fastest-growing AI/ML sub-niche (выделилась в 2023 после ChatGPT boom). Реальный рынок шире виден pool — many AI roles classified как general ML Engineer / Backend в нашем matcher'е (titles типа «Senior Backend Engineer with AI focus»). Драйверы 2026: LLM adoption в всех продуктах (chatbots / summarization / Q&A / code-assist), RAG-applications для enterprise knowledge bases, agentic workflows (rising 2025-2026), Foundation Model startups race (Anthropic / OpenAI / Cohere / Mistral / Llama-derivatives). Российские AI: Сбер.AI (GigaChat) + Яндекс (Yandex.GPT) + Тинькофф + Ozon — стабильный поток. International remote через frontier-AI labs + Y Combinator AI-startups — премиум сегмент.
Сколько новых вакансий появляется каждую неделю.
Распределение по уровням — динамика
Как меняется доля Junior/Middle/Senior/Lead в открытых вакансиях по неделям. Тренды к Senior — обычно признак «зрелого» рынка специализации, где компании ищут готовых специалистов; обратное — рост Junior — сигнал расширения и набора в команды с нуля.
Доля каждого уровня в % от всех вакансий с указанным грейдом за неделю.
Зарплата по уровням
Junior — typical entry Backend Senior / ML Engineer Middle + LLM portfolio (RAG + LangChain experience demonstrable). Career-flow: Backend Senior / ML Middle (2-3 года) + LLM interest → AI Engineer Junior (1-2 года) → Middle (2-3 года) → Senior → либо Staff / Principal AI Engineer, либо AI Tech Lead / Engineering Manager, либо переход в frontier-AI lab (Anthropic / OpenAI / Cohere — premium track), либо AI startup founder. Если данных мало по grade'ам — обращайтесь к страницам ml-engineer + research для broader benchmarks.
Медианная зарплата (USD/мес) на каждом грейде + прирост к предыдущему.
Самый большой денежный прыжок — между Senior и Lead (+45.6%).
Распределение зарплат — динамика
Медианная AI Engineer-зарплата — $14614/мес — премиум-сегмент за счёт rare-skill combination. Распределение основано на small sample (молодая ниша). $7K+ — Senior с production RAG / agent architecture experience. $10K+ — Senior в международных tech-companies или frontier-AI labs (Anthropic / OpenAI / Cohere / Mistral / Hugging Face). $15K+ — Foundation Model engineering (DeepMind / Meta AI training teams) — топ-выбросы $25K-50K для exceptional candidates с published research.
Какую долю вакансий занимает каждый ценовой диапазон по неделям.
62% вакансий — в диапазоне $5–8K (это основной рынок). Высокий сегмент $8K+: 24% — обычно это US-remote или senior-international роли.
География найма
Лидер по числу AI Engineer-вакансий — EN (5 позиций) — но pool молодой нишы небольшой, не репрезентативен в полную меру. Россия — Сбер.AI + Яндекс + Тинькофф + Ozon + VK + EPAM AI Practice доминируют. Польша — AI-friendly EU-хаб (Варшава / Краков). Германия — Berlin AI-cluster (Aleph Alpha + Black Forest Labs). Франция — Paris (Mistral + Hugging Face HQ). UK — London (DeepMind / Cohere). США — Bay Area (крупнейший AI hub). Огромный международный remote через Anthropic / OpenAI / Cohere / Mistral / Hugging Face / Y Combinator AI-startups.
Распределение вакансий по странам.
Эти числа отражают распределение по источникам, которые мы парсим. Польша часто выглядит доминирующей из-за плотного coverage NoFluffJobs / JustJoin.it / Pracuj — польского IT-рынка действительно много, но в нашей выборке его доля переоценена относительно реального объёма всех IT-вакансий в регионе. То же — про другие топ-страны: это «куда смотрят наши парсеры», не «истинный размер рынка».
Удалёнка / Гибрид / Офис — динамика
50.0% AI Engineer-вакансий — удалёнка или гибрид. AI work fully cloud-based (LLM APIs + vector DBs + cloud GPUs). Аутсорсеры — почти всегда remote. Международные frontier-AI labs — full-remote standard для exceptional candidates. Big Tech AI — гибрид-standard. Y Combinator AI-startups — premium full-remote.
Как меняется доля каждого формата работы по неделям.
89% — удалёнка. Specializация хорошо адаптирована к remote-формату.
Топ востребованных технологий
Топ-стек AI Engineer 2026: Python deep + Backend basics (async / FastAPI / pytest), LLM providers (OpenAI / Anthropic / Google Gemini / Mistral / Cohere / Groq / Together AI / Fireworks / Replicate), Open LLM (Llama 3.x / Mistral / Qwen 2.5 / DeepSeek V3+R1 / Phi 3 / Gemma 2), LLM frameworks (LangChain mastery + LlamaIndex + Haystack + Semantic Kernel + LangGraph + AutoGen + CrewAI + DSPy), Vector DBs (Pinecone / Weaviate / Qdrant / Milvus / Chroma / pgvector / Elasticsearch dense_vector / Redis Stack), Embeddings (OpenAI text-embedding-3 + Cohere Embed v3 + sentence-transformers BGE/E5/Stella), Fine-tuning (LoRA + QLoRA via PEFT + Unsloth + Axolotl), Serving (vLLM + TGI + SGLang + Ollama + llama.cpp + MLX), Evaluation (RAGAS + DeepEval + lm-evaluation-harness + Inspect AI + Promptfoo + LangSmith), Observability (Helicone + LangSmith + Langfuse + Arize Phoenix + Datadog LLM Observability), Safety (NeMo Guardrails + Llama Guard + OpenAI Moderation).
Технологические комбинации
Частые пары: Python + LangChain + OpenAI API + Pinecone (classic RAG stack), Python + LangChain + Anthropic Claude + Qdrant (Anthropic-focused), LlamaIndex + OpenAI text-embedding-3 + pgvector (lightweight RAG), LangGraph + OpenAI function calling + custom tools (agent stack), vLLM + Llama 3.1 70B + Qdrant (self-hosted production), PEFT + Unsloth + Axolotl + Llama 3.x 8B (fine-tuning stack), DSPy + GPT-4 + RAGAS (declarative LLM programming). Learning-roadmap: Python + Backend basics → LLM fundamentals (Karpathy YouTube) → OpenAI API mastery → Anthropic Claude mastery → LangChain → RAG architecture deep → Vector DB mastery → fine-tuning hands-on (LoRA / QLoRA) → vLLM serving → evaluation (RAGAS) → observability (LangSmith) → agent frameworks (LangGraph / AutoGen / CrewAI / DSPy) → pet-project portfolio.
Какие пары технологий чаще всего встречаются вместе в одной вакансии.
Откуда мы видим эти вакансии
AI Engineer-вакансии: hh.ru (особенно Сбер.AI / Яндекс / Тинькофф active), Habr Career, getmatch, Djinni, LinkedIn (огромный международный AI Engineer сегмент — Anthropic / OpenAI / Cohere / Mistral / Hugging Face / Y Combinator AI-startups), NoFluffJobs / JustJoin.it (Польша AI-friendly), Telegram (@ai_engineer_ru, @ml_jobs, @aijobs, @jobsforaiml, @prompt_engineering_ru), карьерные сайты EPAM AI Practice / Luxoft AI / Andersen AI, специализированные борды aijobs.net + ai-jobs.net + builtin.com/jobs/ai + jobs.lever.co для AI-startups, Y Combinator Work at a Startup (largest AI-startup channel), AI-lab direct careers (Anthropic / OpenAI / Cohere / Mistral / Hugging Face / Stability / Replicate / Together AI / Perplexity / Inflection / Adept / xAI).
AI / LLM Engineer vs другие направления
AI Engineer пересекается с ML Engineer (production ML overlap — но AI focuses на LLM-based features), Data Scientist (LLM-aware DS — prompt engineering для analysis), Research Engineer (deeper LLM science — papers + Foundation Model training), Backend (production-grade integration depth), MLOps (LLM serving infrastructure overlap). Сравнение с ml-engineer/data-scientist/research/mlops — в SiblingSubnichesChart выше.
Объём открытых вакансий по направлениям IT.
Свежие вакансии
Свежие открытые AI Engineer-вакансии — последние позиции в выборке (молодая ниша, sample небольшой). Полный список — в нашем CRM или по ссылке «смотреть все» ниже. Для broader view посмотрите ml-engineer + research страницы.
Что мы можем предложить
Если работаете с AI / LLM Engineer-вакансиями или сами в этой роли — мы можем закрыть конкретную задачу. Выберите формат, оставьте контакт — отвечаем в течение суток.
Частые вопросы
Самые частые вопросы про AI / LLM Engineer: зарплаты (премиум-сегмент за rare-skill), AI Engineer vs ML Engineer vs Data Scientist (3-way comparison), RAG vs Fine-tuning vs Prompt Engineering (decision tree + cost reality), AI Agent Engineer (rising 2025-2026 sub-specialization), удалёнка, как стать (2-4 месяца из Backend Senior — fastest entry в ML world), Senior skills (LangChain + RAG advanced + agent architectures + cost optimization + open-source contributions). Ответы пересчитываются автоматически.
Сколько зарабатывает AI Engineer в 2026?
Медиана AI Engineer — $14614/мес по данным Zorky CRM (8 активных вакансий — молодая ниша, пул будет расти за счёт LLM adoption в продуктах). AI Engineer — премиум-сегмент за счёт rare-skill combination (Python + LLM expertise + product-thinking). Senior с production RAG / agent architecture experience — $7000-11000. Senior в US/EU-аутсорсе (EPAM AI / Luxoft AI на enterprise GenAI projects) — $7500-12000. Staff / Principal AI Engineer — $10000-15000. International remote (Anthropic / OpenAI / Cohere / Mistral / Hugging Face / Stability / Replicate / Together AI / Perplexity / Y Combinator AI-startups) — $9000-18000+ Senior. Foundation Model engineering (Anthropic / OpenAI / DeepMind / Meta AI training teams) — топ-выбросы $20000-50000+ для exceptional candidates с published research.
Какая зарплата у AI Engineer Junior, Middle, Senior, Lead?
Junior — typical entry: Backend Middle / ML Engineer Middle / Data Scientist Middle + LLM hobby projects (RAG + LangChain experience demonstrable). Скачок Junior → Middle — после первого production LLM-feature deployment (chatbot / summarization / Q&A в реальном продукте с реальными пользователями). Middle → Senior — multi-feature LLM ownership + cost optimization (typical mandate: 50-70% reduction в LLM API costs через caching + smaller models + RAG vs fine-tuning trade-offs) + evaluation methodology. Senior → Staff / Principal — org-wide AI strategy + multi-product LLM platform architecture. Career-flow: Backend Senior / ML Engineer Middle (2-3 года) + LLM interest → AI Engineer Junior / Middle (1-2 года) → Senior → либо Staff / Principal AI Engineer, либо AI Tech Lead / Engineering Manager, либо переход в frontier-AI lab (Anthropic / OpenAI / DeepMind — premium track), либо AI startup founder.
Сколько платят AI Engineer в Москве, СПб, удалённо?
Москва Senior AI Engineer — $6500-10500/мес (Сбер.AI — крупнейший AI-работодатель РФ для GigaChat + Kandinsky + banking AI; Яндекс — Yandex.GPT + Алиса AI + Search AI + Маркет recommender AI; Тинькофф — chatbot + voice AI; Ozon — search AI + recsys AI; VK — Mail.ru AI + продукты AI; X5 Group — retail AI; МТС AI). СПб $6000-9500 (JetBrains AI Assistant team, EPAM AI SPb). Минск/Киев $5500-9000 Senior. Польша €7000-11000 gross Senior. Германия €80-120K/год Senior (Berlin AI-cluster — Aleph Alpha / Black Forest Labs). UK £75-130K Senior (London — DeepMind / Cohere). 50.0% — удалёнка. Аутсорсеры с GenAI Practice (EPAM AI / Luxoft AI / Andersen AI / DataArt AI) — почти всегда remote, $7500-12000 Senior на US-AI-projects. Международные frontier-AI labs (Anthropic / OpenAI / Cohere / Mistral / Hugging Face / Stability / Replicate / Together AI / Perplexity / Inflection / Adept / xAI) — full-remote $9000-18000+ Senior для русскоязычных с английским. Big Tech AI (Google DeepMind / Meta AI / Microsoft AI / Apple ML / Amazon AGI) — $13000-25000+ Senior + RSU.
Какой стек чаще всего требуют от AI Engineer?
Топ-5: salesforce, figma, go, databricks, docker. Python deep (монопольно — async / typing / FastAPI). LLM providers integration: OpenAI API mastery (chat completions + function calling + structured outputs + assistants + o1/o3 reasoning models), Anthropic API (Claude — best для coding + long-context до 200K), Google Gemini (multimodal), Mistral / Cohere / Groq / Together AI / Fireworks / Replicate (alternative providers + inference). Каждый provider имеет свои quirks (rate limits + retry strategies + cost per token + features support). Open LLM знание 2026: Llama 3.x (Meta — open-weights workhorse), Mistral / Mixtral, Qwen 2.5 (Alibaba — sleeper hit), DeepSeek V3 / R1 (reasoning open-source — released Dec 2024, disrupted market), Phi 3 (Microsoft SLM), Gemma 2 (Google). LLM Frameworks: LangChain mastery — самый ёмкий job market (LCEL — LangChain Expression Language, callbacks, agents, retrievers), LlamaIndex (RAG-focused — data ingestion + indexing strategies), Haystack (deepset), Semantic Kernel (Microsoft for .NET shops), LangGraph (DAG-style agent orchestration — LangChain), AutoGen + CrewAI (multi-agent — rising), DSPy (Stanford — declarative LLM programming, growing). Vector databases mastery: Pinecone (managed leader), Weaviate (open-source modular), Qdrant (Rust-based — fast self-hosted), Milvus (enterprise scale), Chroma (lightweight dev / prototyping), pgvector (Postgres extension — production-friendly для existing Postgres shops), Elasticsearch dense_vector + Redis Stack (hybrid full-text + vector). Embeddings: OpenAI text-embedding-3-large/small (industry standard 2024-2026), Cohere Embed v3, sentence-transformers open-source (BGE / E5 / Stella — top на MTEB benchmark), multimodal embeddings (CLIP variants). Fine-tuning: LoRA + QLoRA через PEFT library (Hugging Face — standard 2026), Unsloth (faster LoRA training), Axolotl (config-driven fine-tuning). Full fine-tuning rare (cost prohibitive). RLHF / DPO / KTO: TRL library (Hugging Face — Direct Preference Optimization рост 2024+). Serving: vLLM (PagedAttention + continuous batching — рекорд throughput для open models), TGI (Text Generation Inference — Hugging Face), SGLang (programming model для serving + KV caching), Ollama (local development), llama.cpp (CPU + edge — Apple Silicon optimized), MLX (Apple's framework). Evaluation: RAGAS (RAG-specific — faithfulness + answer relevancy + context precision), DeepEval, lm-evaluation-harness (academic benchmarks), Inspect AI (UK AISI safety-focused), Promptfoo (regression testing для prompts), LangSmith (LangChain trace + eval — best UX). Observability + tracing: Helicone (LLM-specific APM), LangSmith, Langfuse (open-source), Arize Phoenix, Datadog LLM Observability (2024+ feature). Cost optimization: prompt caching (Anthropic native + OpenAI native + custom Redis layer), prompt compression (LLMLingua), model routing (small model for easy queries, large для complex — through providers like Martian / OpenRouter). Safety / guardrails: NeMo Guardrails (NVIDIA), Llama Guard (Meta), OpenAI Moderation API, custom prompt injection defenses.
AI Engineer vs ML Engineer vs Data Scientist — в чём разница?
Data Scientist — focus statistical modeling + A/B testing + business problem framing. Стек: pandas + sklearn + XGBoost + Jupyter + SQL + Tableau. Зарплаты $4500-8000. См. Data Scientist. ML Engineer — focus на production ML pipelines + deployment + scaling. Стек: PyTorch + sklearn + Kubernetes + MLflow + cloud-managed ML. Универсал — работает с recsys / fraud / ranking / classical ML. Зарплаты $5500-9500. См. ML Engineer. AI Engineer (эта страница) — focus на LLM integration в продукт. НЕ обучает foundation модели (это Research), НЕ строит classical ML pipelines (это ML Engineer). Стек: Python + LLM providers (OpenAI / Anthropic / Mistral) + LangChain / LlamaIndex + vector DBs + vLLM serving + RAG patterns + LoRA fine-tuning + LLM evaluation tools. Зарплаты $6500-11000. Key distinction 2026: AI Engineer reuses pre-trained LLM, ML Engineer часто trains models из scratch. AI Engineer работает с API/prompts/RAG; ML Engineer — с training loops + feature engineering. Career-pivots: Backend Senior → AI Engineer Junior — 2-4 месяца (быстрая ramp за счёт API-based work + LangChain learnable). ML Engineer Senior → AI Engineer Senior — 1-3 месяца (already знает stack basics, нужно deepen LLM-specific). DS Senior → AI Engineer Middle — 3-6 месяцев. AI Engineer Senior → Research (Anthropic / OpenAI) — требует deeper math + paper-writing experience + 6-12 месяцев preparation.
RAG vs Fine-tuning vs Prompt Engineering — что выбрать?
Decision tree для LLM customization 2026: 1) Prompt Engineering — first try. Use case: zero-shot или few-shot ENOUGH для task. Pros: zero-cost (no training), instant iteration, model-agnostic. Cons: limited control, prompt fragility, context window pressure. 2) RAG (Retrieval-Augmented Generation) — best для knowledge-grounded tasks. Use case: chatbot, Q&A, document search, customer support, code documentation, internal knowledge bases. Architecture: query → embed → vector search → top-k documents → augment prompt с retrieved context → LLM generates answer. Pros: factual grounding (anti-hallucination), up-to-date (just update index, no retraining), source citation possible, cheaper чем fine-tuning. Cons: retrieval quality bottleneck, prompt size grows. RAG stack 2026: ingestion (LlamaIndex / LangChain document loaders) → chunking strategy (semantic vs fixed-size vs recursive) → embeddings (OpenAI text-embedding-3 / Cohere Embed v3 / open-source BGE) → vector DB (Pinecone / Qdrant / Weaviate / pgvector) → retrieval (similarity + reranking via Cohere Rerank / BGE Reranker) → prompt augmentation → LLM generation. Advanced RAG: hybrid search (vector + BM25), HyDE (Hypothetical Document Embeddings), query rewriting, multi-hop retrieval, self-reflection (CRAG / Self-RAG). 3) Fine-tuning — use when prompt engineering + RAG не достаточно. Use case: a) domain-specific style / format (medical / legal — specific phrasing patterns), b) reduce token cost (smaller fine-tuned model заменяет larger general model), c) tasks requiring deep specialized knowledge (где RAG context window не помогает). Modern fine-tuning: LoRA / QLoRA (PEFT) — train small adapter (~1% of weights), full fine-tuning rare. Stack: Hugging Face Transformers + PEFT + TRL + Unsloth (faster) + Axolotl (config-driven). Hardware: 24GB GPU (RTX 4090 / A6000) для 7-13B models, 80GB+ (A100/H100) для 70B+. Cost reality 2026: prompt engineering — minutes, $0. RAG setup — 1-2 weeks engineering, $100-1000/month API costs. LoRA fine-tuning — 1-3 days engineering + $50-500 compute. Full fine-tuning — weeks + $1000-100000+. 4) Combination: real production AI features typically use ALL three. Prompt engineering первое (system prompts + few-shot examples) → RAG для grounding → optional LoRA fine-tuning для style/format. 5) Agentic patterns (rising 2025-2026) — LLM + tool use + multi-step reasoning. Use LangGraph / AutoGen / CrewAI / DSPy. 6) Function calling / structured output — OpenAI / Anthropic native support, для tool integration без custom parsing. Default 2026: RAG для 80% production use cases + prompt engineering для prototyping + LoRA fine-tuning только если RAG explicitly insufficient + agents для complex multi-step workflows.
Можно ли работать AI Engineer удалённо?
Да, 50.0% AI Engineer-вакансий — full-remote или гибрид. AI Engineer work fully cloud-based (LLM APIs + vector DBs + cloud GPUs — все remote-accessible). Аутсорсеры (EPAM AI / Luxoft AI / Andersen AI / DataArt AI) — почти всегда remote на US-AI-projects. Российские продуктовые (Сбер.AI / Яндекс AI / Тинькофф AI / Ozon AI) — гибрид или remote после probation. Российские банки (Сбер / ВТБ) — гибрид/офис AI-data compliance. Международные frontier-AI labs (Anthropic / OpenAI / Cohere / Mistral / Hugging Face / Stability / Replicate / Together AI / Perplexity / Inflection / Adept / xAI) — full-remote standard для exceptional candidates. Big Tech AI (Google DeepMind / Meta AI / Microsoft AI / Apple ML / Amazon AGI) — гибрид-standard. Y Combinator AI-startups — premium full-remote. Релокант-хабы для AI Engineer: США (Bay Area — крупнейший AI cluster), UK (London — DeepMind / Cohere), Канада (Toronto — Vector Institute), Германия (Berlin — Aleph Alpha + Black Forest Labs), Франция (Paris — Mistral + Hugging Face HQ), Израиль (Tel Aviv — AI21 Labs), Сингапур, ОАЭ (Dubai — AI tax-friendly). Английский для international AI-remote — must (премия +40-60%, и AI community / papers / docs полностью англоязычные).
Чем AI Agent Engineer (rising 2025-2026) отличается?
AI Agent Engineer — sub-specialization внутри AI Engineering, focus на autonomous agents с tool use + multi-step reasoning + planning. Rising hot 2025-2026 после: 1) OpenAI Assistants API + GPT-4 / o1 / o3 function calling improvements, 2) Anthropic computer use (Claude может control screen — released Oct 2024), 3) Devin (Cognition Labs autonomous SWE), 4) AutoGen / CrewAI multi-agent frameworks maturity, 5) LangGraph (DAG-style agent orchestration). Day-to-day: 1) Design agent workflows (planning + tool selection + execution + verification loops), 2) Tool integration (custom tools + MCP — Model Context Protocol, Anthropic standard 2024+), 3) Memory architecture (short-term + long-term + semantic), 4) Multi-agent orchestration (router agent + specialist agents pattern), 5) Evaluation для agentic workflows (success rate + cost per task + steps to completion), 6) Safety / guardrails (preventing unintended actions, sandboxing). Stack: LangGraph (DAG agents — LangChain), AutoGen (Microsoft multi-agent), CrewAI (multi-agent roleplaying), DSPy (Stanford declarative), Microsoft Semantic Kernel, OpenAI Assistants API, Anthropic Computer Use / MCP, OpenInterpreter (open-source code execution), Pydantic AI (typed agent framework, rising 2024+). Зарплаты: Senior AI Agent Engineer — премиум над general AI Engineer +10-20% за счёт rare-skill. Anthropic / OpenAI / Devin (Cognition Labs) / Adept hiring AI Agent specialists — premium $12000-20000+ Senior. Y Combinator AI-startups в agent space — самая active hiring sub-niche 2025-2026. Career-flow: AI Engineer Senior + agent project demonstrable → AI Agent Engineer — 3-6 месяцев.
Какие компании активно нанимают AI Engineer?
В топе: Сбер.AI, Яндекс, Тинькофф. Российские AI (крупнейшие AI-проекты РФ): Сбер.AI (GigaChat — крупнейший LLM-проект РФ + Kandinsky text-to-image + Salute Voice), Яндекс (Yandex.GPT для Алиса + Yandex.Browser AI + Maps AI), Тинькофф (chatbot + transaction categorization + voice AI), Ozon (recsys AI + search semantic), VK (Mail.ru AI assistants + продуктовые AI features), X5 Group (retail AI), МТС (AI assistants + телеком AI), JetBrains (AI Assistant для IDE — крупный AI Engineer hire). Аутсорсеры с GenAI Practice: EPAM AI Practice (крупнейший AI-аутсорс в СНГ для US GenAI projects), Luxoft AI, Andersen AI, DataArt AI, Itransition. Frontier-AI labs (международный remote премиум): Anthropic (Claude — safety-focused frontier — premium tier), OpenAI (GPT — capabilities-focused — premium tier), Cohere (enterprise LLM — Canada / UK), Mistral AI (open-weights frontier — France), Hugging Face (open-source ecosystem), Stability AI (image gen), Black Forest Labs (FLUX models — Germany), Replicate (inference platform), Together AI + Fireworks + Groq (fast inference), Perplexity (AI search), Inflection AI, Adept, xAI (Musk), Tencent AI, Alibaba DAMO. AI Agent specialists (rising 2025-2026 hiring tier): Cognition Labs (Devin — autonomous SWE), Adept, OpenInterpreter, Anthropic (computer use team). Big Tech AI: Google DeepMind (Gemini) / Meta AI (Llama) / Microsoft AI (Copilot family) / Apple ML (Apple Intelligence) / Amazon AGI (recently formed 2024). Y Combinator AI-startups — самая active hiring category 2025-2026 (>50% of recent YC batches are AI). Russian AI startups rising: Just AI (chatbots), Vector AI, Sber AI Lab startups.
С чего начинать в AI Engineering в 2026?
Roadmap: 1) Python deep + Backend basics — async / typing / FastAPI / pytest. Без Backend skill — не AI Engineer (just prompt-jockey). Книга: «Fluent Python» Ramalho. 2) LLM fundamentals understanding — transformer architecture basics (attention + tokenization + decoding strategies + context windows), но НЕ нужно implement from scratch. Курс: «Building LLMs from scratch» Karpathy YouTube (free — best для intuition). Книга: «Hands-On Large Language Models» Jay Alammar / Maarten Grootendorst (2024 — must-read). 3) OpenAI API mastery — chat completions + function calling + structured outputs + streaming + assistants. Build minimum 3 real apps. Free credits + cheap experimentation. 4) Anthropic Claude API mastery — лучший для coding + long-context use cases. Tool use + prompt caching + computer use (если AI Agent track интересен). 5) LangChain mastery — самый ёмкий job market требование. LCEL (LangChain Expression Language), chains, agents, retrievers, callbacks. Курс: «LangChain & Vector Databases in Production» DeepLearning.AI (free). 6) RAG architecture deep — document loaders + chunking strategies (semantic / fixed / recursive) + embeddings choice + vector DB selection + retrieval algorithms + reranking. Build production RAG app с advanced patterns (hybrid search + reranking + HyDE). 7) Vector DB mastery — minimum один deeply (Qdrant — best для self-hosted learning) + один managed (Pinecone). Understanding HNSW / IVF / PQ algorithms basics. 8) Fine-tuning hands-on — LoRA / QLoRA через PEFT library + Unsloth (faster). Fine-tune Llama 3.x 8B на own dataset. Hardware: Google Colab Pro+ ($50/month) или RunPod / Vast.ai (cheap GPU rental). 9) vLLM serving — deploy open model with vLLM + benchmark throughput + compare with OpenAI API. 10) Evaluation mastery — RAGAS + DeepEval + custom evaluation suite. Build regression test для prompts. 11) LangSmith / Langfuse observability — instrument production app + analyze traces + identify bottlenecks. 12) Agent frameworks — LangGraph + AutoGen + CrewAI + DSPy basics. Build multi-agent demo (research agent + writing agent + critic agent). 13) Pet-проект portfolio: production-grade AI feature (e.g. document Q&A для open dataset) с RAG + evaluation + observability + cost tracking. Document как portfolio (GitHub + blog post + demo video). Курсы РФ: Karpov.Courses «AI Engineer» track, Otus «LLM Engineering», Школа высшая ВШЭ ИИ, School21 (Сбер) AI Engineer track. International (eng): DeepLearning.AI Generative AI Specialization (Andrew Ng — must-start), Hugging Face NLP Course (free), «AI Engineering» Chip Huyen book (2024 must-read), fast.ai Practical Deep Learning Part 2 (advanced), OpenAI / Anthropic / Cohere official documentation (must read in full), Latent Space podcast (best AI Engineering podcast). Books-must: «AI Engineering» Chip Huyen (2024), «Hands-On Large Language Models» Alammar / Grootendorst, «Building LLMs for Production» Bouchard / Peng. Communities: Hugging Face Discord (largest open AI community), LangChain Discord, LlamaIndex Discord, Twitter AI community (follow @karpathy, @swyx, @hwchase17, @jerryjliu0), r/LocalLLaMA (open-source LLM community), Telegram @ai_engineer_ru. Backend Senior + LLM interest → AI Engineer Junior — 2-4 месяца (fastest entry в ML world). ML Engineer Senior → AI Engineer Senior — 1-3 месяца. Data Scientist → AI Engineer Middle — 3-6 месяцев.
Сколько вакансий AI Engineer в СНГ и Европе?
8 активных открытых AI Engineer-вакансий в нашей выборке — молодая ниша (выделилась в 2023 после ChatGPT boom). Реальный рынок гораздо шире — большинство AI Engineer roles classified нашим matcher'ом как general ML Engineer или Backend (потому что titles часто «Senior Backend Engineer (AI focus)» или «ML Engineer — LLM»). Истинный пул AI-focused dev jobs в СНГ + Европе оценочно 500-2000 позиций активных любой момент 2026 (с учётом нечётко классифицированных). География: EN, 🇷🇺 Россия. Источники: hh.ru (особенно Сбер.AI / Яндекс / Тинькофф active), Habr Career, getmatch, Djinni, LinkedIn (огромный международный AI Engineer сегмент — Anthropic / OpenAI / Cohere / Mistral / Hugging Face / Y Combinator AI-startups), NoFluffJobs / JustJoin.it (Польша AI-friendly), Telegram (@ai_engineer_ru, @ml_jobs, @aijobs, @jobsforaiml, @prompt_engineering_ru), карьерные сайты EPAM AI Practice / Luxoft AI / Andersen AI, специализированные борды (aijobs.net, ai-jobs.net, builtin.com/jobs/ai, jobs.lever.co для AI-startups), Y Combinator Work at a Startup (largest AI-startup channel — 50%+ recent batches are AI), AI-lab direct careers pages (Anthropic / OpenAI / Cohere / Mistral / Hugging Face / Stability / Replicate). Время закрытия Senior AI Engineer — 4-10 недель в РФ, 6-12 недель international (rare-skill premium). Trend 2026: AI Engineer пул растёт fastest среди всех IT-категорий — мы видим 3-5× year-over-year growth в LLM-mentioning job postings.
Какие навыки нужны Senior AI Engineer?
Senior AI Engineer владеет полным циклом LLM-product engineering + cost optimization + technical leadership. Python deep + Backend Senior level: async / typing / FastAPI / pytest mastery. LLM API providers mastery: OpenAI + Anthropic + Google Gemini + Mistral + Cohere — знать quirks + rate limits + retry strategies + cost per token для каждого. Open LLM knowledge: Llama 3.x / Mistral / Qwen 2.5 / DeepSeek V3 + R1 / Phi 3 / Gemma 2 — performance / cost trade-offs, когда какую использовать. LangChain mastery: LCEL deep, callbacks, agents, retrievers, custom chain authoring, debugging through LangSmith. Or equivalent в LlamaIndex / Haystack / Semantic Kernel. RAG architecture mastery: advanced patterns (hybrid search BM25 + vector, reranking, HyDE, query rewriting, multi-hop retrieval, self-reflection patterns CRAG / Self-RAG), chunking strategies (semantic + recursive + hierarchical), embedding model selection (OpenAI vs Cohere vs open-source — performance + cost trade-offs). Vector DB mastery deep: один из Pinecone / Qdrant / Weaviate / Milvus / pgvector deeply — index tuning, sharding, replication, hybrid search implementation. Fine-tuning mastery: LoRA / QLoRA via PEFT + Unsloth + Axolotl, dataset preparation (instruction tuning + DPO data), hyperparameter selection, evaluation methodology. RLHF / DPO / KTO basics: TRL library для preference optimization. Serving mastery: vLLM advanced (PagedAttention + continuous batching + speculative decoding + KV cache optimization), TGI, SGLang. Agent architectures: LangGraph + AutoGen + CrewAI + DSPy mastery, MCP (Model Context Protocol) implementation, tool use design patterns, multi-agent orchestration. Evaluation mastery: RAGAS + DeepEval + custom evaluation suite design, LLM-as-judge methodology, regression testing для prompts, A/B testing для LLM features. Observability + tracing: LangSmith + Langfuse + Helicone + Arize Phoenix + Datadog LLM Observability mastery. Cost optimization mastery: prompt caching strategies (native + custom Redis), prompt compression (LLMLingua), model routing (small for easy / large для complex via OpenRouter / Martian), batch API for non-real-time. Typical Senior mandate: 50-70% reduction в LLM API costs. Safety / guardrails: NeMo Guardrails, Llama Guard, OpenAI Moderation API integration, prompt injection defense, output filtering. System design для LLM products: design RAG-based product на whiteboard под scale 100M+ queries/day, multi-region considerations, latency budgets (target P95 < 2s for chat). Soft: ADRs writing для LLM architecture decisions, technical writing (LLM feature design docs), cross-team collaboration (Product / Backend / DS / Research teams), mentoring Middle AI Engineers, paper-reading discipline (NeurIPS / ICLR / EMNLP — must follow). Английский для Senior+ MUST — AI community / docs / papers / conferences полностью англоязычные. Optional bonus: open-source contributions в LangChain / LlamaIndex / vLLM / Hugging Face — резко повышают market value для frontier-AI labs (Anthropic / OpenAI / Cohere / Mistral) hiring. Twitter AI presence (regular posting about LLM experiments) — important для hiring through community connections.
Похожие специализации
Как мы считаем
- Период данных: в hero и текстах — последние 3 месяца. В графиках — весь доступный период наблюдений (с момента запуска парсеров, обычно 2-3 месяца).
- Данные собираются автоматически из 1000+ источников — Telegram-каналов и job-площадок СНГ и Европы.
- В расчёт идут только живые открытые вакансии с понятным описанием. Спам и дубликаты отсекаются.
- Зарплаты приводятся к USD/мес по актуальному курсу. Аномальные значения (lt;500 или gt;50K) отфильтрованы.
- Уровни нормализованы: Mid → Middle, Intern/Trainee → Junior, Principal/Staff/Expert → Lead.
- Первые 2 недели данных (период парсер-rampup) в графиках не показываем.
- Данные пересчитываются каждый день.
Авторство и цитирование
Аналитика подготовлена Zorky Research Team. Последнее обновление: 29 мая 2026 г. в 17:41.
Источники данных и методология
Данные собраны автоматически из 1000+ источников — Telegram-каналов вакансий и сайтов работы СНГ и Восточной Европы (HH, Habr Career, Djinni, DOU, NoFluffJobs, JustJoin.it, Pracuj.pl и других). Парсинг работает круглосуточно, дубликаты фильтруются по описанию и URL, аномальные значения зарплат отсекаются. Подробная методология — на странице «Как работает».
Zorky CRM (2026). AI / LLM Engineer в IT: рынок СНГ и Европы. Дата обращения: 29.05.2026. URL: https://zorky.tech/ru/research/ml