AI Inženjering

    AI inženjeri u vašem timu — gradimo produkcijske feature, ne demoe

    LLM integracija, retrieval sistemi, agent workflow-ovi. Ubacujemo senior AI inženjere u vaš tim ili gradimo AI sloj vašeg proizvoda direktno. EU vremenska zona, bez hajpa, prave evals.

    Senior
    AI inženjeri, pre-vetted
    CET
    EU zona, real-time saradnja
    Evals first
    Merimo pa puštamo

    Tri načina da uvedemo AI u vaš biznis

    Krećemo tamo gde je ROI najjasniji. Videli smo dosta efektnih demoa koji su umrli u produkciji — te ne puštamo.

    LLM funkcije u vašoj aplikaciji

    Najbolje za: SaaS ili interni alat, želite da dodate chat / summarize / klasifikaciju / generisanje

    Dodaj LLM funkcije u postojeće proizvode. Streaming UI, prompt versioning, A/B testovi protiv determinističkih baseline-a, fallback putanje kad model pogreši.

    • Anthropic Claude + OpenAI SDK sa provider fallback-om
    • Streaming sa cancellation, retry-jem, rate-limit handling-om
    • Prompt versioning + evals protiv golden dataset-a

    AI agenti i workflow-i

    Najbolje za: ponavljajuće multi-step poslove koje ljudi rade danas

    Gradimo agente koji završavaju prave zadatke — istraživanje, klasifikacija, sastavljanje, multi-step automatizacije. Jasan scope, observability, human-in-the-loop gde treba.

    • Tool-use petlje sa jakim evals + tracing-om
    • Human approval gate za visoko-rizične akcije
    • Cost + latency budžeti enforce-ovani u runtime-u

    Retrieval (RAG) preko vaših podataka

    Najbolje za: imate skup dokumenata / tiketa / wiki-ja / ugovora koje tim svakodnevno pretražuje

    Pretraživo znanje nad vašim podacima. Hibridni retrieval (semantički + keyword), citati, kontrole svežine, access control usklađen sa postojećim permisijama.

    • pgvector ili Qdrant kao vector store — vaš izbor
    • Citation tracking — svaki odgovor link-uje izvor
    • Reranking + filteri po metadata (datum, vlasnik, ACL)

    Šta zaista radimo dobro

    Delovi koji razdvajaju radni AI od impresivnih demoa.

    Prompt engineering

    Versioned promptovi, strukturisani outputi (JSON Schema, tool calls), guardrails za prompt injection. Promptove tretiramo kao kod — review-uju se, testiraju, deploy-uju.

    Evals i monitoring

    Golden dataset-i, LLM-as-judge sa kalibrisanim rubrikama, regression detection na svaku promenu modela/prompta. Produkcijski logovi sample-uju se u eval sete.

    Vector DB i embedding-i

    pgvector, Qdrant, Weaviate — svaki ima trade-off. Biramo po skali + vašoj postojećoj infri, ne po vendor preferenciji. Hibridni search (BM25 + cosine).

    Agent orkestracija

    LangGraph, custom state machines, ili obične tool-use petlje — šta odgovara problemu. Distribuirani tracing kroz agent korake. Resumable na grešci.

    Cost optimizacija

    Model routing (jeftin za lake upite, pametan za teške), prompt caching, batch API-ji, response caching. Tipično 40–70% smanjenje troška bez gubitka kvaliteta.

    Privatnost i on-prem

    On-prem deploy za osetljive podatke (open-source LLM preko vLLM / Ollama), zero-retention politike na komercijalnim API-jima, EU data residency, GDPR-usklađeno.

    AI tech sa kojim puštamo

    Alati prošli kroz produkciju, ne kroz demo prezentacije.

    Claude (Anthropic)

    LLM

    GPT (OpenAI)

    LLM

    LangGraph

    Orkestracija

    pgvector / Qdrant

    Vector DB

    Python

    Jezik

    TypeScript

    Jezik

    Zašto ne uzeti neku od AI hype-firmi?

    Većina AI radova pada u produkciji — ne zato što je model loš, nego zato što je inženjering oko njega krhak. Mi prvo dolazimo iz software engineering pozadine (ERP, POS, mobile), pa AI feature tretiramo kao bilo koji drugi produkcijski sistem: evals, monitoring, rollback putanje, cost controls. Treba vam dedicated AI inženjer u timu umesto jednog projekta? Naš Team Extension model to pokriva.

    Vidi Team Extension model

    Kako gradimo AI feature

    Otkriće prvo. Demoi se ne puštaju u produkciju.

    Discovery + eval plan

    Koji je zadatak, koji je impact na korisnika, šta se računa kao 'dobro'? Definišemo eval pre modela. Ako ne možemo da merimo, ne pravimo.

    Brz prototip

    Najmanji end-to-end slice koji udara prave podatke + prave korisnike. Throwaway kod ako treba — brzina učenja je važnija od reusable scaffolding-a.

    Productionize

    Kad evals prođu, hardnemo. Rate limiting, observability, fallback-ovi, cost budžeti, security review, deployment pipeline.

    Operate i improve

    Pratimo evals u produkciji. Detektujemo drift. Iteriramo na promptovima/modelima. Ostajemo u timu posle lansiranja — AI feature postaju bolji sa feedback-om, ne lošiji.

    Imate AI feature na umu?

    Recite nam problem koji rešavate — ne model koji želite da koristite. Vraćamo se sa eval planom, iskrenom procenom da li je AI pravi fit, i grubim scope-om. Obično za 48 sati.

    Krenite AI projekat

    Bez hajpa. Bez demo videa. Nema evals-a — nije se ni desilo.