
AI inženjeri u vašem timu — gradimo produkcijske feature, ne demoe
LLM integracija, retrieval sistemi, agent workflow-ovi. Ubacujemo senior AI inženjere u vaš tim ili gradimo AI sloj vašeg proizvoda direktno. EU vremenska zona, bez hajpa, prave evals.
Tri načina da uvedemo AI u vaš biznis
Krećemo tamo gde je ROI najjasniji. Videli smo dosta efektnih demoa koji su umrli u produkciji — te ne puštamo.
LLM funkcije u vašoj aplikaciji
Najbolje za: SaaS ili interni alat, želite da dodate chat / summarize / klasifikaciju / generisanje
Dodaj LLM funkcije u postojeće proizvode. Streaming UI, prompt versioning, A/B testovi protiv determinističkih baseline-a, fallback putanje kad model pogreši.
- Anthropic Claude + OpenAI SDK sa provider fallback-om
- Streaming sa cancellation, retry-jem, rate-limit handling-om
- Prompt versioning + evals protiv golden dataset-a
AI agenti i workflow-i
Najbolje za: ponavljajuće multi-step poslove koje ljudi rade danas
Gradimo agente koji završavaju prave zadatke — istraživanje, klasifikacija, sastavljanje, multi-step automatizacije. Jasan scope, observability, human-in-the-loop gde treba.
- Tool-use petlje sa jakim evals + tracing-om
- Human approval gate za visoko-rizične akcije
- Cost + latency budžeti enforce-ovani u runtime-u
Retrieval (RAG) preko vaših podataka
Najbolje za: imate skup dokumenata / tiketa / wiki-ja / ugovora koje tim svakodnevno pretražuje
Pretraživo znanje nad vašim podacima. Hibridni retrieval (semantički + keyword), citati, kontrole svežine, access control usklađen sa postojećim permisijama.
- pgvector ili Qdrant kao vector store — vaš izbor
- Citation tracking — svaki odgovor link-uje izvor
- Reranking + filteri po metadata (datum, vlasnik, ACL)
Šta zaista radimo dobro
Delovi koji razdvajaju radni AI od impresivnih demoa.
Prompt engineering
Versioned promptovi, strukturisani outputi (JSON Schema, tool calls), guardrails za prompt injection. Promptove tretiramo kao kod — review-uju se, testiraju, deploy-uju.
Evals i monitoring
Golden dataset-i, LLM-as-judge sa kalibrisanim rubrikama, regression detection na svaku promenu modela/prompta. Produkcijski logovi sample-uju se u eval sete.
Vector DB i embedding-i
pgvector, Qdrant, Weaviate — svaki ima trade-off. Biramo po skali + vašoj postojećoj infri, ne po vendor preferenciji. Hibridni search (BM25 + cosine).
Agent orkestracija
LangGraph, custom state machines, ili obične tool-use petlje — šta odgovara problemu. Distribuirani tracing kroz agent korake. Resumable na grešci.
Cost optimizacija
Model routing (jeftin za lake upite, pametan za teške), prompt caching, batch API-ji, response caching. Tipično 40–70% smanjenje troška bez gubitka kvaliteta.
Privatnost i on-prem
On-prem deploy za osetljive podatke (open-source LLM preko vLLM / Ollama), zero-retention politike na komercijalnim API-jima, EU data residency, GDPR-usklađeno.
AI tech sa kojim puštamo
Alati prošli kroz produkciju, ne kroz demo prezentacije.
Claude (Anthropic)
LLMGPT (OpenAI)
LLMLangGraph
Orkestracijapgvector / Qdrant
Vector DBPython
JezikTypeScript
JezikZašto ne uzeti neku od AI hype-firmi?
Većina AI radova pada u produkciji — ne zato što je model loš, nego zato što je inženjering oko njega krhak. Mi prvo dolazimo iz software engineering pozadine (ERP, POS, mobile), pa AI feature tretiramo kao bilo koji drugi produkcijski sistem: evals, monitoring, rollback putanje, cost controls. Treba vam dedicated AI inženjer u timu umesto jednog projekta? Naš Team Extension model to pokriva.
Vidi Team Extension modelKako gradimo AI feature
Otkriće prvo. Demoi se ne puštaju u produkciju.
Discovery + eval plan
Koji je zadatak, koji je impact na korisnika, šta se računa kao 'dobro'? Definišemo eval pre modela. Ako ne možemo da merimo, ne pravimo.
Brz prototip
Najmanji end-to-end slice koji udara prave podatke + prave korisnike. Throwaway kod ako treba — brzina učenja je važnija od reusable scaffolding-a.
Productionize
Kad evals prođu, hardnemo. Rate limiting, observability, fallback-ovi, cost budžeti, security review, deployment pipeline.
Operate i improve
Pratimo evals u produkciji. Detektujemo drift. Iteriramo na promptovima/modelima. Ostajemo u timu posle lansiranja — AI feature postaju bolji sa feedback-om, ne lošiji.
Imate AI feature na umu?
Recite nam problem koji rešavate — ne model koji želite da koristite. Vraćamo se sa eval planom, iskrenom procenom da li je AI pravi fit, i grubim scope-om. Obično za 48 sati.
Bez hajpa. Bez demo videa. Nema evals-a — nije se ni desilo.