AI Inženjering

AI inženjeri u vašem timu — gradimo produkcijske feature, ne demoe

LLM integracija, retrieval sistemi, agent workflow-ovi. Ubacujemo senior AI inženjere u vaš tim ili gradimo AI sloj vašeg proizvoda direktno. EU vremenska zona, bez hajpa, prave evals.

Senior

AI inženjeri, pre-vetted

CET

EU zona, real-time saradnja

Evals first

Merimo pa puštamo

Pričajmo o AI projektu Pogledajte Team Extension model

Tri načina da uvedemo AI u vaš biznis

Krećemo tamo gde je ROI najjasniji. Videli smo dosta efektnih demoa koji su umrli u produkciji — te ne puštamo.

LLM funkcije u vašoj aplikaciji

Najbolje za: SaaS ili interni alat, želite da dodate chat / summarize / klasifikaciju / generisanje

Dodaj LLM funkcije u postojeće proizvode. Streaming UI, prompt versioning, A/B testovi protiv determinističkih baseline-a, fallback putanje kad model pogreši.

Anthropic Claude + OpenAI SDK sa provider fallback-om
Streaming sa cancellation, retry-jem, rate-limit handling-om
Prompt versioning + evals protiv golden dataset-a

AI agenti i workflow-i

Najbolje za: ponavljajuće multi-step poslove koje ljudi rade danas

Gradimo agente koji završavaju prave zadatke — istraživanje, klasifikacija, sastavljanje, multi-step automatizacije. Jasan scope, observability, human-in-the-loop gde treba.

Tool-use petlje sa jakim evals + tracing-om
Human approval gate za visoko-rizične akcije
Cost + latency budžeti enforce-ovani u runtime-u

Retrieval (RAG) preko vaših podataka

Najbolje za: imate skup dokumenata / tiketa / wiki-ja / ugovora koje tim svakodnevno pretražuje

Pretraživo znanje nad vašim podacima. Hibridni retrieval (semantički + keyword), citati, kontrole svežine, access control usklađen sa postojećim permisijama.

pgvector ili Qdrant kao vector store — vaš izbor
Citation tracking — svaki odgovor link-uje izvor
Reranking + filteri po metadata (datum, vlasnik, ACL)

Šta zaista radimo dobro

Delovi koji razdvajaju radni AI od impresivnih demoa.

Prompt engineering

Versioned promptovi, strukturisani outputi (JSON Schema, tool calls), guardrails za prompt injection. Promptove tretiramo kao kod — review-uju se, testiraju, deploy-uju.

Evals i monitoring

Golden dataset-i, LLM-as-judge sa kalibrisanim rubrikama, regression detection na svaku promenu modela/prompta. Produkcijski logovi sample-uju se u eval sete.

Vector DB i embedding-i

pgvector, Qdrant, Weaviate — svaki ima trade-off. Biramo po skali + vašoj postojećoj infri, ne po vendor preferenciji. Hibridni search (BM25 + cosine).

Agent orkestracija

LangGraph, custom state machines, ili obične tool-use petlje — šta odgovara problemu. Distribuirani tracing kroz agent korake. Resumable na grešci.

Cost optimizacija

Model routing (jeftin za lake upite, pametan za teške), prompt caching, batch API-ji, response caching. Do 50% smanjenja troška bez gubitka kvaliteta.

Privatnost i on-prem

On-prem deploy za osetljive podatke (open-source LLM preko vLLM / Ollama), zero-retention politike na komercijalnim API-jima, EU data residency, GDPR-usklađeno.

AI tech sa kojim puštamo

Alati prošli kroz produkciju, ne kroz demo prezentacije.

Claude (Anthropic)

LLM

GPT (OpenAI)

LLM

LangGraph

Orkestracija

pgvector / Qdrant

Vector DB

Python

Jezik

TypeScript

Jezik

Zašto ne uzeti neku od AI hype-firmi?

Većina AI radova pada u produkciji — ne zato što je model loš, nego zato što je inženjering oko njega krhak. Mi prvo dolazimo iz software engineering pozadine (ERP, POS, mobile), pa AI feature tretiramo kao bilo koji drugi produkcijski sistem: evals, monitoring, rollback putanje, cost controls. Treba vam dedicated AI inženjer u timu umesto jednog projekta? Naš Team Extension model to pokriva.

Vidi Team Extension model

Kako gradimo AI feature

Otkriće prvo. Demoi se ne puštaju u produkciju.

Discovery + eval plan

Koji je zadatak, koji je impact na korisnika, šta se računa kao 'dobro'? Definišemo eval pre modela. Ako ne možemo da merimo, ne pravimo.

Brz prototip

Najmanji end-to-end slice koji udara prave podatke + prave korisnike. Throwaway kod ako treba — brzina učenja je važnija od reusable scaffolding-a.

Productionize

Kad evals prođu, hardnemo. Rate limiting, observability, fallback-ovi, cost budžeti, security review, deployment pipeline.

Operate i improve

Pratimo evals u produkciji. Detektujemo drift. Iteriramo na promptovima/modelima. Ostajemo u timu posle lansiranja — AI feature postaju bolji sa feedback-om, ne lošiji.

Imate AI feature na umu?

Recite nam problem koji rešavate — ne model koji želite da koristite. Vraćamo se sa eval planom, iskrenom procenom da li je AI pravi fit, i grubim scope-om. Obično za 48 sati.

Krenite AI projekat

Bez hajpa. Bez demo videa. Nema evals-a — nije se ni desilo.