Loading blog posts...
Loading blog posts...
Laden...

De helft van de "AI-agent" pilots die ik in 2025 zag, oogden geweldig in een demo en liepen vervolgens vast zodra ze echte systemen raakten. Gartner verwacht nog steeds dat meer dan 40% van de agentic AI-projecten tegen 2027 wordt geannuleerd, voornamelijk door integratie- en governanceproblemen (niet omdat de modellen slecht zijn).
2026 is het jaar waarin de winnaars stoppen met het uitrollen van chatbots en beginnen met het uitrollen van autonome AI-teamgenoten met controlelagen, audittrails en afgebakende bevoegdheden.

yaml## Minimaal agent control layer contract (wat moet bestaan voor autonomie) agent_control_layer: identity: "service_principal_or_workload_identity" permissions: - "scoped_tokens_per_tool" - "row_level_data_access" policies: - "allowed_tools_allowlist" - "data_exfiltration_rules" - "time_budget_and_cost_caps" - "human_approval_gates" observability: - "structured_event_log" - "tool_call_traces" - "decision_rationales" safety: - "sandbox_mode" - "dry_run_mode" - "rollback_plan"
Als een "agent" acties kan uitvoeren in e-mail, CRM of productiesystemen, is het moeilijke deel meestal niet het prompting. Het moeilijke deel is identiteit, permissies, controleerbaarheid en rollback. De teams die daadwerkelijk autonome workflows uitrollen, behandelen agents als een nieuwe runtime: beheerst, observeerbaar en begrensd.
De enquêtegegevens van McKinsey uit 2025 laten de momentum al zien: 23% van de organisaties schaalt agentic AI en 39% voert pilots uit, terwijl het reguliere genAI-gebruik steeg van 65% in 2024 naar 71% in 2025. Die kloof tussen "piloten" en "schalen" is precies wat de controlelaag dicht.
Bron: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai
Important
[!IMPORTANT] Als een agent kan klikken, verzenden, kopen, uitrollen of e-mailen, behandel het dan als productieautomatisering. Dat betekent least privilege, goedkeuringen, logging en rollback, zelfs voor "interne" tools.
json{ "intent": "renew_enterprise_contract", "router_decision": { "agents": ["crm_agent", "pricing_agent", "legal_agent", "email_agent"], "required_approvals": ["sales_manager"], "data_scopes": ["accounts:read", "contracts:read", "email:send_draft"], "success_criteria": [ "renewal_quote_created", "legal_terms_checked", "draft_email_prepared" ] } }
De verrassende verschuiving in 2026 is dat het "chat"-oppervlak optioneel wordt. Het echte product is de routinglaag die een verzoek omzet in een plan, delegeert naar gespecialiseerde agents en beleid afdwingt. Het chatvenster is slechts één client van die router (net als Slack, Teams of een intern portaal).
Daarom pushen enterprise-leveranciers beheerste ecosystemen en "agent control layers" (Salesforce Agentforce 360, Microsoft Agent 365). De waarde zit niet in het feit dat een agent kan praten. De waarde zit erin dat autonomie herhaalbaar wordt over afdelingen heen omdat dezelfde routing-, beleids- en observeerbaarheidspatronen van toepassing zijn.
Bronnen: https://futurumgroup.com/insights/was-2025-really-the-year-of-agentic-ai-or-just-more-agentic-hype/ en https://www.deloitte.com/us/en/insights/topics/technology-management/tech-trends/2026/agentic-ai-strategy.html
Geschatte adoptietijdlijn:

python## Multi-agent orkestratie skelet: plan -> execute -> verify -> escalate from dataclasses import dataclass from typing import Any, Dict, List, Optional @dataclass class Step: id: str tool: str input: Dict[str, Any] requires_approval: bool = False @dataclass class Plan: goal: str steps: List[Step] success_checks: List[Dict[str, Any]] class AgentOrchestrator: def __init__(self, tools, policy, logger): self.tools = tools self.policy = policy self.logger = logger async def run(self, plan: Plan, context: Dict[str, Any]) -> Dict[str, Any]: results = {"steps": [], "status": "running"} for step in plan.steps: self.policy.assert_tool_allowed(step.tool) self.policy.assert_input_safe(step.tool, step.input) if step.requires_approval: approval = await self.policy.request_human_approval(step, context) if not approval["approved"]: results["status"] = "blocked" return results out = await self.tools[step.tool].call(step.input, context=context) self.logger.event("tool_call", {"step_id": step.id, "tool": step.tool, "out": out}) results["steps"].append({"step": step, "out": out}) for check in plan.success_checks: ok = await self.policy.verify(check, results, context) if not ok: results["status"] = "needs_review" return results results["status"] = "done" return results
Single-agent ontwerpen falen op saaie manieren: ze gaan te ver, vergeten beperkingen of "lossen" het verkeerde probleem op omdat planning en uitvoering door elkaar lopen. Multi-agent orkestratie splitst verantwoordelijkheden zodat elke agent eenvoudiger en beter testbaar kan zijn. Eén plant, één voert tool calls uit, één verifieert outputs, één handelt escalatie af. Bain en anderen zijn vrij expliciet geweest dat specialisatie en orkestratie centraal staan in productie-waardige agentic systemen.
In de praktijk verkleint dit ook uw blast radius. Als de "e-mailagent" zich misdraagt, controleert deze ook niet pricing, refunds en deployments (gelukkig).
Bron: https://www.bain.com/insights/state-of-the-art-of-agentic-ai-transformation-technology-report-2025/
Tegendraadse mening: multi-agent is niet altijd beter. Voor kleine interne workflows kan één agent met strikte tool-limieten een complexe orchestrator verslaan. Het 2026-patroon is "multi-agent standaard voor bedrijfskritieke flows", niet "multi-agent overal".
sql-- Agent betrouwbaarheidsscorebord (opslaan per workflow, per tool, per beleidspoort) -- Track uitkomsten waarop u kunt handelen, geen vibes. CREATE TABLE agent_runs ( run_id TEXT PRIMARY KEY, workflow TEXT NOT NULL, started_at TIMESTAMP NOT NULL, finished_at TIMESTAMP, status TEXT NOT NULL, -- done | blocked | needs_review | failed cost_usd NUMERIC(10,4) NOT NULL, tool_calls INT NOT NULL, approvals_requested INT NOT NULL, approvals_granted INT NOT NULL, rollback_used BOOLEAN NOT NULL DEFAULT FALSE ); CREATE TABLE agent_failures ( run_id TEXT NOT NULL, step_id TEXT, failure_type TEXT NOT NULL, -- policy_violation | tool_error | hallucination | timeout | data_mismatch details JSONB NOT NULL );
In 2026 stoppen teams met abstract discussiëren over "hallucinaties" en beginnen ze operationele betrouwbaarheid te meten. De KPI die ertoe doet is: kan de agent de workflow voltooien binnen het beleid, binnen tijd- en kostenbudgetten, met een voorspelbaar escalatiepad.
Dit is waar veel 2025-pilots stierven. Ze maten gebruikersplezier in een chatvenster, en ontdekten vervolgens dat de agent de CRM niet veilig kon bedienen, niet kon bewijzen wat het deed en niet kon herstellen van gedeeltelijke fouten. IBM's reality check is bot: contextuele en edge-case afhandeling beperkt nog steeds autonomie, dus systemen hebben verificatie en toezicht nodig, niet alleen betere prompts.
Bron: https://www.ibm.com/think/insights/ai-agents-2025-expectations-vs-reality
Geschatte adoptietijdlijn:
Warning
[!WARNING]
Als een agent kan schrijven naar systems of record, is "stille fout" erger dan "harde fout". Vereist expliciete status: done, blocked, needs_review of failed.
json{ "memory_layers": { "ephemeral": { "source": "current_run_context", "ttl": "minutes", "examples": ["user_request", "active_ticket", "tool_outputs"] }, "working": { "source": "project_kv_store", "ttl": "days", "examples": ["open_tasks", "pending_approvals", "known_risks"] }, "institutional": { "source": "approved_knowledge_base", "ttl": "months", "examples": ["policies", "runbooks", "pricing_rules", "schemas"] } } }
Modellen met zeer lange contextvensters (Gemini 1.5's miljoen-token context is een veelgebruikte referentie) veranderen wat agents in één keer kunnen lezen. Maar lezen is geen geheugen - niet op de manier waarop productiesystemen het nodig hebben.
In 2026 is het onderscheidende vermogen of de agent stabiel, gepermissioneerd, bijwerkbaar geheugen kan onderhouden dat runs overleeft zonder data te lekken. Dit is belangrijk omdat autonomie samengestelde fouten creëert. Als een agent de verkeerde prijsregel "leert" uit een enkele e-mailthread en deze opslaat als geheugen, kan het die fout op schaal herhalen.
Het veilige patroon is gelaagd geheugen met expliciete bronnen, TTLs (time-to-live) en goedkeuringsregels voor wat wordt gepromoveerd tot institutionele kennis.
Geschatte adoptietijdlijn:
typescript// Transactionele tool wrapper: idempotency + dry-run + rollback hook export type ToolResult<T> = { ok: boolean; dryRun: boolean; idempotencyKey: string; output?: T; rollback?: { tool: string; input: Record<string, any> }; error?: { code: string; message: string; retryable: boolean }; }; export async function createInvoiceTool(input: { customerId: string; amountCents: number; currency: string; idempotencyKey: string; dryRun?: boolean; }): Promise<ToolResult<{ invoiceId: string }>> { if (input.dryRun) { return { ok: true, dryRun: true, idempotencyKey: input.idempotencyKey, output: { invoiceId: "dryrun_invoice" } }; } // Call billing system here with idempotencyKey const invoiceId = "inv_123"; return { ok: true, dryRun: false, idempotencyKey: input.idempotencyKey, output: { invoiceId }, rollback: { tool: "voidInvoiceTool", input: { invoiceId } } }; }
In 2025 gebruikten veel agent-demo's tools zoals "search" en "summarize". In 2026 is het serieuze werk transactioneel: factuur aanmaken, contract verlengen, sleutels roteren, een PR openen, een deployment pushen, een clinicus follow-up plannen.
Transactionele automatisering heeft idempotency keys (herhaal-veilige operaties), dry-run modes en rollback hooks nodig. Dit is ook waar "agent platforms" hun waarde beginnen te bewijzen. AWS Bedrock Agents en vergelijkbare aanbiedingen verminderen de glue code voor tool calling, maar teams hebben nog steeds transactieontwerp nodig. Als een tool niet idempotent kan worden gemaakt, heeft het waarschijnlijk een goedkeuringspoort of een sandbox nodig.
Bron: https://svitla.com/blog/agentic-ai-trends-2025/
Praktisch gevolg: agents zullen zwakke plekken in interne API's snel blootleggen. Ontbrekende idempotency, onduidelijke foutcodes en inconsistente schema's worden blockers. Het oplossen daarvan maakt uw menselijke automatisering vaak ook beter.
json{ "support_autonomy_lanes": [ { "lane": "refund_duplicate_charge", "max_amount_usd": 50, "required_evidence": ["payment_id", "duplicate_detected=true"], "actions": ["issue_refund", "email_customer_draft"], "escalate_if": ["customer_is_enterprise", "refund_tool_error"] }, { "lane": "password_reset", "required_evidence": ["verified_identity=true"], "actions": ["trigger_reset_flow"], "escalate_if": ["identity_check_failed"] } ] }
De winnende 2026-supportstrategie is niet "AI handelt alle tickets af". Het is "AI bezit specifieke lanes end-to-end", met strikte caps, vereist bewijs en duidelijke escalatieregels. Zo krijgen teams echte autonome oplossing zonder compliance-nachtmerries te creëren.
Dit is ook waar bedrijven impact duidelijk kunnen kwantificeren. Smalle lanes hebben duidelijke succescriteria: oplossingstijd, terugbetalingsnauwkeurigheid, klant hercontact rate en escalatie rate. ThirdEye Data benadrukt klantenservice als een hoogwaardig domein dat richting autonome oplossing beweegt met mensen voor toezicht.
Bron: https://thirdeyedata.ai/top-25-agentic-ai-use-cases-in-2025/
Datapunten om verwachtingen te verankeren (feitelijke referenties):
Dit zijn niet allemaal "agents", maar ze zetten de lat: meetbare doorvoer, niet aardiger gesprekken.
bash# Een veilig uitrolpad: begin met read-only + suggestiemodus # Voeg dan schrijftoegang toe in fasen. export AGENT_MODE="suggest_only" # suggest_only | create_pr | merge_with_approval export REPO_SCOPE="read" # read | write export CI_SCOPE="read" # read | trigger
Dev-workflows zijn waar autonomie het gemakkelijkst te begrenzen is. Een PR-agent kan code lezen, tests uitvoeren, diffs voorstellen en een pull request openen. U kunt het door CI en menselijke review forceren. Een deployment-agent raakt productie en heeft sterkere controles nodig, dus die komt later (en eerlijk gezegd, zou dat ook moeten).
Dit is ook waar interne standaarden ertoe doen. Voor teams die software bouwen met agent-assistentie, zie onze Claude Code Skills Template 2026: Practical Checklist om review, testen en veilige delegatie te standaardiseren.
Tegendraadse mening: "AI schrijft de code" is minder belangrijk dan "AI onderhoudt de code". In 2026 zullen de beste PR-agents degenen zijn die huisstijl kunnen volgen, wijzigingen klein houden en risico kunnen uitleggen in release notes.
json{ "healthcare_agent_guardrails": { "allowed_actions": [ "summarize_patient_record", "draft_clinician_note", "suggest_followup_tasks", "flag_risk_signals" ], "disallowed_actions": [ "final_diagnosis", "medication_order", "override_clinician_decision" ], "required_provenance": [ "cite_source_document_ids", "timestamped_observation_list" ] } }
De kortetermijnwaarde in de gezondheidszorg is het integreren van rommelige data en het omzetten ervan in actie binnen clinicus-workflows: EPD-notities, beeldvormingssamenvattingen, claims-hints, afsprakengeschiedenis. Deloitte en anderen blijven wijzen op voorspellende en proactieve zorg als de high-impact richting, maar echte implementaties zullen conservatief blijven op definitieve beslissingen (met goede reden).
Het 2026-onderscheid is herkomst. Als een agent sepsisrisico of een medicatie-interactie markeert, moet het precies citeren welke documenten en waarden die markering hebben aangestuurd. Zonder dat kunnen clinici het niet vertrouwen, en compliance-teams zullen het blokkeren.
Geschatte adoptietijdlijn:
textAls de agent "gezond verstand" nodig heeft om veilig te zijn, is de workflow niet klaar voor autonomie. Herschrijf de workflow totdat veiligheid voortkomt uit beperkingen, bewijs en verificatie.
De meeste teams proberen hun weg naar betrouwbaarheid te prompten. Ik heb die aanpak vaak zien falen, omdat productiebetrouwbaarheid voortkomt uit systeemontwerp: gestructureerde inputs, tool-contracten, verificatie en escalatie. Betere modellen helpen, zeker, maar ze vervangen geen guardrails.
De tweede veelvoorkomende fout is beginnen met de moeilijkste workflows. Als de eerste agent geld, juridische voorwaarden of productiesystemen raakt, wordt elke edge case een blocker. De betere volgorde is smalle lanes, dan autoriteit uitbreiden naarmate metrics stabiliteit bewijzen.
Deloitte's framing is hier nuttig: agentic AI is een verandering van bedrijfsmodel, geen chatbot-upgrade. Dat impliceert procesherontwerp, data-unificatie en governancewerk dat veel teams onderbudgetteren.
| Capaciteit | Klassieke chatbot | Agentic AI teamgenoot | Autonome workflow-eigenaar |
|---|---|---|---|
| Primaire output | Tekstantwoorden | Plannen + tool-acties | Voltooid bedrijfsresultaat |
| Tool-toegang | Optioneel, vaak read-only | Scoped acties met goedkeuringen | Brede acties met strikte controles |
| Risicoprofiel | Laag | Gemiddeld | Hoog |
| Vereiste governance | Basis prompt-regels | Beleid, audit logs, goedkeuringen | Volledige controlelaag, rollback, compliance |
| Best voor | Q&A, opstellen | Case handling, PR-creatie, ops-taken | Smalle lanes op schaal (refunds, verlengingen, planning) |
| 2026 volwassenheid | Commodity | Mainstream in enterprises | Selectief, hoogpresterende teams |
Deze tabel is de planningssnelkoppeling. Als een team probeert "autonome workflow-eigenaar" te draaien met "klassieke chatbot"-governance, eindigt het in de geannuleerde-project-emmer waar Gartner voor waarschuwt.

Begin hier (uw eerste stap)
Kies één workflow met duidelijke inputs en een omkeerbare actie, rol dan een dry_run=true agent uit die alleen tool call-plannen produceert gedurende 2 weken.
Snelle winsten (directe impact)
run_id, status, tool_calls, cost_usd en approvals_requested, bekijk dan wekelijks.idempotencyKey en een rollback-actie te ondersteunen, dwing het dan af in de tool wrapper.Diepgaand (voor wie meer wil)
Agentic AI in 2026 is geen "slimmere chatbot". Het is software die kan plannen en handelen binnen uw systemen, wat echt engineeringwerk afdwingt: tool-contracten, permissies, verificatie en rollback.
Het snelste pad is smalle autonomie met meetbare uitkomsten, dan geleidelijke uitbreiding van autoriteit gebaseerd op completion rate onder beleid. Als het team niet precies kan uitleggen wat de agent kan doen, waar het data vandaan haalt en hoe acties ongedaan te maken, is het niet klaar voor productie-autonomie.
Als uw roadmap agents bevat die CRM-, financiële of operationele systemen raken, kan Joulyan IT Solutions helpen bij het ontwerpen van de controlelaag, tool-contracten en uitrolplan zodat autonomie schaalt zonder uit te draaien op een governance-branddrill.