KI-Technologie-Radar

Mein kuratierter Überblick über KI-Technologien, die für kleine und mittlere Unternehmen relevant sind. Die Einordnung basiert auf Praxiserfahrung, nicht auf Hype. Ob eine Technologie für dein Unternehmen passt, hängt immer vom konkreten Anwendungsfall, Budget und Team ab.

Stand: Q2-2026 · Letzte Aktualisierung: 2026-06-05

26 Technologien

KMU-Relevanz

Kosten

Kategorie

Reifegrade (Ringe)

EtabliertProduktionsreif, erprobt, breites Ökosystem

PraxistauglichFunktioniert, erfordert Know-how oder Anpassung

VielversprechendStarkes Potenzial, aber noch Einschränkungen

BeobachtenFrühphase, für KMU noch zu unreif oder zu teuer

Kategorien (Quadranten)

Modelle & Plattformen

Werkzeuge & Agenten

Daten & Infrastruktur

Methoden & Praxis

Bewegung

AufsteigendAbsteigendStabilNeu

Du willst wissen, welche Technologien zu deinem Unternehmen passen?

Lass uns sprechen.

Projekt beschreiben

Alle Technologien im Überblick

Stand: Q2-2026. 26 kuratierte Technologien, bewertet nach KMU-Relevanz und Reifegrad.

Etabliert

LLM Cloud APIs

Sprachmodelle als API-Service (OpenAI, Anthropic, Google). Grundbaustein für fast jede KI-Anwendung.

Kategorie: Modelle & PlattformenKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

LLM-APIs sind 2026 Commodity. Die Kosten sind dramatisch gefallen (Gemini 3.5 Flash: Pro-Qualität zu Flash-Preis) [1]. Laut Bitkom hat sich der KI-Einsatz in deutschen Unternehmen 2026 mehr als verdoppelt [2]. Jedes KMU kann sofort damit starten, ohne eigene Infrastruktur aufzubauen.

KI-Bildgenerierung

Bild-KI für Marketing, Produktfotos und Content. Midjourney, DALL-E und Flux führen 2026.

Kategorie: Modelle & PlattformenKMU-Relevanz: 4/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

KI-Bildgenerierung spart KMU 75-85% der Kosten pro Bild gegenüber klassischer Produktion. Teams berichten von 3x Content-Output [1]. Midjourney führt bei Qualität (ab 10 USD/Monat), DALL-E ist im ChatGPT Plus-Abo enthalten [2].

RAG (Retrieval Augmented Generation)

Firmenwissen an Sprachmodelle anbinden, ohne Fine-Tuning. Der Standard für wissensbasierte KI.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: medium

RAG hat sich als Standardmethode etabliert, um Unternehmenswissen KI-zugänglich zu machen [1]. pgvector in PostgreSQL reicht für 80% der KMU-Anwendungsfälle [2]. Separate Vektordatenbanken sind für KMU meist überflüssig.

EU AI Act Compliance

Drei Ebenen: KI-Kompetenzpflicht (Art. 4) seit Feb. 2025, Transparenz-/Kennzeichnungspflicht (Art. 50) ab 2. August 2026, plus Hochrisiko-Pflichten.

Kategorie: Methoden & PraxisKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: medium

Der EU AI Act wirkt für KMU auf drei Ebenen. Erstens gilt die KI-Kompetenzpflicht (Art. 4) bereits seit Februar 2025: Jedes Unternehmen, das KI nutzt, muss Mitarbeitende schulen und dies dokumentieren [2]. Zweitens tritt am 2. August 2026 die Transparenzpflicht (Art. 50) in Kraft: KI-generierte Texte, Bilder, Videos und Audio-Inhalte müssen gekennzeichnet und Chatbots als KI erkennbar gemacht werden. Die Kennzeichnung entfällt, wenn ein Mensch die redaktionelle Verantwortung trägt, der einfachste Pfad für viele KMU [3][4]. Drittens treten ab demselben Datum die Hochrisiko-Pflichten in Kraft; KMU unter 750 Mitarbeitenden haben vereinfachte Pflichten, sind aber nicht ausgenommen [1]. Strafen beginnen bei 7,5 Mio. EUR oder 1,5% des weltweiten Jahresumsatzes [3].

KI-Förderprogramme für KMU

BAFA und KMU-innovativ: Bis zu 50% Zuschuss für KI- und Digitalisierungsprojekte im Mittelstand.

Kategorie: Methoden & PraxisKMU-Relevanz: 5/5Kosten: KostenlosTechn. Hürde: low

Das BMWK fördert 2026 KI-Projekte im Mittelstand mit bis zu 50% Zuschuss über KMU-innovativ [1]. Die BAFA bezuschusst Unternehmensberatung (inkl. Digitalisierung) mit bis zu 80% in strukturschwachen Regionen [2]. Das Forschungszentrum Jülich bietet zusätzlich öffentlich geförderte KI-Beratung für KMU und Start-ups [3]. Hinweis: Das Programm go-digital ist Ende 2024 ausgelaufen.

Google Gemini 3.5 Flash

Googles neues Flaggschiff-Flash-Modell: Pro-Qualität bei Flash-Preis und vierfacher Konkurrenzgeschwindigkeit.

Kategorie: Modelle & PlattformenKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

Gemini 3.5 Flash wurde am 19. Mai 2026 auf der Google I/O veröffentlicht und schlägt laut Googles Benchmarks sogar Gemini 3.1 Pro, insbesondere bei mehrstufigen Aufgaben [1]. Das 1-Million-Token-Kontextfenster erlaubt es, ganze Berichte, Verträge oder lange Kundengespräche in einem einzigen Request zu verarbeiten, ein konkreter Mehrwert für Agenturen, Kanzleien oder E-Commerce-Händler [2]. Google gibt die API-Kosten als deutlich unter 50% vergleichbarer Frontier-Modelle an; über Google AI Studio ist ein kostenloser Einstieg möglich [3].

Praxistauglich

Open-Source LLMs (Llama, Mistral, Qwen)

Frei verfügbare Sprachmodelle zum Self-Hosting. Llama 4, Mistral Large 2 und Qwen 3 führen das Feld an.

Kategorie: Modelle & PlattformenKMU-Relevanz: 3/5Kosten: HochTechn. Hürde: high

Open-Source-Modelle haben 2026 das Niveau proprietärer Modelle erreicht [1]. Llama 4 bietet 10M-Token-Kontext, Mistral ist stark für europäische DSGVO-Szenarien [2]. Aber: Self-Hosting erfordert GPU-Server (ab ca. 5.000 EUR für kleinere Modelle, 50.000+ EUR für die großen; oder 500-5.000 EUR/Monat Cloud-GPU-Miete). Für die meisten KMU ist die API-Nutzung derselben Modelle über Anbieter wie Together AI oder Mistral deutlich pragmatischer und günstiger als eigene Infrastruktur.

KI-Videoproduktion

KI-generierte Videos für Marketing, Schulung und E-Commerce. Avatar-Tools und generative Video-Modelle.

Kategorie: Modelle & PlattformenKMU-Relevanz: 4/5Kosten: MittelTechn. Hürde: low

Der KI-Video-Markt wächst mit 34% CAGR [1]. Avatar-Tools (HeyGen, Synthesia) reduzieren Produktionszeit von 30-60 auf unter 5 Minuten [2]. Generative Video-Modelle (Runway, Veo) nähern sich Broadcast-Qualität, nachdem Sora wegen zu hoher Kosten eingestellt wurde [1].

KI-Workflow-Automatisierung

No-Code/Low-Code Plattformen mit nativer KI-Integration. n8n, Make und Zapier als führende Tools.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 5/5Kosten: KostenlosTechn. Hürde: medium

n8n hat sich mit nativer LangChain-Integration und Self-Hosting als DSGVO-konforme Alternative zu Zapier und Make etabliert [1][2]. Typische KMU-Anwendungsfälle: Lead-Qualifizierung, Rechnungsverarbeitung, RAG-Agenten über die eigene Wissensdatenbank.

Agentic Coding IDEs

KI-gestützte Entwicklungsumgebungen mit autonomen Agenten. Cursor, Windsurf, Copilot und Claude Code.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 3/5Kosten: Gering (<50 €/Monat)Techn. Hürde: high

2026 ist die Ära der agentischen IDEs: Cursor (Cloud Agents, ab 20 USD/Monat), Copilot (Coding Agent für GitHub Issues, ab 10 USD/Monat), Windsurf (Cascade, ab 15 USD/Monat) und Claude Code (Terminal-Agent mit 1M-Kontext) [1][2]. Für Tech-KMU und Agenturen ein massiver Produktivitätshebel.

KI-gestützte Buchhaltung

Cloud-Buchhaltung mit KI-Belegerkennung und automatischer Buchung. sevdesk, Lexware Office, BuchhaltungsButler.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

Deutsche Cloud-Buchhaltungstools setzen 2026 verstärkt auf KI: automatische Belegerkennung, Buchungsvorschläge, DATEV-Export. sevdesk ist Testsieger im Vergleich von 12 Tools [1]. Lexware Office ab 7,90 EUR/Monat [1]. BuchhaltungsButler punktet bei EÜR und Bilanz/GuV [1].

KI-Agenten

Autonome KI-Systeme, die mehrstufige Aufgaben selbstständig planen und ausführen.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 4/5Kosten: MittelTechn. Hürde: high

LLMs sind 2026 faktisch zu Agenten-Betriebssystemen geworden [1]. Für klar umrissene Aufgaben funktionieren sie zuverlässig. Framework-Auswahl (LangChain, CrewAI, eigene Agenten) hängt vom Anwendungsfall ab [2]. Für KMU am pragmatischsten über n8n oder ähnliche No-Code-Tools.

Lokale Inferenz-Server

LLM-Inferenz auf eigener Hardware ohne Cloud. Ollama, LM Studio und vLLM als führende Tools.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 3/5Kosten: KostenlosTechn. Hürde: medium

Ollama (250k+ GitHub Stars) ist der De-facto-Standard für lokale LLM-Inferenz [1]. Das MLX-Backend beschleunigt Apple Silicon um bis zu 93% [2]. LM Studio ergänzt mit GUI für weniger technische Nutzer [1]. Für KMU mit sensiblen Daten die einzige Möglichkeit, LLMs DSGVO-konform zu nutzen.

Vektorsuche in PostgreSQL

RAG direkt in PostgreSQL via pgvector. Keine separate Vektordatenbank nötig für die meisten KMU-Fälle.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 4/5Kosten: KostenlosTechn. Hürde: medium

pgvector + pgvectorscale erreicht 471 QPS bei 99% Recall auf 50 Mio. Vektoren [1]. Wer PostgreSQL nutzt (Supabase, Neon), braucht keine separate Vektordatenbank. Supabase bietet Row Level Security für RAG-Dokumente, sodass Zugriffsrechte direkt in Vektorabfragen greifen [2].

Context Engineering

Die Weiterentwicklung von Prompt Engineering: Gestaltung des gesamten Kontextfensters als Informationsarchitektur.

Kategorie: Methoden & PraxisKMU-Relevanz: 4/5Kosten: KostenlosTechn. Hürde: medium

Anthropic hat den Ansatz populär gemacht: Nicht einzelne Prompts optimieren, sondern das gesamte Kontextfenster als Informationsarchitektur gestalten [1]. System-Instruktionen, Tool-Schemas, Dokumente, Beispiele als Interface-Vertrag. Alle großen Anbieter konvergieren auf diese Methodik [2]. Für KMU die wichtigste Grundkompetenz im Umgang mit KI.

RAG vs. Fine-Tuning (Architekturentscheidung)

Wann RAG, wann Fine-Tuning, wann beides? Die wichtigste Architekturentscheidung für KI-Projekte.

Kategorie: Methoden & PraxisKMU-Relevanz: 3/5Kosten: KostenlosTechn. Hürde: high

RAG für dynamisches Wissen (4-8 Wochen Setup), Fine-Tuning für konsistenten Stil und Spezialwissen (8-16 Wochen) [1]. Die besten Systeme kombinieren beides: Fine-Tuned Models mit RAG-Retrieval [2]. Für KMU ist RAG fast immer der richtige Einstieg.

Microsoft MAI-Code-1 Flash (GitHub Copilot)

Microsofts erstes eigenes Coding-Modell, jetzt in GitHub Copilot Free/Pro, günstiger als Claude Haiku.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 3/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

MAI-Code-1-Flash wurde auf der Microsoft BUILD 2026 (2. Juni) vorgestellt und rollt ab sofort in GitHub Copilot Free, Pro und Pro+ aus [1]. Das Modell soll Claude Haiku 4.5 bei günstigerem Token-Preis überbieten und ist als Drop-in-Alternative zu teuren Frontier-Modellen für Entwickler-Workflows konzipiert [2]. Für Agenturen und Software-KMU, die bereits Copilot nutzen, ist der Wechsel ohne Mehrkosten möglich, Copilot Individual kostet weiterhin 10 USD/Monat [3].

ElevenLabs Eleven v3

Neues TTS-Modell mit Audio-Tags, Mehrsprecher-Dialog und 70+ Sprachen, jetzt allgemein verfügbar.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 3/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

ElevenLabs Eleven v3 ist aus der Alpha-Phase herausgetreten und allgemein verfügbar: Das Modell unterstützt über 70 Sprachen (inkl. Deutsch), Mehrsprecher-Dialoge und inline steuerbare Emotionen via Audio-Tags wie [excited] oder [whispers] [1]. Für KMU im Content-Bereich, etwa Erklärvideos, Telefonbot-Ansagen oder Produktvorstellungen, senkt v3 die Produktionskosten erheblich; die Preisaktion bietet aktuell 80% Rabatt auf Self-Serve-Pläne bis Ende Juni [2]. Wichtig: Für Echtzeit-Anwendungen wie Kunden-Hotlines empfiehlt ElevenLabs weiterhin v2.5 Turbo/Flash, da v3 höhere Latenz aufweist [1].

Make.com MCP Server (Cloud-Version)

Make.com verbindet über 3.000 Apps via MCP mit Claude, ChatGPT und Co., ohne lokalen Server.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: medium

Mit der cloud-nativen MCP-Server-Version können Make-Szenarien direkt aus Claude, ChatGPT oder Cursor als aufrufbare Tools genutzt werden, ohne lokale Installation oder zusätzliche Infrastruktur [1]. Für ein KMU bedeutet das: Ein bestehender Make-Workflow (z.B. Rechnungsversand, CRM-Update) wird mit einem Klick zum KI-Agenten-Tool, über 30.000 Aktionen stehen dabei zur Verfügung [2]. Make wurde auf HackerNoon zur besten KI-Automatisierungsplattform 2026 gewählt, mit über 500.000 Nutzerorganisationen [3].

KI-Meeting-Transkription & Notetaker

KI hört im Meeting mit, transkribiert und schreibt Protokoll plus To-dos. Du bist im Gespräch präsent statt am Mitschreiben.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 5/5Kosten: Gering (<50 €/Monat)Techn. Hürde: low

KI-Notetaker sind 2026 einer der konkretesten KMU-Hebel: Das Tool transkribiert ein Kundengespräch oder eine Teamrunde automatisch und liefert Zusammenfassung, Entscheidungen und To-dos. Der eigentliche Gewinn ist nicht Zeitersparnis, sondern Präsenz: Wer nicht mitschreiben muss, kann im Gespräch wirklich zuhören [1]. Für DSGVO-sensible Branchen (Kanzleien, Beratung, Gesundheit) ist die Auswahl entscheidend: EU-gehostete Anbieter wie tl;dv, Sally oder KI-note verarbeiten Daten in der EU mit AVV [2], bot-freie und lokale Lösungen wie Meetily transkribieren komplett on-device [3]. Wichtig: Aufzeichnung braucht die Einwilligung aller Teilnehmenden. Einstieg ab kostenlos bis rund 30 EUR/Monat pro Person [2].

Vielversprechend

GraphRAG / Knowledge Graphs

Wissensgraphen als RAG-Erweiterung: Beziehungen zwischen Daten verstehen, nicht nur Texte durchsuchen.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 2/5Kosten: MittelTechn. Hürde: high

GraphRAG verbessert klassisches RAG durch Beziehungswissen und reduziert Halluzinationen [1]. Der Graph-Datenbankmarkt wächst auf 12,8 Mrd. USD [2]. Für die meisten KMU noch zu komplex, aber relevant für Unternehmen mit vernetzten Datenstrukturen (z.B. Supply Chain, CRM).

LLM-Observability & Evaluation

Monitoring, Testing und Qualitätssicherung für KI-Anwendungen in Produktion. Langfuse, Braintrust, Arize.

Kategorie: Daten & InfrastrukturKMU-Relevanz: 2/5Kosten: KostenlosTechn. Hürde: high

2026 dominieren fünf Frameworks die LLM-Evaluation: Langfuse (Open-Source), Braintrust (80M Series B), Arize, LangSmith und DeepEval [1]. Der Standard ist 90% automatisierte LLM-as-Judge-Evaluation plus 10% menschliche Kalibrierung [2]. Für KMU erst relevant, wenn eigene KI-Anwendungen in Produktion laufen.

Small Language Models (SLMs)

Kompakte KI-Modelle (1-14B Parameter) für Edge-Geräte und ressourcenschonenden Einsatz. Phi-4, Gemma 3.

Kategorie: Modelle & PlattformenKMU-Relevanz: 2/5Kosten: Gering (<50 €/Monat)Techn. Hürde: high

Small Language Models wie Phi-4 (14B, 84.8% MMLU) und Gemma 3 übertreffen ältere Modelle mit der Hälfte der Parameter [1]. Die Modellgewichte sind frei verfügbar, aber für die größeren Varianten (7-14B) wird eine GPU mit mindestens 8-10 GB VRAM benötigt [2]. Die kleinsten Modelle (1-4B) laufen auch auf Laptops ohne dedizierte GPU. Für KMU realistisch, wenn passende Hardware ohnehin vorhanden ist, sonst sind Cloud-APIs günstiger.

Hermes Agent (+ Hermes Desktop)

Selbstlernender Open-Source-KI-Agent mit GUI, persistentem Gedächtnis und 300+ Modellen, jetzt für Desktop.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 3/5Kosten: KostenlosTechn. Hürde: medium

Nous Research hat Anfang Juni 2026 Hermes Desktop veröffentlicht, eine native GUI-App (Mac/Windows/Linux) auf Basis von Hermes Agent v0.15.2, die erstmals keine Kommandozeilenkenntnisse voraussetzt [1]. Das zentrale Alleinstellungsmerkmal: ein geschlossener Lernkreislauf, bei dem der Agent aus erledigten Aufgaben automatisch wiederverwendbare Skills erstellt und sein Verhalten mit der Zeit verbessert [2][3]. Für DSGVO-sensible KMU ist die Kombination aus Hermes und Ollama (lokale Modelle) relevant: Alle Daten bleiben auf der eigenen Hardware; die MIT-Lizenz erlaubt unbeschränkten kommerziellen Einsatz [4]. Allerdings setzt der sinnvolle Betrieb mindestens eine Person mit technischem Grundverständnis voraus.

Beobachten

Autonome KI-Agenten-Teams

Mehrere KI-Agenten, die als Team zusammenarbeiten: planen, delegieren, prüfen. Noch Frühphase.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 1/5Kosten: HochTechn. Hürde: high

Multi-Agenten-Systeme sind mächtig, erfordern aber Entwickler-Know-how und erhebliches Debugging [1]. Laut Camundas State of Agentic Orchestration Report 2026 sehen 73% der Unternehmen eine Kluft zwischen KI-Agenten-Vision und Realität, nur 11% der Anwendungsfälle haben Produktion erreicht [2]. Für KMU unter 10 Mitarbeitenden nicht empfohlen.

OpenClaw

Open-Source-KI-Agent für Alltagsautomatisierung via WhatsApp/Telegram, viral, aber sicherheitskritisch.

Kategorie: Werkzeuge & AgentenKMU-Relevanz: 2/5Kosten: KostenlosTechn. Hürde: high

OpenClaw (ehemals Moltbot/Clawdbot) ist ein Open-Source-KI-Agent, der E-Mails, Kalender, Websuche und Messenger-Kommunikation über Plattformen wie WhatsApp, Signal oder Telegram selbstständig steuert und sich mit externen LLMs wie Claude oder GPT verbindet [1]. Für KMU interessant ist das Konzept: Ein Handwerksbetrieb oder eine Agentur könnte theoretisch Terminbuchungen oder CRM-Einträge per WhatsApp-Sprachnachricht delegieren [2]. Aber: Das BSI hat im Februar 2026 eine offizielle Sicherheitswarnung herausgegeben, Cisco dokumentierte Datenexfiltration durch Third-Party-Skills, und bis April 2026 wurden 138 CVEs in 63 Tagen gemeldet [3][4]. Für KMU ohne eigene IT-Sicherheitsabteilung ist der Produktiveinsatz derzeit nicht empfehlenswert.