Ihr Vertrieb telefoniert 30 Mal am Tag. Ihr Support nimmt 50 Anrufe entgegen. Ihre Geschäftsführung bespricht Verträge am Telefon. Und danach? Geht das Wissen verloren. Weil niemand mitschreibt, weil die Notiz im Outlook versandet, weil der CRM-Eintrag „Kunde angerufen, Angebot besprochen" heißt und nichts aussagt. EDNT KI-Telefonie ändert das: Jedes Gespräch wird automatisch transkribiert, von der KI zusammengefasst und als strukturierter Datensatz in Ihrem CRM abgelegt. Kein Nacharbeiten, kein Vergessen, kein Informationsverlust.
Das Telefon ist der größte blinde Fleck Ihres Unternehmens
Ihre E-Mails sind archiviert. Ihre Dokumente liegen im DMS. Ihre Kundendaten stehen im CRM. Aber Ihre Telefonate – das Medium, über das die wichtigsten Gespräche stattfinden – verschwinden im Moment, in dem aufgelegt wird.
Was hat der Kunde am Telefon genau gesagt? Was wurde zugesichert? Welche Frist wurde genannt? Was war der Tonfall – zufrieden oder kurz vor der Kündigung? In den meisten Unternehmen hängt die Antwort davon ab, ob der Mitarbeiter sich Notizen gemacht hat. Und ob diese Notizen lesbar, vollständig und auffindbar sind.
Das ist kein Organisationsproblem. Das ist ein strukturelles Defizit: Telefonie wurde nie als Datenquelle behandelt. Jedes andere Kommunikationsmedium in Ihrem Unternehmen erzeugt automatisch durchsuchbare, auswertbare Daten. Nur das Telefon nicht.
Bis jetzt.
Jedes Gespräch – transkribiert, zusammengefasst, abgelegt. Automatisch.
EDNT KI-Telefonie verbindet Ihre Telefonanlage mit Ihrer KI und Ihrem CRM zu einem durchgängigen System. Kein manueller Schritt, kein Nacharbeiten, kein Copy-Paste.
Was nach jedem Telefonat passiert:
Das Gespräch wird in Echtzeit transkribiert – Wort für Wort, in voller Länge. Nicht als Stichwortprotokoll, sondern als vollständiger Text, der durchsuchbar und zitierfähig ist.
Die KI erstellt automatisch eine strukturierte Zusammenfassung: Worum ging es, was wurde vereinbart, welche Aufgaben ergeben sich, welche Fristen wurden genannt.
Transkript und Zusammenfassung werden automatisch im CRM-Kontakt abgelegt – beim richtigen Kunden, beim richtigen Ansprechpartner, mit Datum und Uhrzeit.
Offene Aufgaben aus dem Gespräch werden als Follow-ups im CRM angelegt. Kein „Ich wollte mich doch noch melden" drei Wochen später. Die Aufgabe existiert, bevor der Mitarbeiter aufgelegt hat.
Das klingt nach Science Fiction. Es läuft heute bei unseren Kunden in Produktion.
Sechs Funktionen, die Ihr Telefon zum intelligentesten Werkzeug im Unternehmen machen
Automatische Gesprächstranskription. Jedes ein- und ausgehende Gespräch wird in Echtzeit in Text umgewandelt. Der vollständige Wortlaut ist anschließend durchsuchbar – über das CRM, über Paperless-ngx oder direkt über OpenWebUI. „Was hat Herr Müller am 12. März am Telefon gesagt?" ist keine rhetorische Frage mehr, sondern eine, die Ihre KI beantworten kann.
KI-Gesprächszusammenfassung. Die KI liest das Transkript und erstellt eine strukturierte Zusammenfassung: Gesprächsthema, besprochene Punkte, Vereinbarungen, offene Fragen, nächste Schritte. In 30 Sekunden statt 15 Minuten manuellem Protokollieren.
Automatische CRM-Ablage. Transkript, Zusammenfassung und erkannte Aufgaben werden automatisch dem richtigen Kontakt in EspoCRM zugeordnet. Der Vertriebsmitarbeiter muss nach dem Gespräch nichts eintippen. Die Kundenhistorie ist vollständig, ohne dass jemand daran denken muss.
Stimmungs- und Tonfall-Analyse. Die KI erkennt, ob ein Gespräch positiv, neutral oder kritisch verlaufen ist. Ein Kunde, der verärgert auflegt, wird nicht als „Gespräch geführt" im CRM vermerkt, sondern als „kritisches Gespräch – Handlungsbedarf". Ihr Vertriebsleiter sieht auf einen Blick, wo es brennt.
Intelligente Anrufsteuerung. Statt „Drücken Sie 1 für Vertrieb, 2 für Support" spricht der Anrufer natürlich: „Ich habe eine Frage zu meiner letzten Rechnung." Die KI versteht die Absicht und verbindet zum richtigen Ansprechpartner – oder beantwortet einfache Fragen direkt, bevor ein Mitarbeiter überhaupt ans Telefon geht.
Voicemail-to-Text. Sprachnachrichten werden transkribiert und als lesbarer Text zugestellt – per E-Mail, als CRM-Eintrag oder als Nachricht in Nextcloud. Kein Abhören von Mailboxen mehr. Sie lesen Ihre Voicemails wie E-Mails und antworten, wenn es passt.
Telefonanlage, KI, CRM – alles aus einem Haus. Das ist der Unterschied.
KI-Telefonie-Features bieten auch andere an. Microsoft vermarktet Copilot für Teams. Google hat KI-Funktionen in Google Meet. Diverse Startups verkaufen Transkriptions-Tools, die sich an bestehende Telefonanlagen andocken.
Der Unterschied: All diese Lösungen sind Aufsätze. Ein Tool eines Drittanbieters, das sich per API an Ihre Telefonanlage hängt und Daten an einen Cloud-Dienst schickt. Sie haben keine Kontrolle darüber, wo die Gesprächsdaten verarbeitet werden, und die Integration mit Ihrem CRM ist bestenfalls oberflächlich.
Bei EDNT ist die gesamte Kette unter einem Dach:
Die Telefonanlage – FusionPBX auf FreeSWITCH – entwickeln und betreiben wir selbst. Wir kennen jeden Codec, jeden SIP-Header, jeden Audiostream. Wenn die KI Zugriff auf den Gesprächsinhalt braucht, müssen wir keine Drittanbieter-API fragen. Wir haben den direkten Zugriff auf der Plattformebene.
Die KI – lokale Modelle auf unserer Hardware im deutschen Rechenzentrum. Die Spracherkennung läuft lokal. Die Zusammenfassung läuft lokal. Die Stimmungsanalyse läuft lokal. Kein Audiobyte verlässt Deutschland.
Das CRM – EspoCRM implementieren und betreiben wir selbst. Die Integration ist keine generische Webhook-Anbindung, sondern eine direkte Verknüpfung auf Datenbankebene. Transkripte landen nicht in einem unstrukturierten Notizfeld, sondern als saubere, verknüpfte Datensätze beim richtigen Kontakt.
Das DMS – Paperless-ngx für die Langzeitarchivierung von Transkripten, wenn Sie das regulatorisch brauchen.
Das Rechenzentrum – eigene Hardware, ISO 27001, keine Hyperscaler.
Fünf Schichten, ein Anbieter. Kein anderes Systemhaus in Deutschland bildet diese Kette vollständig ab. Nicht weil es technisch unmöglich wäre, sondern weil es Jahre braucht, die Kompetenz in allen fünf Bereichen gleichzeitig aufzubauen. Wir haben diese Jahre investiert.
Was KI-Telefonie für Ihre Abteilungen bedeutet
Vertrieb. Der Vertriebsmitarbeiter legt auf und die Kundenakte ist aktuell. Kein CRM-Pflege-Rückstand, keine vergessenen Follow-ups, keine Diskussionen darüber, was mit dem Kunden besprochen wurde. Der Vertriebsleiter sieht auf einen Blick, welche Deals sich positiv entwickeln und wo ein Gespräch kritisch verlaufen ist.
Support und Service. Jede Kundenanfrage wird dokumentiert, bevor der Support-Mitarbeiter das nächste Gespräch annimmt. Wiederkehrende Probleme werden sichtbar, weil die KI Muster in den Transkripten erkennt. „Drei Kunden haben diese Woche wegen dem gleichen Fehler angerufen" – diese Information existiert plötzlich, ohne dass jemand sie manuell zusammengetragen hat.
Geschäftsführung. Sie verhandeln einen Vertrag am Telefon. Die Zusammenfassung mit allen besprochenen Konditionen liegt fünf Minuten später in Ihrem CRM. Keine Missverständnisse, keine „Das habe ich so nicht gesagt"-Diskussionen. Sie haben den Wortlaut.
Rechtsabteilung und Compliance. Für Branchen mit Dokumentationspflicht – Finanzdienstleister, Versicherungen, Gesundheitswesen – ist die automatische Gesprächsdokumentation nicht nur komfortabel, sondern regulatorisch relevant. Jedes Gespräch ist nachvollziehbar, archivierbar und auditierbar.
Empfang und Assistenz. Die intelligente Anrufsteuerung entlastet den Empfang. Routineanfragen wie „Wie sind Ihre Öffnungszeiten?" oder „Können Sie mich mit Herrn Weber verbinden?" beantwortet die KI direkt. Komplexere Anliegen werden mit einer kurzen Zusammenfassung an den richtigen Mitarbeiter weitergeleitet. Der Anrufer muss sein Anliegen nicht zweimal erklären.
Gesprächsaufzeichnung und DSGVO – so machen wir es rechtssicher
Gesprächsaufzeichnung ist in Deutschland an klare Regeln gebunden. Wir nehmen das ernst und haben die Lösung so gebaut, dass sie diese Regeln einhält.
Einwilligungsmanagement. Zu Beginn eines Gesprächs wird der Anrufer automatisch informiert, dass das Gespräch aufgezeichnet und verarbeitet wird. Bei fehlender Einwilligung wird die Aufzeichnung nicht gestartet – das Gespräch findet trotzdem statt, nur ohne KI-Funktionen.
Lokale Verarbeitung. Die Spracherkennung und KI-Analyse laufen vollständig auf unserer Hardware im deutschen Rechenzentrum. Keine Audiodaten werden an Google Speech-to-Text, Amazon Transcribe oder einen anderen US-Dienst gesendet. Was im Rechenzentrum verarbeitet wird, bleibt im Rechenzentrum.
Zugriffskontrolle. Wer auf Transkripte und Zusammenfassungen zugreifen darf, definieren Sie über Ihr Rechte- und Rollenkonzept im CRM. Nicht jeder Mitarbeiter muss jedes Gespräch sehen können.
Aufbewahrungsfristen. Sie definieren, wie lange Transkripte gespeichert werden. Automatische Löschroutinen stellen sicher, dass Daten nicht länger vorgehalten werden als nötig oder erlaubt.
Transparenz. Weil der gesamte Stack Open Source ist, können Sie – oder Ihr Datenschutzbeauftragter – jeden Verarbeitungsschritt nachvollziehen. Keine Black Box, keine Herstellerversprechen, die Sie nicht überprüfen können.
Wir empfehlen, vor der Einführung Ihren Datenschutzbeauftragten einzubinden. Wir liefern die technische Dokumentation, die er dafür braucht.
Die technische Architektur – für IT-Verantwortliche
Telefonanlage. FusionPBX auf FreeSWITCH – eine der leistungsfähigsten Open-Source-VoIP-Plattformen weltweit. Kein Asterisk-Fork, kein gehosteter SIP-Proxy, sondern eine vollwertige Carrier-Grade-Telefonanlage, die wir seit über zehn Jahren entwickeln und betreiben.
Spracherkennung. Lokale Speech-to-Text-Modelle, die auf unserer Infrastruktur laufen. Die Audiostreams werden direkt aus FreeSWITCH an die Spracherkennung übergeben – ohne Umweg über externe APIs, ohne Latenz durch Cloud-Roundtrips. Unterstützung für Deutsch und Englisch, weitere Sprachen auf Anfrage.
KI-Verarbeitung. Die Transkripte werden von lokalen LLMs verarbeitet – Zusammenfassung, Aufgabenextraktion, Stimmungsanalyse. Alles auf Apple-Silicon-Hardware im EDNT Rechenzentrum. Bei Bedarf können für bestimmte Analysen auch API-Modelle eingebunden werden – aber die Audiodaten bleiben immer lokal.
CRM-Integration. Direkte Anbindung an EspoCRM über die API und auf Datenbankebene. Transkripte, Zusammenfassungen und Tasks werden als strukturierte Entitäten angelegt und mit dem richtigen Kontakt verknüpft. Kein unstrukturiertes Textfeld, sondern saubere Datensätze, die filterbar, durchsuchbar und reportfähig sind.
Archivierung. Auf Wunsch werden Transkripte in Paperless-ngx archiviert – revisionssicher, mit automatischer Klassifizierung und OCR-Indexierung.
Monitoring. Der gesamte Pipeline-Stack – FreeSWITCH, Spracherkennung, KI-Modelle, CRM-Sync – wird über Checkmk überwacht. Wenn die Transkription hängt oder die CRM-Ablage fehlschlägt, wissen wir es, bevor Sie es merken.
Warum KI-Telefonie von EDNT nicht mit Teams Copilot vergleichbar ist
| EDNT KI-Telefonie | Microsoft Teams Copilot | Standalone-Transkriptionstools | |
| Telefonanlage | Eigene (FusionPBX/FreeSWITCH) | Microsoft Teams | Keine eigene, dockt an |
| Sprachverarbeitung | Lokal im deutschen RZ | Microsoft Cloud (EU optional) | Cloud (oft US-Anbieter) |
| CRM-Integration | Direkt in EspoCRM, Datenbankebene | Dynamics 365 (Aufpreis) | Generische Webhooks |
| DMS-Integration | Paperless-ngx | SharePoint | Keine |
| Stimmungsanalyse | Inklusive | Eingeschränkt | Je nach Anbieter |
| Intelligente Anrufsteuerung | Ja, KI-basiert | Nein (Teams Auto Attendant) | Nein |
| Voicemail-to-Text | Ja, mit KI-Zusammenfassung | Basis-Transkription | Je nach Anbieter |
| DSGVO / Datenhoheit | Alles lokal, Open Source | Microsoft Cloud, DPA erforderlich | Abhängig vom Anbieter |
| Vendor Lock-in | Keiner | Microsoft-Ökosystem | Anbieterabhängig |
| Kosten | Teil des KI-Gesamtpakets | 30 €/User/Monat + Teams-Lizenz | 10–30 €/User/Monat |
Microsoft Teams Copilot kann Meetings zusammenfassen. Das ist nützlich. Aber es kann keine eingehenden Kundenanrufe transkribieren, keine Stimmungsanalyse auf Vertriebsgespräche anwenden und keine strukturierten Datensätze in Ihrem CRM anlegen. Es ist ein Meeting-Tool mit KI-Aufsatz. EDNT KI-Telefonie ist ein durchgängiges System, das Sprache zu Geschäftsdaten macht.
Standalone-Transkriptionstools wie Otter.ai oder Fireflies können transkribieren, aber die Integration endet bei einem Webhook. Die Daten landen irgendwo, aber nicht strukturiert in Ihrem CRM, nicht archiviert in Ihrem DMS und nicht verarbeitet auf Ihrer eigenen Hardware.
Häufige Fragen zur KI-Telefonie
Was kostet KI-Telefonie bei EDNT? KI-Telefonie ist kein isoliertes Produkt, sondern Teil unseres KI- und Telefonie-Stacks. Die Kosten hängen davon ab, ob Sie bereits eine EDNT-Telefonanlage und EspoCRM nutzen oder ob diese Systeme neu eingeführt werden. Für bestehende Kunden ist die KI-Erweiterung ein überschaubarer Aufpreis. Für Neukunden schnüren wir ein Gesamtpaket. In beiden Fällen liegen die Kosten deutlich unter dem, was Microsoft für Teams + Copilot + Dynamics 365 verlangt.
Funktioniert das mit jeder Telefonanlage? Die volle Integration mit Transkription, CRM-Ablage und Stimmungsanalyse funktioniert mit unserer FusionPBX/FreeSWITCH-Plattform. Wenn Sie eine andere Telefonanlage nutzen, prüfen wir, ob eine Anbindung über SIP-basierte Audiostreams möglich ist. Die tiefste Integration und beste Qualität erreichen wir aber mit unserem eigenen Stack.
Werden alle Gespräche aufgezeichnet? Nur wenn Sie das wollen und der Anrufer einwilligt. Sie definieren, welche Rufnummern, Abteilungen oder Gesprächstypen aufgezeichnet werden. Interne Gespräche können ausgenommen werden. Die Einwilligungsansage ist automatisiert und konfigurierbar.
Wie gut ist die Spracherkennung bei deutschen Gesprächen? Sehr gut. Moderne Speech-to-Text-Modelle erkennen Deutsch mit hoher Genauigkeit – auch bei Fachbegriffen, Dialekt und schnellem Sprechtempo. Perfekt ist keine Spracherkennung, aber die Qualität ist hoch genug, um Transkripte als Arbeitsgrundlage zu nutzen. Bei branchenspezifischem Vokabular können wir die Modelle feintunen.
Können Mitarbeiter die KI-Zusammenfassung korrigieren? Ja. Die automatische Zusammenfassung ist ein Vorschlag, kein finales Dokument. Mitarbeiter können Korrekturen vornehmen, bevor der Eintrag im CRM gespeichert wird – oder die Zusammenfassung direkt übernehmen, wenn sie passt. In der Praxis werden über 90 % der Zusammenfassungen unverändert übernommen.
Was passiert, wenn der Anrufer die Aufzeichnung ablehnt? Das Gespräch findet normal statt – ohne Transkription, ohne KI-Verarbeitung, ohne Aufzeichnung. Der Mitarbeiter kann nach dem Gespräch manuell eine Notiz im CRM anlegen, wie bisher. Die KI-Funktionen greifen nur bei Einwilligung.
Kann die KI während des Gesprächs live unterstützen? Ja. Auf Wunsch zeigt die KI dem Mitarbeiter während des Gesprächs relevante Kundeninformationen aus EspoCRM an – letzte Bestellung, offene Reklamationen, Vertragsstatus. Der Mitarbeiter sieht auf einen Blick den Kontext, ohne parallel im CRM suchen zu müssen.
Funktioniert das auch für Callcenter oder größere Teams? Ja. FreeSWITCH ist eine Carrier-Grade-Plattform, die für hohe Gesprächsvolumen ausgelegt ist. Wir betreiben Umgebungen mit über 100 Standorten. Die KI-Pipeline skaliert mit der Anzahl der gleichzeitigen Gespräche.
Oder sprechen Sie uns direkt an
EDNT IT-Services GmbH
Werner-von-Siemens-Str. 7
D-64625 Bensheim
Tel: +49 (0)6251 / 86143-0
E-Mail: vertrieb@ednt.de
Oder über unser Kontaktformular: