KIDOU Sprachbaukasten mit leistungsstarken KI-Komponenten

Entwicklung von maßgeschneiderten Sprachassistenzsystemen durch die Integration verschiedener KI-Komponenten

Edge

Offline Sprachassistenz

Wir bieten Sprachassistenzsysteme an, die ohne Internetverbindung funktionieren, für Anwendungsfälle, in denen möglicherweise kein Netzwerk verfügbar ist (z. B. kein WLAN, Funklöcher oder Krisensituationen), oder in Situationen, in denen Daten lokal bleiben müssen.

On-Premises Sprachassistenz

Maximaler Datenschutz, höchster Schutz von Intellectual Property (IP), ideal für Behörden und sensible Daten. Die Spracherkennung erfolgt On-Premisesin Ihrem Rechenzentrum. 

Cloud

Cloud Sprachassistenz

Unkomplizierte Einrichtung, müheloser Betrieb, einfache Modell-Aktualisierungen, kein Bedarf an eigenen Ressourcen für den Betrieb der Sprachassistenz, geringerer Akkuverbrauch auf dem Endgerät und die Möglichkeit der nahtlosen Integration in die Cloud für eine optimale Leistung.

Edge

Passgenaue Sprachassistenz

Unsere Sprachassistenten sind darauf ausgerichtet, Fachbegriffe in bestimmten Domänen, regionale Dialekte sowie Umgebungen mit vielen Stör- und Hintergrundgeräuschen präzise zu erkennen und zu verstehen.

CASSANDRA
Ein KI-Teammitglied in der Anästhesie

Watch KIDOU in Action

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

Flexibilität, Skalierbarkeit und Anpassungsfähigkeit

Unser eigens entwickelter Sprachbaukasten KIDOU umfasst eine breite Palette von KI-Komponenten für die Verarbeitung von Sprache und Text. Er bewältigt Herausforderungen wie präzise Spracherkennung bei regionalen Dialekten und in lauten Umgebungen, verarbeitet spezielle Fachbegriffe und kann mit umfangreichen Zahlenkolonnen umgehen.

KI-Komponente im Überblick

Unsere KI-Komponenten sind darauf ausgelegt, flexibel, skalierbar und anpassungsfähig zu sein, um den Anforderungen verschiedenster Anwendungsfälle des Unternehmens gerecht zu werden.

Noise reduction / Rauschunterdrückung

In der Einsatzumgebung werden hohe Stör- oder Hintergrundgeräusche erwartet. 

Hochpräzise Rauschunterdrückung, die speziell auf Ihre Umgebung zugeschnitten ist, um eine optimale Sprachqualität zu gewährleisten.

Technologien: Signal Processing, MEL, Deep Learning 

Voice recognition / Voice Activity Detection

Präzise Erkennung von Sprachaktivitäten, unabhängig von Hintergrundgeräuschen.

Anwendungsfall: Automatische Transkription von Meetings, bei denen nur gesprochene Inhalte erfasst werden sollen.  

Technologien: Machine Learning, Signal Processing. 

Text-to-speech / tts

Das System soll auch in natürlicher Sprache antworten, z.B. in Situationen, in denen nicht auf einen Bildschirm gesehen werden kann wie im Auto, im Operationssaal, etc.

Generiert natürliche Sprachausgabe, die individuell an Ihre Markenidentität angepasst werden kann.

Anwendungsfall: Personalisierte Kundenkommunikation, z.B. automatische Antwort auf Kundenanfragen per Telefon.

Technologien: Deep Learning, Natural Language Processing

Dialogue guidance / Dialogführung

Unterstützt natürliche und effektive Gespräche zwischen Benutzern und Systemen, angepasst an Ihre spezifischen Anwendungsfälle.

Anwendungsfall: Chatbot zur Kundenbetreuung, der komplexe Anfragen bearbeiten kann.

Technologien: Natural Language Understanding, Dialog Management, Deep Learning 

Speaker identification / Sprechererkennung

Identifiziert zuverlässig individuelle Sprecher und ermöglicht personalisierte Interaktionen.

Anwendungsfall: Zuordnung der unterschiedlichen Sprecher in der Transkription z.B. einer Gerichtsverhandlung oder Besprechung, Authentifizierung von Benutzern in Sprachsteuerungssystemen.  

Technologien: Machine Learning. 

Wakeword / Hey KIDOU

Aktiviert Sprachsysteme präzise und zuverlässig, verhindert die Transkription im deaktivierten Zustand und spart massiv Batterielebensdauer.

Anwendungsfall: Aktivierung eines Sprachassistenten durch ein spezifisches Wort. Technologien: Deep Learning, Signal Processing.

Speech-to-text / stt

Wandelt gesprochene Wörter in textuelle Formate um und bietet eine präzise Spracherkennung. Dies ist in fast jedem Anwendungsfall enthalten. Durch spezielles Training erkennt unsere Komponente die spezielle Fachbegriffe, Dialekte, Akzente und Formulierungen Ihrer Domäne und ist extrem robust gegenüber störenden Umgebungsgeräuschen. 

Anwendungsfälle: Freies Diktat in beliebige Anwendungen, Dokumentation der Mängel bei Inspektionen und Wartungen, Erfassen einer Diagnose oder Behandlung, Transkription von Gerichtsverhandlungen oder Meetings.  

Technologien: Deep Learning. 

Matcher / Speech-to-structure

Einfaches und schnelles ausfüllen von Formularen und Kommando-steuerung 

Erkennt und extrahiert strukturierte Informationen aus Text, auch wenn dieser fehlerhaft ist. Diese Informationen werden dann strukturiert und in einem einheitlichen Format, z.B. JSON zur weiteren Verarbeitung zur Verfügung gestellt. 

Anwendungsfälle: Inspektionen und/oder Wartung zur Identifikation von Fehler mit Ort, Schweregrad und beteiligten Bauteilen. 

Technologien: Deep Learning. 

Text and Document classification

Analysiert große Mengen von Textdaten, um diese zu klassifizieren und relevante Informationen zu extrahieren.

Anwendungsfall: Automatisierte Kategorisierung von Kundenfeedbacks.

Technologien: Machine Learning, Natural Language Processing. 

Question & Answering

Ermöglicht präzise Antworten auf komplexe Fragen aus umfangreichen Dokumenten oder Datenbanken. Wenn es aus Intellectual Property (IP) oder Datenschutzgründen erforderlich ist, auch mit einem eigenen Large Language Model (LLM), das OnPrem in Ihrem Haus betrieben werden kann.

​Anwendungsfälle: Internes System, das Fragen zu Verfahrensdokumentation beantwortet, automatisierte Kundenunterstützung, z.B. Beantwortung von FAQs.

Technologien: Large Language Models, Deep Learning, Natural Language Processing

Voice command for apps

Mit den beschriebenen Komponenten kann Ihre bestehende App sprachfähig gemacht werden, Ihre Kunden und Mitarbeiter können mit Ihrer gewohnten App arbeiten und zusätzlich Sprache zur Steuerung und Eingabe nutzen, 

Anwendungsfall: Firmeneigene App zur Dokumentation von Fehlern bei Inspektionen und/oder Wartungen

Sentimental analysis

Erkennt und versteht die Stimmung und Emotionen in geschriebenem oder gesprochenem Text.  

Anwendungsfall: Reaktion im Dialog je nach Kundenstimmung in einem telefonischen Voicebot. 

Technologien: Machine Learning, Natural Language Processing. 

Sie haben weitere Fragen zu unseren KI-Komponenten oder wollen Sie sich kostenlos beraten lassen?
Dann freuen wir uns über Ihre Kontaktanfrage.

„Mit den KIDOU Sprachkomponenten der KENBUN IT AG erweitern wir unsere Software zur Kfz- Hauptuntersuchung in Deutschland und Frankreich, um eine komfortable und sehr effiziente „handsfree“ Sprachbedienung zu erhalten.“

DEKRA Mitarbeiter

„Durch die Integration der Voice-Technologie von KENBUN IT AG in unsere oxando ONE Platform erfolgt die mobile Datenerfassung hands-free per Spracheingabe. Das einfache Eintragen und die direkte Übermittlung der Daten durch die Sprachassistenz, sorgt für vereinfache und beschleunige Arbeitsprozesse in Instandhaltung und Service.“

Andreas Schmidt, Geschäftsführer und Lösungsarchitekt bei oxando.

"Digitale Anamnesebogen in Vetinf, erfasst mit dem KIDOU Sprach-Modul der KENBUN IT AG und die Anbindung der eigenen veterinärmedzinischen Vokabular-Datenbank, unterstützen und vereinfachen die notwendigen Dokumentationspflichten der tierärztlichen Tätigkeiten.“

Gerd Zimmermann, Geschäftsführer Vetinf

 

Dekra

„Mit den KIDOU Sprachkomponenten der KENBUN IT AG erweitern wir unsere Software zur Kfz- Hauptuntersuchung in Deutschland und Frankreich, um eine komfortable und sehr effiziente „handsfree“ Sprachbedienung zu erhalten.“

DEKRA Mitarbeiter

„Durch die Integration der Voice-Technologie von KENBUN IT AG in unsere oxando ONE Platform erfolgt die mobile Datenerfassung hands-free per Spracheingabe. Das einfache Eintragen und die direkte Übermittlung der Daten durch die Sprachassistenz, sorgt für vereinfache und beschleunige Arbeitsprozesse in Instandhaltung und Service.“
Andreas Schmidt, Geschäftsführer und Lösungsarchitekt bei oxando.

Digitale Anamnesebogen in Vetinf, erfasst mit dem KIDOU Sprach-Modul der KENBUN IT AG und die Anbindung der eigenen veterinärmedzinischen Vokabular-Datenbank, unterstützen und vereinfachen die notwendigen Dokumentationspflichten der tierärztlichen Tätigkeiten.“

Gerd Zimmermann, Geschäftsführer Vetinf

Selbstentwickelt & Unabhängig

Nahtlose KIDOU Integration und maximale Flexibilität

Alle KI-Komponente von KIDOU wurden von KENBUN selbst entwickelt und sind vollständig unabhängig von Produkten oder Diensten anderer Hersteller. Dadurch bieten wir Ihnen eine nahtlose Integration und maximale Flexibilität, um Ihre individuellen Anforderungen zu erfüllen.  

Willkommen bei KENBUN – Ihrem zuverlässigen Partner für maßgeschneiderte Sprachassistenzsysteme mit KIDOU. 

Entscheiden Sie sich jetzt für Ihren maßgeschneiderten Sprachassistenten!

* Pflichtfeld

Entscheiden Sie sich jetzt für Ihren maßgeschneiderten Sprachassistenten!

* Pflichtfeld

INTEGRATION    
KIDOU Sprach Tools