ein ambitionierter Versuch, Sci-Fi-Träume von leistungsfähigen Jarvis-Assistenten wahr werden zu lassen – wenngleich in einer frühen und noch nicht ausgereiften Form
Aus meiner Leidenschaft für Science-Fiction entstanden ist dieses Projekt mit dem Ziel, authentische, menschenähnliche Gespräche mit KI-Persönlichkeiten ermöglichen.
Die Idee ist, auf natürliche Weise mit künstlichen Intelligenzen zu kommunizieren und sie nach persönlichen Vorstellungen anzupassen zu können. Zusätzlich zur Unterhaltung stehen praktische Anwendungen im Vordergrund: Smart-Home-Geräte steuern, Musik abspielen, im Internet suchen, E-Mails abrufen, aktuelle Wetterinformationen und Nachrichten anzeigen, bei der Terminplanung unterstützen und Bilder suchen oder generieren.
Das Projekt steckt noch in den Kinderschuhen, doch das Ziel rückt mit jedem Entwicklungsschritt näher. Ich lade euch ein, euch in diesem digitalen Umfeld umzusehen und mitzuwirken – ganz gleich, ob ihr einfach nur eine innovative KI-Erfahrung sucht oder selbst Entwickler seid und das Projekt weiter voranbringen möchtet. Alle Anregungen, Ideen und Beiträge sind herzlich willkommen. Ich hoffe auf die Unterstützung der Community, um dieses Herzensprojekt vollends zur Entfaltung bringen und so einen Beitrag zur Entwicklung der KI leisten zu können.
Erlebe Linguflex in Aktion in einer kurzen Video-Demonstration, in der einige Funktionen vorgestellt werden.
Für den Einstieg folge einfach den Anweisungen im Installationsleitfaden.
Um den Assistenten nach deinen Wünschen zu gestalten, wirf einen Blick auf den Konfigurationsleitfaden.
Zusätzliche Module, die die Grundfunktionen von Linguflex erweitern, kannst du mithilfe des Modul-Installationsleitfadens installieren.
Mit diesen Anleitungen steht deinem Abenteuer mit Linguflex nichts mehr im Wege. Viel Spaß beim Entdecken und Mitgestalten!
Linguflex bietet eine Vielzahl an Funktionen:
-
Konversations-KI: Natürliche Gespräche basierend auf dem OpenAI GPT-3.5-Turbo-Modell, mit der Möglichkeit, auf GPT-4 zu skalieren.
-
Modulare Architektur: Plattform zur einfachen Entwicklung eigener Zusatzmodule.
-
Mehrsprachigkeit: Sprachdateien für deutsch und englisch enthalten.
-
Spracherkennung: Spracherkennung über Whisper, Nutzung der GPU mit CUDA möglich.
-
Individuelle Persönlichkeiten: Eigene KI-Persönlichkeiten entwickeln und sie mit Text-zu-Sprache-Stimmen verknüpfen.
-
Text-zu-Sprache: Sprachsynthese erfolgt mithilfe von ElevenLabs, Azure, Edge Browser oder Systemstimmen.
-
Smart-Home-Steuerung: Ermöglicht Integration Tuya-kompatibler WLAN-Geräte wie Lichtern, Steckern und Schaltern.
-
Medienwiedergabe: Sucht und spielt Musik/Playlists von YouTube. Beinhaltet Wiedergabekontrolle und Player-Benutzeroberfläche.
-
Visuelle Benutzeroberfläche: Intuitive grafische Oberfläche mit subtilem akustischem Feedback zu Assistentenaktionen.
-
Internetrecherche: Führt Text- und Bilder-Recherchen durch.
-
Terminplanung: Erinnert an Termine mit Google Calendar
-
E-Mail-Verwaltung: Holt E-Mails ab.
-
Wetterberichte: Liefert aktuelle Wetterdaten und -prognosen.
-
Nachrichtenzusammenfassung: Sammelt aktuelle Nachrichten und präsentiert sie in kompakten Zusammenfassungen.
-
Bildgenerierung: Erzeugt Bilder auf Grundlage von Textaufforderungen und Beschreibungen mittels der DALL-E API.
-
Aktivierung durch Schlüsselwort: Startet Interaktionen bei Erkennung vordefinierter Schlüsselwörter. Die Empfindlichkeit lässt sich individuell einstellen.
-
Gesprächsverlauf: Behält den Kontext über die Gesprächsrunde hinweg bei, indem es den Gesprächsverlauf verwaltet.
-
Diagnose: Detailliertes Logging zur Fehlerbehebung. Visualisierung der Mikrofonkalibrierung.
-
Token-Sparmechanismen: Verschiedene Mechanismen zum Einsparen von Tokens, wie etwa die Verwaltung der Gesprächsverlauf-Größe und deren Reduzierung, um sowohl kostengünstige als auch hochwertige Installationen zu unterstützen.
-
Kontextsensitiver Modellwechsel: Wechselt automatisch zu einem Modell mit größerem Kontextfenster, wenn dies erforderlich ist. So kann bei Bedarf auf das gpt-4-32k-0613 Modell skaliert werden.
Das Ziel ist es, diese Fähigkeiten schrittweise weiterzuentwickeln, um das Erlebnis mit dem digitalen Assistenten so performant, aufregend und individuell wie möglich zu gestalten.
Das Projekt ist noch in einer frühen Entwicklungsphase und viele der Komponenten nicht ausgereift und weit entfernt von perfekt.