Zurück zu FallstudienKI Engineering

24/7 KI-Persönlicher Assistent

Wie wir einen kostenlosen KI-Agenten gebaut haben, der rund um die Uhr auf AWS läuft, Kalender verwaltet, im Web sucht und Workflows über Telegram automatisiert.

Konventionelle KI-Tools wie ChatGPT arbeiten reaktiv — Nutzer starten Sitzungen und beenden sie wieder. Wir haben dieses Paradigma als proaktiven Agenten neu gedacht, der eigenständig rund um die Uhr arbeitet und zeigt, dass anspruchsvolle KI-Assistenz keine teure Infrastruktur erfordert, wenn sie richtig architekturiert ist.

AI Personal Assistant Demo
0 €
Infrastrukturkosten
24/7
Verfügbarkeit
6
Integrierte Skills
<2s
Antwortzeit

Was der Assistent tatsächlich macht

Der Assistent ist eine kontinuierliche KI, die in Telegram integriert ist. Er arbeitet rund um die Uhr — verwaltet Kalender, führt Websuchen durch, liefert proaktive Benachrichtigungen und automatisiert Workflows — alles über natürlichsprachliche Chat-Befehle.

Anders als sitzungsbasierte KI-Tools läuft er persistent im Hintergrund. Er wartet nicht darauf, dass man eine App öffnet. Er meldet sich, wenn das nächste Meeting ansteht, erinnert an Aufgaben und erledigt mehrstufige Workflows autonom.

Die Architektur

Die zentrale architektonische Entscheidung war der Aufbau eines skill-basierten Entscheidungssystems. Wenn eine Nachricht eingeht, analysiert das System sie und leitet sie an das entsprechende Skill-Modul weiter — ob Kalenderverwaltung, Websuche oder Workflow-Automatisierung.

Googles Gemini API bildet die Reasoning-Schicht und verarbeitet natürliche Sprache in strukturierte Aktionen. Die Telegram Bot API dient als Interface-Schicht und macht den Assistenten von jedem Gerät aus zugänglich. Die Brave Search API ermöglicht Echtzeit-Webabfragen und die Google Calendar API übernimmt die Terminverwaltung.

Alles läuft auf einer AWS EC2 Free-Tier-Instanz — ein einzelner Ubuntu-Server mit 4 GB RAM. Das gesamte System wurde so konzipiert, dass es innerhalb der Free-Tier-Grenzen arbeitet, ohne Zuverlässigkeit oder Antwortgeschwindigkeit einzubüßen.

Skill-basierte Entscheidungsarchitektur

Das System verwendet eine modulare Skill-Architektur zur API-Orchestrierung. Jeder Skill ist ein eigenständiges Modul, das eine bestimmte Domäne abdeckt: Kalenderoperationen, Websuche, Erinnerungen und benutzerdefinierte Workflows.

Wenn man sagt "Plane ein Meeting mit dem Team morgen um 15 Uhr", erkennt das System den Kalender-Skill, extrahiert die relevanten Parameter (Eventname, Datum, Uhrzeit) und führt den Google Calendar API-Aufruf aus. Bei der Frage "Was passiert heute in der KI?" leitet es an den Brave Search Skill weiter und liefert zusammengefasste Ergebnisse.

Neue Fähigkeiten hinzuzufügen bedeutet ein neues Skill-Modul zu erstellen und zu registrieren. Das System ist so konzipiert, dass es ohne Änderung des bestehenden Codes erweitert werden kann.

Warum das funktioniert: Kosten-Nutzen-Analyse

Das empfohlene Cloud-Setup kostet 0 € bei 24/7-Verfügbarkeit und schnellen Antwortzeiten. Wir nutzen AWS Free-Tier für Compute, Googles 300 $ Testguthaben für die Gemini API und Telegrams kostenlose Bot API als Interface.

Die Alternative wäre teure Hardware wie ein Mac Mini (600 €+) oder unzuverlässige, unterdimensionierte Cloud-Instanzen. Durch die richtige Architektur um Free-Tier-Beschränkungen herum haben wir produktionsreife Zuverlässigkeit bei null Kosten erreicht.

Der Installationsprozess ist auf einen einzigen Befehl über die AWS Browser-SSH-Konsole optimiert. Von einer nackten Ubuntu-Instanz zum voll funktionsfähigen KI-Assistenten in Minuten.

Konnektivität & Integrationen

Die Telegram-Integration wurde wegen ihrer Verbreitung und Einfachheit gewählt. Einen API-Token über BotFather generieren, mit dem System verbinden, und man hat einen persönlichen KI-Assistenten, der vom Handy, Tablet oder Desktop aus erreichbar ist.

Brave Search bietet Webzugang ohne den Overhead von Browser-Automatisierung. Die Google Calendar API ermöglicht vollständige Kalenderverwaltung — Termine erstellen, bearbeiten und löschen durch natürliche Sprache. Das Skill-System macht es einfach, bei Bedarf neue Integrationen hinzuzufügen.

Was wir beim Bauen gelernt haben

Die wichtigste Erkenntnis war, dass Infrastrukturkosten und KI-Fähigkeit nicht so korrelieren, wie die meisten annehmen. Ein gut architekturiertes System auf Free-Tier-Ressourcen kann teure Setups übertreffen, die nicht mit den richtigen Einschränkungen im Sinn entworfen wurden.

Proaktives Verhalten verändert das gesamte Nutzererlebnis. Der Unterschied zwischen einer KI, die man öffnen muss, und einer KI, die sich von selbst meldet, ist fundamental — es verwandelt das Tool vom Assistenten in einen echten Begleiter.

Skill-Modularität ist essenziell für die Wartbarkeit. Jede Fähigkeit ist isoliert, testbar und austauschbar. Dieses Muster skaliert natürlich, wenn neue Integrationen verfügbar werden.

Verwendete Technologien

PythonAWS EC2Google Gemini AITelegram Bot APIBrave Search APIGoogle Calendar APIUbuntu Server

Wichtige Ergebnisse

0 € Infrastruktur24/7 Verfügbarkeit6 integrierte Skills