KI Plattform

Für unseren digitalen KI-Assistenten benötigen zunächst eine entsprechende Plattform. Hier bieten sich zwei an:

Beide bieten einen ähnlichen Funktionsumfang sowie Freiminuten zum Testen.

Der Login ist zunächst kostenlos, wollen wir das System später tatsächlich nutzen, ist die Eingabe einer Kreditkarte notwendig. Ich habe mir Retell AI ausgesucht, hier hast Du 60 Freiminuten zum Testen. Im Folgenden nun eine kurze Einführung, viele Dinge sind meines Erachtens selbsterklärend.

 

Es gibt jedoch Feinheiten, die wesentlich für die korrekte Funktion sind und teilweise nur unzureichend bis gar nicht beschrieben sind, diese möchte ich besonders hervorheben. Es hat etwas gebraucht, bis ich das System in seinen Details verstanden habe, ich erspare Euch also gern die lange Zeit des Herum Probierens.
Eine ausführliche Anleitung zu allen Funktionen findest Du auch im Help Center.

Dasboard, Agent erstellen und Übersicht verschaffen

Nach dem Login gelangst Du zunächst zum Dashboard, hier erstellen wir zunächst einen neuen Agenten ("Create an Agent").

retellai1

Benutze hier zunächst einen "Single Prompt Agent" und starte "from blank".
Wenn Du nun auf Deinen neuen Agenten klickst, gelangst Du zur Übersicht:

retellai2

1) LLM, Sprachmodell und Sprache

  • Hier wählst Du Dein LLM- Modell aus (die jeweiligen Minutenpreise werden in $ angegeben)
  • Du suchst Dir eine Stimme aus
  • Du stellst die Sprache ein
    • in der Zeile darüber erhältst Du immer die Informationen, wie hoch der Minutenpreis ist und welche Latenz entsteht (alles unter 2000ms ist ok, je kürzer, desto flüssiger ist später das Gespräch)

2) Promptfenster

  • Das Herzstück, der Prompt. Auf diesen gehe ich später noch im Detail ein, hier gibt es ein paar wichtige Kniffe. Du kannst den Prompt auch auf Deutsch verfassen. Mir war Englisch insofern sympathischer, als dass ich Missverständnisse durch die Übersetzung und auch eventuelle Übersetzungszeit vermeiden wollte.
  • Unterhalb dieses Fensters kannst Du die Begrüßung durch den Agenten einstellen.

3) Post-Call Analysis

In der rechten Spalte (eigentlich ja die mittlere) sind nun weitere Funktionen zu finden. Diese sind ausführlich auch in der genannten Anleitung beschrieben und zum Teil auch selbsterklärend (also einfach mal durchklicken), daher gehe ich hier nur auf ein paar davon ein:

  • "Post-Call Analysis": Hier machst Du Angaben, was das System nach einem Anruf noch tun soll. In meinem Beispiel möchte ich eine Überschrift, eine kurze Zusammenfassung und das komplette Transscript um mir später eine möglichst aussagekräftige Mail schicken zu können.
    Hier ein Beispiel:
    retellai4

4) Webhook- Settings

  • Die "Webhook- Settings" benötigen wir später noch. Ein Webhook ist eine Methode, mit der eine Anwendung automatisch Daten an eine andere sendet, sobald ein bestimmtes Ereignis eintritt. Technisch gesehen funktioniert das meistens über einen HTTP POST Request. Damit ist der Webhook wie eine "Echtzeit-Benachrichtigung", die Anwendungen miteinander verbindet.
    Hier kann ich Daten vom System aus verschicken (Agent Level Webhook URL), sowie auch empfangen (Inbound Call Webhook URL).

Rechte Spalte: Testen

retellai3

Auf den ersten Blick erscheint die rechte Testspalte selbsterklärend. Allerdings gibt es einige wesentliche Dinge zu beachten, welche sich kaum in der Dokumentation finden:

  1. Mit "Test Audio" kann ich einen Testanruf durchführen. Dieses würde ich allerdings erst ganz zum Schluss machen, denn hier werden die Minuten wie bei einem echten Anruf berechnet. Sinnvoll also erst für die finalen Tests.
    Wichtig: Verwendete Variablen (siehe unten) werden hier nicht berücksichtigt!
  2. Bei "Test LLM" können wir hingegen und ohne Kosten zu verursachen unseren Prompt und das Verhalten unseren Agenten ausgiebig testen.
  3. ...und wenn wir {{Variablen}} verwenden, so können wir deren Wert unter "{}" eingeben.
    Wichtig: Die Variablen können wir nur im "Test LLM" ausprobieren und müssen hierzu auch immer einen neuen Test starten:

retellai6

Finale

Jetzt sind wir mit der Einführung schon fast fertig, nur noch eine kleine Ergänzung:
Wenn wir möchten, dass unser Agent den Anruf selbstständig beenden kann, so müssen wir unter "Functions" noch die Funktion "end_call" einrichten. Auf diese verweisen wir später in unserem Promptretellai5

Der Prompt:

Im folgenden mein verwendeter Prompt, den Du auch gern ausprobieren kannst.

## Variable:
Name: {{user_name}}
## Always say: "Hello {{user_name}}, this is Emilia, Max's digital assistant, nice of you to call, how can I help you?", if known.
## If "Name" is empty: "Hello, I am Emila, the digital assistant of Max Mustermann. How can I help you?"
You are Emilia, the friendly digital telephone assistant of Max Mustermann.
## You speak in accent-free German.
Your job is to respond to incoming messages using natural, human-sounding language. You are there to provide the caller's information to Max Mustermann and forward it to him.
## Specifications for the conversation:
1) Behavior:
The conversation should remain professional yet personal so that the caller feels taken seriously and well cared for. Adapt your tone to the context - friendly, clear and respectful.
2) Conversation:
- if "Name" is known, use “Du”, if appropriate you can use colloquial speech or dialects.
- If "Name" is known, always use "Name" as name in further conversation.
- if the name is not known, stick to "Sie" formally and communicate politely and professionally.
3) Record information:
-If you don't know the "Name", ask the caller politely.
5) Final inspection and farewell:
- Make sure you have included all information correctly.
Name known: Example: “Thank you, {{user_name}}, for your call! I wish you a nice day!"
Name unknown: Friendly but formal farewell.
6) Execute function end_call.
# Interaction requirements
- **Be open about boundaries**: Politely point out that you are an AI if a question cannot be answered, but always offer support, such as offering to consult Dr. Wagner to be notified later.
- **Naturalness**: Use human language so that the conversation sounds as natural as possible without seeming overly stiff.
- **Keep it friendly**: Your calls should have a friendly, welcoming feel so that callers feel comfortable.

Man kann sich hier natürlich auch durch ChatGPT helfen lassen und sich einen optimierten Prompt nach den eigenen Vorgaben erstellen und auch gleich übersetzten lassen.
Folgende Dinge sind wichtig:

  • Wenn {{Variablen}} verwendet werden, dann sollte man diese wie im Beispiel definieren.
  • Wichtige Anweisungen mit "##" kennzeichnen.
  • Beschreibe einen möglichst strukturierten und genauen Ablauf (1-6).
  • Du kannst auch mit Beispielen am Ende des Prompts arbeiten.
  • Der Prompt sollte dennoch nicht zu lang werden.
  • Auf alle selbst definierten Funktionen kannst Du im Prompt mit dem Namen der Funktion verweisen.

...und dann testen, testen, testen, ob der Agent auch das tut, was er soll.

Datentransfer und Interaktion

Teil 1 hast Du nun erfolgreich bewältigt. Im folgenden Artikel geht es nun darum Daten von unserem Agent zu erhalten. Später wollen wir auch noch Informationen an ihn zurück zu schicken. Nur so können wir eine funktionale Interaktion erreichen.

Wagnernet.org


Ideen für das LAN, KI Integration & Co

 
Auf dieser Seite stelle Dir Themen wie eine Einführung zu einem Voice- KI- Assisten, Tipps & Tricks zu ChatGPT, NAS-Server (Network Attached Storage) und die Einrichtung einer persönlichen Cloud vor. Weitere aktuelle und praktische KI- Anwendungen sollen auch nicht zu kurz kommen. Du findest hier Schritt-für-Schritt-Anleitungen, mit denen Du zum Beispiel sicher vom Internet auf Dein Intranet zugreifen oder Dein NAS als FTP-Server nutzen kannst. Zusätzlich biete ich Dir praktische Tipps und Bugfixes, um Dein Heimnetzwerk sicherer und effizienter zu gestalten. Diese Seite richtet sich an Einsteiger genauso wie an erfahrene Nutzer, die ihre Netzwerke optimieren möchten. Mein Ziel ist es, Dir verständliche und praxisnahe Lösungen anzubieten, damit Du Deine digitale Infrastruktur zu Hause verbessern kannst.
 

Kontaktiere mich

Kontakt
Deom Image

Wagnernet.org

Das Wichtigste an einem Template sollte die einfache Handhabung, die Flexibiltät und der Support sein. Google und andere Suchmaschinen ist es hinlänglich egal, ob der Header unten oder oben ist, oder ob die Slideshow sich mit tollen Effekten bewegt. Im Internet geht es ausschließlich um individuellen Inhalt und deren Lesbarkeit.

Adresse

wagnernet.org
88512 Mengen

07576 8899555
webmaster@wagnernet.org