Welche Datenquellen verwenden Sie zum Trainieren Ihres großen Sprachmodells (LLM)?

Genesys kuratiert die zur Feinabstimmung des Modells verwendeten Daten sowohl aus Open-Source-Gesprächen als auch von Genesys Cloud-Kunden, die sich bereit erklären, an Produktverbesserungen teilzunehmen, einschließlich Sprachanrufen und Chats aus verschiedenen digitalen Kanälen. Es wird darauf geachtet, dass die Daten mehrere Domänen und Branchen umfassen und sowohl durch automatisierte Prozesse als auch durch manuelle Annotationen streng auf Integrität und Genauigkeit überprüft werden.

Die Daten spiegeln die Arten von Gesprächen wider, die das Modell in realen Produktionsszenarien voraussichtlich antreffen wird. Es gibt Maßnahmen, um Vorurteile hinsichtlich der Domäne, des Geschlechts, der Rasse oder anderer geschützter Merkmale zu mildern. Genesys setzt außerdem strenge Prozesse ein, um unangemessene Sprache herauszufiltern. Alle Daten werden sicher in der Genesys Cloud archiviert und der Zugriff ist streng kontrolliert.