In ihrem Talk „It Works on My Machine: Why LLM Apps Fail Users (Not Tests)” teilen sie Erfahrungen aus realen Kundenprojekten und zeigen, wie man LLM-Systeme so entwickelt und betreibt, dass sie nicht nur in der Evaluation gut aussehen, sondern im Alltag echten Mehrwert für Nutzerinnen und Nutzer liefern.
Im Mittelpunkt stehen drei Dimensionen, die darüber entscheiden, ob eine Anwendung als „funktionierend“ erlebt wird:
Statt sich auf Tools oder Frameworks zu konzentrieren, beleuchtet der Talk die menschliche Seite von Evaluation: Wie finden wir heraus, ob ein System wirklich den Menschen dient, die täglich damit arbeiten?
Wer LLM-Anwendungen plant, entwickelt oder in Produktion verantwortet, bekommt praxisnahe Einblicke, typische Fallstricke aus realen Szenarien – und Anregungen für eigene Strategien und Muster, um nutzerzentrierte, robuste Systeme zu bauen.
Vier neunzehn-Kunden stellen beim Demo-Day des KI-Lab Heidelberg ihre Projekte vor
Mehr lesenneunzehn innovations zu Gast bei DeepTechHub
Mehr lesen