.webp&w=3840&q=95)
Introducing The Eleven Album
A landmark musical release created in collaboration with world-class artists and powered by Eleven Music.
KUBI est un barista conversationnel qui fonctionne avec la Conversational AI d’ElevenLabs. Voici comment.
KUBI est un robot barista et réceptionniste conversationnel chez Second Space, un espace de coworking nouvelle génération ouvert 24h/24 à Kaohsiung, Taïwan. Comme tout fonctionne en autonomie, il est essentiel que KUBI — premier point de contact avec les membres — apporte une touche chaleureuse et unique. C’est pourquoi Second Space a choisi la Conversational AI d’ElevenLabs pour créer des échanges ludiques et mémorables avec les membres. Voyons KUBI en action.
KUBI utilise une architecture multi-sensorielle avancée pour simuler une interaction humaine. Le système repose sur une architecture microservices, où chaque service spécialisé fonctionne en parallèle et communique via un flux d’événements en temps réel. Ces services gèrent différentes tâches : reconnaissance faciale et d’objets grâce à l’IA en temps réel, détection de tasses et vérifications via caméras, impression de reçus, reconnaissance faciale sécurisée pour le contrôle d’accès, et gestion précise des distributeurs de lait et de grains.
Voici quelques-uns des services qui tournent en parallèle :
Pourquoi tous ces microservices ? Simple : on les gère séparément, on peut facilement les faire évoluer, et on utilise les meilleurs outils pour chaque tâche.
Pour coordonner tous ces microservices, un service central, surnommé avec humour "BigBoy", fait office de grand processeur d’événements non bloquant :
| 1 | |
| 2 | internal object WeatherIdleScenario: SingleTaskScenario(scenario){ |
| 3 | |
| 4 | importance = Importance.Medium |
| 5 | compilationTimeout = Time.ThreeSeconds |
| 6 | interruptable = false |
| 7 | exeutionExpiration = = Time.TenSeconds |
| 8 | |
| 9 | override fun isEligible(event: Event, environment: Environment): Maybe<Boolean> = withEnvironment(environment) { |
| 10 | just { |
| 11 | (event is IdleEvent |
| 12 | && !triggeredInLast(40.minutes) |
| 13 | && (personPresent() || hasActiveSessions) |
| 14 | && environment.weatherService.lastReportWithin(10.minutes)) |
| 15 | } |
| 16 | } |
| 17 | } |
| 18 | |
| 19 | private val scenario = ScenarioRecipe { event, env, session -> |
| 20 | |
| 21 | |
| 22 | invokeOneOf( |
| 23 | |
| 24 | phrase { |
| 25 | sayWith { |
| 26 | "Rainy day today, isn't it? That's why I have my little umbrella! Look!".asEnglish |
| 27 | }.withAutoGift().withAutoMotion() |
| 28 | }.given { Weather.isRaining() }, |
| 29 | |
| 30 | phrase { |
| 31 | sayWith { |
| 32 | "Friend, it's so cold outside! So sad for you... because you're a human. I don't really mind!".asEnglish |
| 33 | }.withAutoMotion() |
| 34 | |
| 35 | sayWith { |
| 36 | "Wait, that soudned a bit rude.".asEnglish |
| 37 | }.withAutoMotion() |
| 38 | |
| 39 | }.given { Weather.isCold() }, |
| 40 | |
| 41 | ) |
| 42 | |
| 43 | |
| 44 | } |
| 45 | |
| 46 |
Qu’est-ce qu’un scénario ?
Imaginez les scénarios comme des compilateurs non bloquants pour les événements d’action. Un événement d’action est généralement l’événement final d’une chaîne, qui provoque un effet physique, comme un mouvement ou une parole. Par exemple, un scénario de salutation peut déclencher :
Génération d’événements avec LLM : Certains événements d’action sont générés automatiquement par un LLM, par exemple, withAutoMotion choisit le meilleur mouvement dans une liste prédéfinie selon le contexte. Tandis que withAutoGif utilise un LLM pour générer le tag le plus adapté à la phrase donnée. Ce tag permet de récupérer un GIF sur Giphy, qui sera ensuite affiché sur le visage de KUBI avec la phrase.
Synchronisation des événements d’action : Ces événements passent ensuite par un planificateur qui garantit la synchronisation entre la parole, les expressions faciales et les mouvements. Cela permet à la voix de KUBI de toujours correspondre à ses gestes.
Ce qui est génial, c’est que les scénarios peuvent même écouter les événements d’action et déclencher de nouveaux événements d’action dynamiquement. Par exemple :
BigBoy voit et sait littéralement tout ce qui se passe. Plutôt cool, non ?
La plupart des services sont hébergés localement dans des conteneurs Docker. Leur cycle de vie est géré par le système Supervisor. Les logs d’erreur sont collectés dans Sentry et remontés dans une application d’administration personnalisée pour surveiller les exceptions, l’état en temps réel des services et capteurs, ainsi que la latence. Le plus cool, c’est que l’application Flutter a été générée à 90% par l’IA.
Second Space avait une personnalité bien précise en tête pour KUBI : un mélange de Deadpool, Wheatley du jeu Portal et un peu de Pathfinder d’Apex Legends. Ils ont réussi à concevoir la voix en 15 minutes, avec émotions et pauses pour la rendre encore plus humaine.
ElevenLabs alimente les capacités vocales de KUBI grâce à deux API principales :
Activé quand un client dit "Hey KUBI!", la Conversational AI d’ElevenLabs peut répondre en 200ms, rendant l’échange vraiment naturel.
Grâce à la Conversational AI d’ElevenLabs via WebSocket, KUBI peut utiliser le function calling, par exemple :
Changer facilement de modèle LLM via le panneau d’administration ElevenLabs aide Second Space à optimiser la compréhension et la précision, car on a remarqué que certains modèles reconnaissent mieux les intents que d’autres. Ils utilisent actuellement Gemini 2.0 Flash comme modèle principal pour la Conversational AI et ChatGPT 4o pour la génération de discours statique.
Les premiers commits GitHub de Second Space mentionnant ElevenLabs datent de janvier 2023 — avant même la sortie du modèle multilingue. Ils ont très tôt reconnu l’engagement d’ElevenLabs pour la qualité et ont construit une architecture anticipant le support multilingue. Aujourd’hui, s’ouvrir à des marchés comme le Japon ou la Corée du Sud est aussi simple qu’actionner un interrupteur — sans travail de développement supplémentaire !
Microservices, événements en temps réel et la technologie vocale puissante d’ElevenLabs donnent à KUBI une vraie personnalité, prêt à conquérir et ravir le monde, un café et une réplique à la fois.
.webp&w=3840&q=95)
A landmark musical release created in collaboration with world-class artists and powered by Eleven Music.

Scaling evidence-based voice solutions for gut-brain health