Augury Logo

Augury

Voice Agents på Byggepladsen: Sådan Bruger Bygro Stemmestyring til Feltarbejde

Cover Image for Voice Agents på Byggepladsen: Sådan Bruger Bygro Stemmestyring til Feltarbejde
Kasper Kristian RasmussenKasper Kristian Rasmussen

Voice Agents på Byggepladsen: Sådan Bruger Bygro Stemmestyring til Feltarbejde

Voice agents er ikke begrænset til telefoni. I Bygro bruger vi stemmestyring direkte i mobilappen og webapplikationen til byggearbejdere der dokumenterer på feltet.

Hvorfor Voice på Byggepladsen?

Byggearbejdere har hænderne fulde. De kan ikke holde pause for at taste noter, søge efter sager eller udfylde formularer. Stemmestyring giver:

  • Universal adgang – tal på dit modersmål (dansk, polsk, litauisk, engelsk m.fl.)
  • Ingen tastatur – dokumenter mens du arbejder
  • Hurtigere indtastning – sig hvad der skete, få det struktureret automatisk

Arkitektur: WebRTC i Stedet for Telefoni

Bygro bruger OpenAI Realtime API med WebRTC—ikke Twilio eller telefon. Flowet er anderledes:

Mobil eller Webbrowser
    ↓
Supabase Edge Function / Next.js server action
    ↓  ephemeral client_secret (OPENAI_API_KEY aldrig på klienten)
OpenAI Realtime API (WebRTC)
    ↓  peer connection + data channel
RealtimeAgent med construction-specifikke tools

Sikkerhed: API-nøglen forbliver på serveren. Klienten får kun et midlertidigt client_secret til sessionen.

To Overflader: Mobil og Web

Overflade Brugssituation Eksempel
Mobil På byggepladsen, hænderne fulde "Opret en noter om revnen i væggen"
Web På kontoret Ctrl+M for at åbne assistenten i en modal

På mobil kører agenten med halv-duplex (mikrofon åben kun når brugeren taler), baggrundslyd og proximity lock til lomme-brug. På web bruges OpenAIRealtimeWebRTC direkte i browseren.

Construction-specifikke Tools

Voice agenten har tools der matcher byggearbejdet:

  • Case Agent: noter, sag-detaljer, oprette og hente sager
  • Camera Agent: beskrivelser og metadata på billeder, tags, kø-håndtering

Brugeren siger fx "Tilføj en beskrivelse til det sidste billede" eller "Hvad er status på sagen i kælderen?"—agenten kalder tools og svarer med strukturerede data.

WebRTC vs. WebSocket

Dimension Telefoni (HelpDeskAI) Bygro
Transport Twilio Media Streams → WebSocket WebRTC (browser + React Native)
Kanal PSTN (opkald) Mobil app + web
Brugssituation HR-support, indkommende henvendelser Feltdokumentation, hands-free

Begge bruger OpenAI Realtime API—kun transportlaget er forskelligt. WebRTC giver lav latenstid og direkte peer-to-peer lyd, ideelt til app-brug.

Konklusion

Voice agents kan bruges langt ud over telefoni. I Bygro understøtter stemmestyring byggearbejdere i støjen på byggepladsen—på mobil og web, i flere sprog, med tools der matcher dokumentation og sagshåndtering.

Samme Realtime API, forskellige kanaler: telefon, app, browser.


Vil du udforske voice agents eller AI til feltarbejde? Kontakt os og lad os snakke om mulighederne.