Voice Agents på Byggepladsen: Sådan Bruger Bygro Stemmestyring til Feltarbejde

Kasper Kristian RasmussenVoice Agents på Byggepladsen: Sådan Bruger Bygro Stemmestyring til Feltarbejde
Voice agents er ikke begrænset til telefoni. I Bygro bruger vi stemmestyring direkte i mobilappen og webapplikationen til byggearbejdere der dokumenterer på feltet.
Hvorfor Voice på Byggepladsen?
Byggearbejdere har hænderne fulde. De kan ikke holde pause for at taste noter, søge efter sager eller udfylde formularer. Stemmestyring giver:
- Universal adgang – tal på dit modersmål (dansk, polsk, litauisk, engelsk m.fl.)
- Ingen tastatur – dokumenter mens du arbejder
- Hurtigere indtastning – sig hvad der skete, få det struktureret automatisk
Arkitektur: WebRTC i Stedet for Telefoni
Bygro bruger OpenAI Realtime API med WebRTC—ikke Twilio eller telefon. Flowet er anderledes:
Mobil eller Webbrowser
↓
Supabase Edge Function / Next.js server action
↓ ephemeral client_secret (OPENAI_API_KEY aldrig på klienten)
OpenAI Realtime API (WebRTC)
↓ peer connection + data channel
RealtimeAgent med construction-specifikke tools
Sikkerhed: API-nøglen forbliver på serveren. Klienten får kun et midlertidigt client_secret til sessionen.
To Overflader: Mobil og Web
| Overflade | Brugssituation | Eksempel |
|---|---|---|
| Mobil | På byggepladsen, hænderne fulde | "Opret en noter om revnen i væggen" |
| Web | På kontoret | Ctrl+M for at åbne assistenten i en modal |
På mobil kører agenten med halv-duplex (mikrofon åben kun når brugeren taler), baggrundslyd og proximity lock til lomme-brug. På web bruges OpenAIRealtimeWebRTC direkte i browseren.
Construction-specifikke Tools
Voice agenten har tools der matcher byggearbejdet:
- Case Agent: noter, sag-detaljer, oprette og hente sager
- Camera Agent: beskrivelser og metadata på billeder, tags, kø-håndtering
Brugeren siger fx "Tilføj en beskrivelse til det sidste billede" eller "Hvad er status på sagen i kælderen?"—agenten kalder tools og svarer med strukturerede data.
WebRTC vs. WebSocket
| Dimension | Telefoni (HelpDeskAI) | Bygro |
|---|---|---|
| Transport | Twilio Media Streams → WebSocket | WebRTC (browser + React Native) |
| Kanal | PSTN (opkald) | Mobil app + web |
| Brugssituation | HR-support, indkommende henvendelser | Feltdokumentation, hands-free |
Begge bruger OpenAI Realtime API—kun transportlaget er forskelligt. WebRTC giver lav latenstid og direkte peer-to-peer lyd, ideelt til app-brug.
Konklusion
Voice agents kan bruges langt ud over telefoni. I Bygro understøtter stemmestyring byggearbejdere i støjen på byggepladsen—på mobil og web, i flere sprog, med tools der matcher dokumentation og sagshåndtering.
Samme Realtime API, forskellige kanaler: telefon, app, browser.
Vil du udforske voice agents eller AI til feltarbejde? Kontakt os og lad os snakke om mulighederne.