Automatisering av intervjuprosesser har potensial til å endre måten vi samler inn kvalitative data på, særlig når det er snakk om storskalastudier. I denne veiledningen vil jeg se nærmere på hvordan nye verktøy kan bidra til å automatisere intervjuprosessen, slik at forskere effektivt kan samle inn tilbakemeldinger fra brukerne og utlede ny innsikt. Denne diskusjonen vil ta for seg to ulike verktøy som fortsatt er i en tidlig utviklingsfase, og som krever nøye implementering.
Det første verktøyet integrerer stemmeinteraksjon, noe som gir mulighet til å forbedre intervjuprosessen ved å muliggjøre verbal kommunikasjon med deltakerne i sanntid. Dette systemet, som omtales som Automated Interview AI-prosjektet på GitHub, benytter Twilio Voice og OpenAIs Realtime API for å muliggjøre AI-støttede samtaler over telefon. Forskere kan starte en telefonsamtale med deltakerne, der den kunstige intelligensen kan gjennomføre et intervju ved hjelp av både forhåndsdefinerte og dynamiske spørsmål. Verktøyet muliggjør en naturlig samtaleflyt ved å etablere en toveis forbindelse som gjør at den kunstige intelligensen både kan lytte og svare på deltakernes innspill i sanntid.
Det tekniske oppsettet for Interview AI-systemet innebærer flere viktige trinn, blant annet konfigurering av en Twilio-konto, kjøp av et telefonnummer med talefunksjoner og oppsett av en tunnelløsning som ngrok for å eksponere den lokale serveren for utvikling og testing. AI-samtalen flyter gjennom en Python-basert server, som dirigerer deltakernes lyd til OpenAIs Realtime API, noe som muliggjør interaksjon i sanntid. Utviklere må konfigurere applikasjonen på riktig måte, oppdatere miljøinnstillinger og dirigere telefonsamtaler gjennom ngrok for å sikre at serveren kan nås av Twilio. Selv om denne tilnærmingen muliggjør direkte kommunikasjon med deltakerne, er det viktig å være klar over at dette oppsettet fortsatt er svært eksperimentelt og krever teknisk ekspertise for å kunne implementeres.
Trinn-for-trinn-prosess for å sette opp Speech Assistant-prosjektet:
Sett opp Twilio-konto: Opprett en Twilio-konto og kjøp et telefonnummer med talefunksjoner (dette er ikke en annonse for Twilio :-D). Dette er nødvendig for å muliggjøre taleinteraksjon med deltakerne.
Installer ngrok: Last ned og installer ngrok eller en annen tunnelløsning for å eksponere den lokale serveren mot Internett. Dette gir Twilio tilgang til den lokale utviklingsserveren din .
Sett opp Python-miljø: Installer Python 3.9+ og opprett et virtuelt miljø for prosjektet for å unngå konflikter med andre pakker.
Installer nødvendige pakker: Bruk kommandoen pip install -r requirements.txt for å installere de nødvendige avhengighetene for prosjektet .
Konfigurer Twilio-nummer: I Twilio-konsollen går du til Telefonnumre > Administrer > Aktive numre og peker det kjøpte nummeret ditt til ngrok-URL-en etterfulgt av /incoming-call.
Oppdater miljøinnstillinger: Opprett eller oppdater .env -filen med OpenAI API-nøkkelen og andre nødvendige legitimasjonsopplysninger. Dette trinnet sikrer at AI-en er riktig autentisert.
Kjør ngrok: Åpne en terminal og kjør ngrok http 5050 for å opprette en offentlig URL for den lokale serveren din. Denne URL-adressen er nødvendig for å konfigurere Twilio til å koble til serveren din.
Konfigurer systemet: Tilpass ledeteksten i main.py for å tilpasse intervjuspørsmålet .
SYSTEM_MESSAGE = (
"You are a helpful and bubbly AI researcher "
"You want to understand how people's opinion about using generative AI in research "
"You will ask questions based on their answers "
"You want to ask very in depth questions to capture people's opinion"
)
Kjør Python-serveren: Start utviklingsserveren ved å kjøre python main.py. Denne serveren håndterer innkommende anrop og samhandler med den kunstige intelligensen i sanntid.
Test systemet: Ring Twilio-telefonnummeret for å teste oppsettet. Den kunstige intelligensen skal kunne svare på anropet og gjennomføre et intervju basert på de forhåndsdefinerte spørsmålene dine.
Konverter råopptaket til wmv-filer: Kjør convert.py-filen i terminalen for å konvertere råopptaket til wmv-filer.
Twilio tilbyr en funksjon for å ta opp samtaler, men jeg anbefaler ikke å bruke den ettersom opptakene lagres i skyen, noe som kan utgjøre en risiko for sensitive intervjuer og kanskje ikke er i samsvar med GDPR-kravene. I stedet har jeg lagt til en kode i det opprinnelige Python-skriptet (main.py) for å ta opp samtaler lokalt på PC-en din. Den innspilte filen er råopptak. Du kan bruke convert.py til å konvertere filene. Vi har lagt ut en versjon på serveren vår nå. Prøv den ved å ringe +1 619 356 2184.
Det andre verktøyet er et automatisert intervjusystem utviklet av oss. MimiTalk er en AI-drevet plattform som er utviklet for å forbedre intervjuprosessen ved å automatisere innsamlingen av kvalitative data. MimiTalk er utviklet av GAI for Research, og tilbyr en tilpassbar AI-intervjuer som legger til rette for sømløse intervjuer skreddersydd til spesifikke forskningskrav. Brukerne kan lage personlige intervjuguider som sikrer at AI-intervjueren er tilpasset deres unike behov. Plattformen gjør det mulig for forskere å laste ned både intervjuopptak og transkripsjoner av samtaler, noe som gir et omfattende materiale for evaluering av prestasjoner.
Arbeidsflyten i MimiTalk består av tre hovedtrinn:
Opprettelse av prosjekt: Forskerne setter opp intervjuprosjektene sine og tilpasser AI-intervjueren slik at den oppfyller deres spesifikke mål.
Distribusjon av intervjulink: En unik intervjulink genereres og deles med forskningsdeltakerne, slik at de kan fullføre intervjuet når det passer dem.
Resultatanalyse: Forskere kan laste ned intervjutranskripsjonene og deltakerdataene for grundig analyse.
Denne strukturerte tilnærmingen effektiviserer intervjuprosessen, gjør den mer effektiv og kan tilpasses ulike forskningskontekster. Dette systemet er nå i en alfa-testperiode. Vi tester det bare i liten skala.
Comments