top of page
Forfatterens bildeLille My

Automatisering av intervjuer for kvalitativ forskning i stor skala: En veiledning

Automatisering av kvalitative forskningsprosesser har potensial til å endre måten vi samler inn og analyserer data på, særlig når det er snakk om studier i stor skala. I denne veiledningen vil jeg se nærmere på hvordan nye verktøy kan bidra til å automatisere intervjuprosessen, slik at forskere effektivt kan samle inn tilbakemeldinger fra brukerne og utlede ny innsikt. Denne diskusjonen vil omhandle to forskjellige verktøy som fortsatt er i en tidlig utviklingsfase og krever nøye implementering. Det ene er en tekstbasert applikasjon, mens det andre integrerer taleinteraksjon gjennom et sanntids-API. Vær oppmerksom på at disse applikasjonene ennå ikke er helt modne, og at de foreløpig er tilgjengelige for begrenset bruk.



URAi er et AI-verktøy som er utviklet for å hjelpe forskere med å planlegge, gjennomføre og analysere kvalitative studier. Verktøyet hjelper til med å samle inn tilbakemeldinger fra brukerne gjennom dybdeintervjuer, og støtter også designtesting ved å samle inn tilbakemeldinger på nettstedslayout, prototyper eller produktbilder. URAi tilbyr sanntidsanalyse for å oppsummere tilbakemeldinger fra brukerne, og genererer rapporter med dokumentasjon. Den inkluderer et kunnskapsbibliotek for lagring av tidligere innsikt, som er tilgjengelig via tekstchat. URAi er imidlertid fortsatt i en tidlig fase og er begrenset til tekstbaserte interaksjoner.


Det andre verktøyet integrerer stemmeinteraksjon, noe som gir mulighet til å forbedre intervjuprosessen ved å muliggjøre verbal kommunikasjon med deltakerne i sanntid. Dette systemet, som omtales som Automated Interview AI-prosjektet på GitHub, benytter Twilio Voice og OpenAIs Realtime API for å muliggjøre AI-støttede samtaler over telefon. Forskere kan starte en telefonsamtale med deltakerne, der den kunstige intelligensen kan gjennomføre et intervju ved hjelp av både forhåndsdefinerte og dynamiske spørsmål. Verktøyet muliggjør en naturlig samtaleflyt ved å etablere en toveis forbindelse som gjør at den kunstige intelligensen både kan lytte og svare på deltakernes innspill i sanntid.

Det tekniske oppsettet for Interview AI-systemet innebærer flere viktige trinn, blant annet konfigurering av en Twilio-konto, kjøp av et telefonnummer med talefunksjoner og oppsett av en tunnelløsning som ngrok for å eksponere den lokale serveren for utvikling og testing. AI-samtalen flyter gjennom en Python-basert server, som dirigerer deltakernes lyd til OpenAIs Realtime API, noe som muliggjør interaksjon i sanntid. Utviklere må konfigurere applikasjonen på riktig måte, oppdatere miljøinnstillinger og rute telefonsamtaler gjennom ngrok for å sikre at serveren kan nås av Twilio. Selv om denne tilnærmingen gjør det mulig å kommunisere direkte med deltakerne, er det viktig å være klar over at dette oppsettet fortsatt er svært eksperimentelt og krever teknisk ekspertise for implementering.


Trinn-for-trinn-prosess for å sette opp Speech Assistant-prosjektet:

  1. Sett opp Twilio-konto: Opprett en Twilio-konto og kjøp et telefonnummer med talefunksjoner (dette er ikke en reklame for Twilio :-D). Dette er nødvendig for å muliggjøre taleinteraksjon med deltakerne.

  2. Installer ngrok: Last ned og installer ngrok eller en annen tunnelløsning for å eksponere den lokale serveren mot Internett. Dette gir Twilio tilgang til den lokale utviklingsserveren din .

  3. Sett opp Python-miljø: Installer Python 3.9+ og opprett et virtuelt miljø for prosjektet for å unngå konflikter med andre pakker.

  4. Installer nødvendige pakker: Bruk kommandoen pip install -r requirements.txt for å installere de nødvendige avhengighetene for prosjektet .

  5. Konfigurer Twilio-nummer: I Twilio-konsollen går du til Telefonnumre > Administrer > Aktive numre og peker det kjøpte nummeret ditt til ngrok-URL-en etterfulgt av /incoming-call.

  6. Oppdater miljøinnstillinger: Opprett eller oppdater .env -filen med OpenAI API-nøkkelen og andre nødvendige legitimasjonsopplysninger. Dette trinnet sikrer at AI-en er riktig autentisert.

  7. Kjør ngrok: Åpne en terminal og kjør ngrok http 5050 for å opprette en offentlig URL for den lokale serveren din. Denne URL-adressen er nødvendig for å konfigurere Twilio til å koble til serveren din.

  8. Konfigurer systemet: Tilpass ledeteksten i main.py for å tilpasse intervjuspørsmålet .

SYSTEM_MESSAGE = (
    "You are a helpful and bubbly AI researcher "
    "You want to understand how people's opinion about using generative AI in research "
    "You will ask questions based on their answers "
    "You want to ask very in depth questions to capture people's opinion"
)
  1. Kjør Python-serveren: Start utviklingsserveren ved å kjøre python main.py. Denne serveren håndterer innkommende anrop og samhandler med AI-en i sanntid .

  2. Test systemet: Ring Twilio-telefonnummeret for å teste oppsettet. AI-en skal kunne svare på anropet og gjennomføre et intervju basert på dine forhåndsdefinerte spørsmål .

  3. Konverter råopptaket til wmv-filer: Kjør convert.py-filen i terminalen din for å konvertere råopptaket til wmv-filer.


Twilio tilbyr en funksjon for å ta opp samtaler, men jeg anbefaler ikke å bruke den ettersom opptakene lagres i skyen, noe som kan utgjøre en risiko for sensitive intervjuer og kanskje ikke er i samsvar med GDPR-kravene. I stedet har jeg lagt til en kode i det opprinnelige Python-skriptet (main.py) for å ta opp samtaler lokalt på PC-en din. Den innspilte filen er råopptak. Du kan bruke convert.py til å konvertere filene.


Disse to verktøyene illustrerer betydelige fremskritt når det gjelder å automatisere intervjuprosessen i kvalitativ forskning. Jeg har prøvd begge tilnærmingene, og ingen av dem er perfekte, men de har hver sine unike fordeler. Spesielt GitHub Speech Assistant-prosjektet er imponerende - det er vanskelig å se at det er et AI-system. Selv om begge verktøyene fortsatt er under utvikling og har praktiske begrensninger, bidrar de begge til å redusere forskernes arbeidsmengde betydelig, samtidig som de øker dybden og omfanget av data som samles inn. Ved å kombinere disse teknologiene kan forskerne automatisere og forbedre sine muligheter til å få rikere og mer handlingsrettet innsikt på kortere tid.



Bình luận

Không thể tải bình luận
Có vẻ như đã có sự cố kỹ thuật. Hãy thử kết nối lại hoặc làm mới trang.
bottom of page