定性研究流程自动化有可能改变我们收集和分析数据的方式,尤其是在处理大规模研究时。 在本教程中,我将探讨新兴工具如何支持访谈流程自动化,从而使研究人员能够高效地收集用户反馈并获得深刻见解。 本次讨论将介绍两种不同的工具,它们仍处于早期开发阶段,需要仔细实施。 其中一个是基于文本的应用程序,另一个则通过实时 API 集成了语音交互功能。 请注意,这些应用程序尚未完全成熟,目前只能在有限范围内使用。
URAi 是一款人工智能工具,旨在协助研究人员规划、执行和分析定性研究。 它有助于通过深入的文本访谈收集用户反馈,还能通过收集对网站布局、原型或产品图片的反馈来支持设计测试。 URAi 可提供实时分析,总结用户反馈,生成带有支持证据的报告。 它包括一个知识库,用于存储过去的见解,可通过文本聊天访问。 不过,URAi 仍处于早期阶段,仅限于基于文本的交互。
第二个工具集成了语音交互,通过与参与者进行实时语言交流,为增强访谈过程提供了机会。 该系统在 GitHub 上被称为自动访谈人工智能项目,它利用 Twilio Voice 和 OpenAI 的实时 API 来实现人工智能辅助的电话对话。 它允许研究人员发起与参与者的电话通话,在通话过程中,人工智能可以使用预定义问题和动态问题进行访谈。 该工具通过建立双向连接实现了自然的对话流程,使人工智能能够实时聆听和回应参与者的输入。
访谈人工智能系统的技术设置涉及几个关键步骤,包括配置 Twilio 帐户、购买具有语音功能的电话号码,以及设置类似 ngrok 的隧道解决方案,以便为开发和测试暴露本地服务器。 人工智能对话流经一个基于 Python 的服务器,该服务器将参与者的音频路由到 OpenAI 的实时 API,从而实现实时交互。 开发人员必须正确配置应用程序,更新环境设置,并通过 ngrok 路由电话呼叫,以确保 Twilio 可以连接到服务器。 虽然这种方法允许与参与者直接通信,但必须承认,这种设置仍然是高度试验性的,需要专业技术知识才能实施。
设置语音助理项目的步骤:
设置 Twilio 帐户: 创建 Twilio 帐户并购买具有语音功能的电话号码(这不是 Twilio 的广告 :-D)。 这是与参与者进行语音交互的必要条件。
安装 ngrok: 下载并安装 ngrok 或任何其他隧道解决方案,以便将本地服务器暴露于互联网。 这将允许 Twilio 访问您的本地开发服务器。
设置 Python 环境:安装 Python 3.9+ 并为项目创建虚拟环境,以避免与其他软件包冲突。
安装所需软件包: 使用命令 pip install -r requirements.txt 为项目安装必要的依赖包。
配置 Twilio 号码:在 Twilio 控制台中,转到电话号码 >管理 >活动号码,并将您购买的号码指向 ngrok URL,然后是 /incoming-call. .
更新环境设置: 使用 OpenAI API 密钥和其他必要凭证创建或更新 .env 文件。 此步骤可确保人工智能得到正确验证。
运行 ngrok: 打开终端并运行 ngrok http 5050 ,为本地服务器创建公共 URL。 配置 Twilio 以连接服务器时需要使用该 URL。
配置系统: 调整 main.py 中的提示,自定义面试问题。
SYSTEM_MESSAGE = (
"You are a helpful and bubbly AI researcher "
"You want to understand how people's opinion about using generative AI in research "
"You will ask questions based on their answers "
"You want to ask very in depth questions to capture people's opinion"
)
运行 Python 服务器:通过运行 python main.py 启动开发服务器。 该服务器将处理传入的调用,并与人工智能进行实时交互。
测试系统: 拨打 Twilio 电话号码测试设置。 人工智能应该能够接听电话,并根据您预定义的提示进行访谈。 将原始录音转换为 wmv 文件:运行 convert.py 文件。
将原始录音转换为 wmv 文件:在终端中运行 convert.py 文件,将原始录音转换为 wmv 文件。
Twilio 提供了一个通话录音功能,但我不建议使用它,因为录音会存储在云中,这可能会给敏感访谈带来风险,而且可能不符合 GDPR 要求。 相反,我在原始 Python 脚本(main.py)中添加了一段代码,以便在 PC 上本地录制通话。 录制的文件是原始录音。 您可以使用 convert.py 转换文件。
这两个工具说明了定性研究中访谈过程自动化的重大进步。 我尝试过这两种方法,它们都不完美,但各有独特优势。 特别是 GitHub 语音助手项目,令人印象深刻--很难说它是一个人工智能系统。 尽管这两种工具都还在开发阶段,而且都有实际的局限性,但它们都极大地减轻了研究人员的工作量,同时提高了收集数据的深度和规模。 通过将这些技术结合起来,研究人员可以在更短的时间内实现自动化并提高他们的能力,从而获得更丰富、更可行的见解。
Comments