摘要
在快速发展的生成式人工智能时代,大型语言模型(LLM)(如 ChatGPT)站在了颠覆市场营销实践和研究的最前沿。本文全面探讨了 LLM 在情感分析方面的能力,情感分析是营销研究中了解消费者情感、观点和看法的核心任务。我们将三种最先进的 LLM(即 GPT-3.5、GPT-4 和 Llama 2)的性能与成熟的高性能迁移学习模型进行了比较。我们的研究表明,尽管 LLMs 具有 "0-shot "的特性,但在情感分类准确性方面,它们不仅能与传统的迁移学习方法竞争,在某些情况下还能超越它们。我们研究了文本数据特征和分析程序对分类准确性的影响,揭示了数据来源、文本复杂性和提示技术对 LLM 性能的影响。我们发现,语言特征(如存在冗长、内容丰富的单词)会提高分类性能,而其他特征(如单句评论和结构性较差的社交媒体文本文档)则会降低分类性能。此外,我们还探讨了由 LLM 生成的情感分类的可解释性。研究结果表明,LLMs(尤其是 Llama 2)提供了出色的分类解释,突出了其先进的类人推理能力。总之,本文丰富了当前对情感分析的理解,为市场营销研究人员和从业人员在生成式人工智能时代选择合适的方法提供了宝贵的见解和指导。
本文对生成式人工智能背景下的情感分析进行了全面研究,特别关注 GPT-3.5、GPT-4 和 Llama 2 等大型语言模型 (LLM) 的能力,并对照 SiEBERT 和 RoBERTa 等传统迁移学习模型,评估了这些模型在情感分类任务中的表现。
研究探讨了 LLM 在各种文本数据类型的零点情感分析中的能力,揭示了 LLM 可以有效地与传统方法竞争,有时甚至超越传统方法。研究深入探讨了不同的数据特征(如文本复杂性、来源和长度)如何影响分类准确性。此外,论文还研究了 LLM 生成的情感分类的可解释性,表明 Llama 2 等较新的模型提供了更易懂、更详细的解释,与 GPT-3.5 等较老的模型相比,其实用性得到了增强。
作者总结说,LLM 是一种强大、灵活的情感分析工具,无需针对任务进行大量的模型训练,就能提供很高的准确度。这一特点使 LLM 对市场营销从业人员和研究人员都具有吸引力,大大简化了各种应用中的情感分析过程。
Comments