生成和评估科学假设的新 GenAI 框架

2024年10月8日讀畢需時 3 分鐘

想象一下，如果我们能自动发现突破性的科学假说，比以往任何时候都更快地开启新的可能性。三个研究团队朝着这个方向迈出了重要的一步，推出了一个机器学习框架，旨在以显著的效率生成和评估科学假说。

新框架围绕三个基本阶段展开：提取、生成和评估假设。首先，系统从科学文献中提取现有假设，并以命题逻辑的形式表示出来。接下来，它使用一个精炼的机器学习模型，根据这些提取的知识生成新的假设。最后，一套基于图论的指标对生成的假设的新颖性和相关性进行评估。

这项工作是旨在自动生成科学假设的新机器学习框架浪潮的一部分。最近的研究揭示了其他几个框架在这一领域的潜力，它们利用 GPT-4 和 Claude-2 等大型语言模型（LLM）的力量，加速了包括心理学在内的各个领域的科学发现。其中一个著名的框架是芝加哥大学开发的 HypoGeniC，它主要基于标记数据生成假设。 HypoGeniC 分三个阶段运行：

1. 生成初始假设：该框架分析少量示例以生成初步假设。

2. 迭代假设更新：从多臂匪徒中汲取灵感，HypoGeniC 利用奖励函数迭代完善假设，平衡潜在假设的探索和利用。

3. 基于假设的推理：该框架利用生成的假设对新数据进行预测，并使用一套推理策略来充分利用来自多个假设的综合知识。

HypoGeniC 在合成数据集和现实世界数据集上的测试，如欺骗性评论检测、标题流行度预测和推文流行度预测，都取得了可喜的成果。在许多情况下，HypoGeniC 的表现都优于少数几个学习基线，甚至达到或超过了传统监督学习方法的性能，这表明基于假设的推理是有效的。

Full paper

清华大学的另一项研究介绍了基于 LLM 的因果图（LLMCG）框架，该框架利用因果知识图和 LLM 之间的协同作用来自动生成心理假设：

1. 文献检索： LLMCG 对大量心理学文章进行分析，提取因果关系，从而创建一个专门的心理学因果图。

2. 因果对提取：该框架使用 LLMs，从科学文章的文本中识别并提取因果关系，重点关注研究结果中明确阐述的关系。

3. 利用链接预测生成假设： LLMCG 采用链接预测算法来识别所构建因果图中的潜在因果关系。然后利用这些潜在关系生成新的假设。

对 LLMCG 的评估包括将其生成的幸福假设与博士生和法学硕士单独生成的假设进行比较。结果表明，LLMCG 生成的假说在新颖性上与人类专家（博士生）生成的假说不相上下，而且比仅由法律硕士生成的假说新颖得多。该框架与因果图的整合使其能够生成以现有心理学知识为基础的假设，同时还能探索概念之间潜在的新联系。这些框架虽然在具体方法上有所不同，但都有一个共同的目标，那就是将通常耗时耗力的科学假设生成过程自动化。通过将 LLM 与因果知识图谱、结构化表述和复杂的评估指标相结合，它们大大提高了促进科学进步的能力。

Full paper

华盛顿大学的框架与这些其他努力一起，凸显了机器学习在彻底改变假设生成方面的巨大潜力。在对各种数据集进行的初步测试中，华盛顿大学框架成功地生成了一些假设，这些假设不仅有新的突破，而且与当前的研究保持着相关性。这种能力彰显了机器学习改变假设生成和加速创新的力量。

这项工作意义深远。通过自动生成假设，研究人员可以大大增加可测试问题的数量，最终加速创新和发现。这种进步不仅能提高效率，还有望揭示原本可能被忽视的新路径和新视角。

华盛顿大学团队正在积极完善这一框架，并努力将其应用扩展到医学和工程学等其他领域。他们的目标是让世界各地的科学家都能使用这一工具，使他们能够以更快的速度和更高的创造力探索各自领域的前沿。下面是他们的研究报告。

这项工作标志着未来科学研究令人兴奋的一瞥--智能算法可以激发灵感，引导探索之旅。

生成式AI助力科研计划

生成和评估科学假设的新 GenAI 框架

最新文章

Comments