NL2SQL

533 阅读1分钟

论文

A Survey of NL2SQL with Large Language Models: Where are we, and where are we going?

将用户的自然语言查询(NL)转化为SQL查询(即NL2SQL)可以显著降低访问关系数据库的障碍,并支持各种商业应用。随着大型语言模型(LLMs)的出现,NL2SQL的性能得到了极大的提升。在本调查中,我们全面回顾了由LLMs驱动的NL2SQL技术,涵盖了其整个生命周期的四个方面:(1)模型:NL2SQL翻译技术不仅解决了NL的歧义和不充分说明,还正确地将NL与数据库模式和实例进行映射;(2)数据:从训练数据的收集、由于训练数据稀缺而进行的数据合成,到NL2SQL基准测试;(3)评估:使用不同的度量和粒度从多个角度评估NL2SQL方法;(4)错误分析:分析NL2SQL错误以找到根本原因并指导NL2SQL模型发展。此外,我们提供了开发NL2SQL解决方案的经验法则。最后,我们讨论了LLMs时代NL2SQL的研究挑战和开放问题。