【算法】字符串匹配问题求助

37 阅读1分钟

假设大模型会返回这么一段文字——2000万。^[3][9]^2025年2月28日^[1][2]^,是第一届...

逐部分输出。比如依次输出2000。^[3][,...

如何在不枚举所有正则表达式,且不需要等到全文的情况下能够实现提取其中的文献引用?(即文中的^[3][9]^和^[1][2]^)

想到一个流程,但未想到怎么实现部分匹配。有其他更好做法不吝赐教

返回内容动作
2000跳过
跳过
。^部分匹配,缓存
。^[部分匹配,缓存
。^[3][部分匹配,缓存
......
。^[3][9]^2005完全匹配,提取再进一步处理
跳过
2跳过
跳过
......