假设大模型会返回这么一段文字——2000万。^[3][9]^2025年2月28日^[1][2]^,是第一届...
逐部分输出。比如依次输出2000,万,。^,[,3][,...
如何在不枚举所有正则表达式,且不需要等到全文的情况下能够实现提取其中的文献引用?(即文中的^[3][9]^和^[1][2]^)
想到一个流程,但未想到怎么实现部分匹配。有其他更好做法不吝赐教
| 返回内容 | 动作 |
|---|---|
| 2000 | 跳过 |
| 万 | 跳过 |
| 。^ | 部分匹配,缓存 |
| 。^[ | 部分匹配,缓存 |
| 。^[3][ | 部分匹配,缓存 |
| ... | ... |
| 。^[3][9]^2005 | 完全匹配,提取再进一步处理 |
| 年 | 跳过 |
| 2 | 跳过 |
| 月 | 跳过 |
| ... | ... |