Prolog DCG语法规则中的堆栈溢出：如何有效或延迟地处理大型列表

通常，您可以在的名称下找到更多关于SO的信息library(pio)。同样，干净地使用它的方法是：:- use_module(library(pio)).您的示例太复杂了，因此我将只考虑一个稍微简单一点的情况，即用换行符分隔的数字列表：nats（[]）-> []。nats（[N | Ns]）-> nat（N），换行符，nats（Ns）。那么，如何才能有效地进行测试？（这是您的问题3）的基本要点library(pio)是，您可以使用常规DCG进行文件处理。但是对于小型测试，您仍然可以使用简单phrase/2。所以我做：？-短语（nats（Ns），“ 1 \ n”）。Ns = [1]；假。您看到;提示了吗？这意味着：Prolog无法决定是否可以计算出进一步的答案-因此它留下了一个或多个选择点。而且那仅是个位数，您可以想象事情将如何堆积。让我们深入探讨：？-短语（数字（D），“ 1”）。D = 1;假。再次邪恶;！为了使这项工作奏效，必须确定一切。有以下三种方法：使用削减（并失去你的灵魂）祝您好运-最好的情况似乎是在重复元素之后：trace_file_phrase（[]）-> []。trace_file_phrase（[T | Ts]）->   trace_phrase（T），   ！，％ugly，but ...   trace_file_phrase（Ts）。（这应该回答问题1）但是，等一下！这有什么不好的!呢？只要，因为有恰好一个答案trace_phrase//1的东西是完美的。只有在有更多答案（或实际上是解决方案）的情况下，削减才可能删除宝贵的答案。您如何知道是否还有更多解决方案？好吧，你没有。而且您将不会看到它们，因为它们已经被切除了。call_semidet/1这是确保不会发生这种情况的一种方法。这仅适用于无副作用的目标，该目标可以被调用两次而没有任何效果：call_semidet（目标）：-   （call_nth（目标，2）   ->抛出（错误（mode_error（semidet，Goal），_））   ; 一次（目标）   ）。这使用call_nth/2，在另一篇文章中定义。（作为一种优化，该实现可以避免Goal在没有打开选择点的情况下避免调用两次...）为了明确起见，它是如何工作的：？-短语（nat（N），“ 1234”）。N = 1234；假。？-call_semidet（phrase（nat（N），“ 1234”））。N = 1234。？-call_semidet（（X = 1; X = 2））。错误：未知错误术语：mode_error（semidet，（2 = 1; 2 = 2））因此，它可以有效确定您的小语法！因此，无需重新构造任何内容！现在缺少的是将其整合到语法中。您可以非常低级地执行此操作，或者可以使用干净地进行此操作library(lambda)。statement_semidet（NT）->   call（S0 ^ S ^ call_semidet（phrase（NT，S0，S）））。请注意，在这种非常特殊的情况下，我们不使用\来重命名。trace_file_phrase（[]）-> []。trace_file_phrase（[T | Ts]）->   statement_semidet（trace_phrase（T）），   trace_file_phrase（Ts）。利用索引最后，一种非常费力但干净的方法是重写所有内容，以便从索引中更好地获利（并且可能有助于总体上改善索引...）但这是一条漫长的路。刚开始：位数（D）-> [C]，   {c_digit（C，D）}。c_digit（0'0,0）。c_digit（0'1,1）。c_digit（0'2,2）。c_digit（0'3,3）。c_digit（0'4,4）。c_digit（0'5,5）。c_digit（0'6,6）。c_digit（0'7,7）。c_digit（0'8,8）。c_digit（0'9,9）。现在，您可以：？-短语（数字（D），“ 1”）。D = 1。但是您还有另一个不确定性来源，这是由于您定义语法的方式所致。在nat//2您看到的内容中：nat（N，N）-> []。nat（A，N）-> digit（D），...第一条规则始终适用，也就是说，只有在了解到最后一条就足够了之后再坚持下去，才会对它"1234\n"进行解析。"1" "12" "123" "1234"newline//0您可以为此重写内容，但是代码不再是您喜欢的纯粹的小规范，不是吗？好吧，也许将来情况会有所改善。例如，SWI中的索引编制比以前要好得多，也许这里的事情也在发展。的目的library(pio)是开始此过程。将此与Haskell进行比较-我们距离interact效率还差得远！但是没有固有的成本：...-> [] | [_]，...。？ -  phrase_from_file（（...， “搜索字符串”，...），fichier）。与grep一样高效-在空间方面。也就是说，它在恒定的空间中运行。因此，希望将来会有更多的代码运行得更好。编辑：顺便说一句，library(pio)确实已经在影响效率方面有所改进：GC阶段得到了显着改善，与25年前Wadler的“修复一些空间泄漏”的方法非常相似。事情发展...

Prolog DCG语法规则中的堆栈溢出：如何有效或延迟地处理大型列表

3回答