用于模棱两可的 lambda 语法的 yacc shift-reduce

你的分析确实是正确的；尽管语法没有歧义，但解析器不可能在输入缩减为( <expr>和前瞻的情况下)决定是否应在移动 the 之前将其expr缩减为，或者是否应将其作为 a 的一部分进行移动。如果下一个标记可见，则可以做出决定，因此语法 LR(2) 超出了 go/yacc 的权限。params))lambda如果您使用的是 bison，您可以通过请求 GLR 解析器轻松解决此问题，但我不相信 go/yacc 提供该功能。该语言有一个 LR(1) 语法（对于的任何值，总是有一个 LR(1) 语法对应于任何 LR(k) 语法k），但是手写相当烦人。LR(k) 到 LR(1) 转换的基本思想是通过将 k-1 个上下文标记累积到每个产生式中来将减少决策 k-1 个标记向前移动。因此，在k2 的情况下，每个产生式 P:N → α将被替换为 each in和 each in 的产生式。[见注 1] 这会导致任何非平凡语法中的非终结符出现相当大的爆炸。TNU → Tα UTFIRST(α)UFOLLOW(N)与其追求这个想法，让我提出两个更简单的解决方案，您似乎都非常接近这两个解决方案。首先，在您提出的语法中，问题实际上只是当两个标记为){. 这可以很容易地在词法分析器中检测到，并导致一个仍然是 hacky 但更简单的 hack 的解决方案：){作为单个令牌返回。您需要处理中间的空格等，但它不需要在词法分析器中保留任何上下文。这有额外的好处，您不需要将其定义params为exprs 列表；它们可以只是一个列表IDENT（如果相关的话；评论表明它不是）。我认为更简洁的替代方法是扩展您似乎已经提出的解决方案：接受太多并拒绝语义操作中的错误。在这种情况下，您可能会执行以下操作：start:  stmt_listexpr:    INT  | IDENT  | lambda  | '(' expr_list ')'        { // If $2 has more than one expr, report error          $$ = $2        }lambda:  '(' expr_list ')' '{' stmt_list '}'        { // If anything in expr_list is not a valid param, report error          $$ = make_lambda($2, $4)        }expr_list:  expr | expr_list ',' exprstmt:  /* empty */ | exprstmt_list:  stmt | stmt_list ';' stmt笔记这只是一个大纲；完整的算法包括恢复原始解析树的机制。如果k大于 2 则TandU是字符串 the and集合。FIRSTk-1FOLLOWk-1

用于模棱两可的 lambda 语法的 yacc shift-reduce

2回答