前几天,我谈过在知识提取相关的任务中,我看到的一些因调整LLM的温度所带来的不一致性。
我决定再看看这个话题,并谈谈我观察到的行为。不仅Gemini-1.5-Flash-002没有让我失望,给出了更多意想不到的结果,我还找到了一些强有力的证据,表明长窗口仍然会忽略数据。以下是我在视频中使用的笔记。
前几天,我谈过在知识提取相关的任务中,我看到的一些因调整LLM的温度所带来的不一致性。
我决定再看看这个话题,并谈谈我观察到的行为。不仅Gemini-1.5-Flash-002没有让我失望,给出了更多意想不到的结果,我还找到了一些强有力的证据,表明长窗口仍然会忽略数据。以下是我在视频中使用的笔记。