如何使用 Python 构建基于时间戳出现的序列?

我主要在一个数据库上使用 Python,该数据库有 17.000.000 条记录,用于 2.800.000 个唯一 ID。每个 ID 代表运输过程的一个事件,所有实例都有:ID、EVENT、TIMESTAMP(日期时间)。有一个事件通常但不总是开始序列并且有多种结果,即交付、返回等。

我的目标是找到每个 ID 所采用的最常见的路径,这意味着事件发生的顺序是什么,并找出流程中的瓶颈。

是否有任何可视化工具可以与内置了这种结构的 Python 一起使用?你会建议我如何处理这个问题?

谢谢


幕布斯7119047
浏览 195回答 1
1回答

BIG阳

这不是 Python 的答案,但鉴于问题,我认为有更好的方法来执行此类分析。我不知道您是否听说过流程挖掘。但我认为在你的情况下使用它是完美的。基本上,流程挖掘包括分析流程的流程。我使用过不同的工具,其中一些是:迪斯科ProM(开源)塞洛尼斯基本上,您需要做的就是定义什么是 ID(您已经拥有),然后选择哪些列代表时间戳(您已经拥有)和事件名称(您也拥有)。这些工具中的任何一个都可以为您提供对流程的完美分析。哪个是最常见的路径,每个事件的平均时间等。如果添加更多属性,它甚至可以根据这些属性返回遵循一条路径或另一条路径的原因。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python