使用特定模型通过 Tinkerpop 将(数百万行)数据导入 Janusgraph 的最佳方法

刚开始使用 Tinkerpop 和 Janusgraph,我正试图根据文档弄清楚这一点。

  • 我有三个数据集,每个数据集包含大约 2000 万行(csv 文件)

  • 有一个特定的模型,其中变量和行需要连接,例如什么是顶点,什么是标签,什么是边等。

  • 在图表中包含所有内容后,我当然想使用一些基本的 Gremlin 来查看模型的工作情况。

但首先我需要一种将数据导入 Janusgraph 的方法。

可能存在用于此的脚本。但除此之外,它是否可能用python编写,打开一个csv文件,获取变量X的每一行,并将其添加为顶点/边/等。……?还是我完全误解了 Janusgraph/Tinkerpop?

提前感谢您的任何帮助。

编辑:

假设我有几个文件,每个文件包含几百万行,代表人,还有几个变量,代表不同的指标。第一个示例可能如下所示:

             metric_1    metric_2    metric_3    ..


person_1        a           e           i

person_2        b           f           j

person_3        c           g           k

person_4        d           h           l

..        

我是否应该将其转换为具有首先由值组成的节点的文件,[a,...,l]。(以及后来可能更精细的属性集)


然后 [a,..., l] 被索引了吗?


在“现代”图形这里似乎有一个索引(号码1,...,12对所有的节点和边,独立于它们的重叠标签/类别的),例如应在每次测量单独索引,然后连接至一个给定的person_x他们属于哪个?


为这些可能直截了当的问题道歉,但我对此很陌生。


慕莱坞森
浏览 192回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python