刚开始使用 Tinkerpop 和 Janusgraph,我正试图根据文档弄清楚这一点。
我有三个数据集,每个数据集包含大约 2000 万行(csv 文件)
有一个特定的模型,其中变量和行需要连接,例如什么是顶点,什么是标签,什么是边等。
在图表中包含所有内容后,我当然想使用一些基本的 Gremlin 来查看模型的工作情况。
但首先我需要一种将数据导入 Janusgraph 的方法。
可能存在用于此的脚本。但除此之外,它是否可能用python编写,打开一个csv文件,获取变量X的每一行,并将其添加为顶点/边/等。……?还是我完全误解了 Janusgraph/Tinkerpop?
提前感谢您的任何帮助。
编辑:
假设我有几个文件,每个文件包含几百万行,代表人,还有几个变量,代表不同的指标。第一个示例可能如下所示:
metric_1 metric_2 metric_3 ..
person_1 a e i
person_2 b f j
person_3 c g k
person_4 d h l
..
我是否应该将其转换为具有首先由值组成的节点的文件,[a,...,l]。(以及后来可能更精细的属性集)
然后 [a,..., l] 被索引了吗?
在“现代”图形这里似乎有一个索引(号码1,...,12对所有的节点和边,独立于它们的重叠标签/类别的),例如应在每次测量单独索引,然后连接至一个给定的person_x他们属于哪个?
为这些可能直截了当的问题道歉,但我对此很陌生。
相关分类