用于大量项目的 C# 字典

更新：自从我发布它以来，我已经编辑了它：存储一个固定大小的对象（byte[50] 每次通过，在添加到字典之前预先分配所有这些（而不是在循环中创建对象）在预分配东西后运行 GC.Collect()。gcAllowVeryLargeObjects 设置为真。肯定是为 x64 设置的（以前是这样，但后来我切换到“发布”以在 VS 之外构建和运行......然后它重置了，哎呀。）尝试使用和不使用预先分配字典大小。这是现在的代码：var arrays = new byte[100000000][];System.Diagnostics.Stopwatch stopwatch = new System.Diagnostics.Stopwatch();stopwatch.Start();for (var i = 0; i<100000000; i++){    arrays[i] = new byte[50];}stopwatch.Stop();Console.WriteLine($"initially allocating arrays took {stopwatch.ElapsedMilliseconds} ms");stopwatch.Restart();GC.Collect();Console.WriteLine($"GC after array allocation took {stopwatch.ElapsedMilliseconds} ms");Dictionary<int, byte[]> dict = new Dictionary<int, byte[]>(100000000);//Dictionary<int, byte[]> dict = new Dictionary<int, byte[]>();for (var c = 0; c < 100; c++){    stopwatch.Restart();    for (var i = 0; i < 1000000; i++)    {        var thing = new AThing();        dict.Add((c * 1000000) + i, arrays[(c*100000)+i]);    }    stopwatch.Stop();    Console.WriteLine($"pass number {c} took {stopwatch.ElapsedMilliseconds} milliseconds");}Console.ReadLine();这是我不预先分配字典大小时的输出：initially allocating arrays took 14609 msGC after array allocation took 3713 mspass number 0 took 63 millisecondspass number 1 took 51 millisecondspass number 2 took 78 millisecondspass number 3 took 28 millisecondspass number 4 took 32 millisecondspass number 5 took 133 millisecondspass number 6 took 41 millisecondspass number 7 took 31 millisecondspass number 8 took 27 millisecondspass number 9 took 26 millisecondspass number 10 took 45 millisecondspass number 11 took 335 millisecondspass number 12 took 34 millisecondspass number 13 took 35 millisecondspass number 14 took 71 millisecondspass number 15 took 66 millisecondspass number 16 took 64 millisecondspass number 17 took 58 millisecondspass number 18 took 71 millisecondspass number 19 took 65 millisecondspass number 20 took 68 millisecondspass number 21 took 67 millisecondspass number 22 took 83 millisecondspass number 23 took 11986 millisecondspass number 24 took 7948 millisecondspass number 25 took 38 millisecondspass number 26 took 36 millisecondspass number 27 took 27 millisecondspass number 28 took 31 milliseconds..SNIP lots between 30-40ms...pass number 44 took 34 millisecondspass number 45 took 34 millisecondspass number 46 took 33 millisecondspass number 47 took 2630 millisecondspass number 48 took 12255 millisecondspass number 49 took 33 milliseconds...SNIP a load of lines which are all between 30 to 50ms...pass number 93 took 39 millisecondspass number 94 took 43 millisecondspass number 95 took 7056 millisecondspass number 96 took 33323 millisecondspass number 97 took 228 millisecondspass number 98 took 70 millisecondspass number 99 took 84 milliseconds您可以清楚地看到必须重新分配的点。我猜测只是通过将列表的大小加倍并复制当前列表项，因为最后有很长一段没有这样做。其中一些非常昂贵（30+秒！哎哟）如果我预先分配了字典大小，这里是输出：initially allocating arrays took 15494 msGC after array allocation took 2622 mspass number 0 took 9585 millisecondspass number 1 took 107 millisecondspass number 2 took 91 millisecondspass number 3 took 145 millisecondspass number 4 took 83 millisecondspass number 5 took 118 millisecondspass number 6 took 133 millisecondspass number 7 took 126 millisecondspass number 8 took 65 millisecondspass number 9 took 52 millisecondspass number 10 took 42 millisecondspass number 11 took 34 millisecondspass number 12 took 45 millisecondspass number 13 took 48 millisecondspass number 14 took 46 milliseconds..SNIP lots between 30-80ms...pass number 45 took 80 millisecondspass number 46 took 65 millisecondspass number 47 took 64 millisecondspass number 48 took 65 millisecondspass number 49 took 122 millisecondspass number 50 took 103 millisecondspass number 51 took 45 millisecondspass number 52 took 77 millisecondspass number 53 took 64 millisecondspass number 54 took 96 milliseconds..SNIP lots between 30-80ms...pass number 77 took 44 millisecondspass number 78 took 85 millisecondspass number 79 took 142 millisecondspass number 80 took 138 millisecondspass number 81 took 47 millisecondspass number 82 took 44 milliseconds..SNIP lots between 30-80ms...pass number 93 took 52 millisecondspass number 94 took 50 millisecondspass number 95 took 63 millisecondspass number 96 took 111 millisecondspass number 97 took 175 millisecondspass number 98 took 96 millisecondspass number 99 took 67 milliseconds内存使用量在最初创建数组时上升到 9GB 以上，在 GC.Collect 之后下降到大约 6.5GB，在添加到字典时爬回超过 9GB，然后完成（并且它坐在控制台上等待.Readline()) 之后它会回落到 ~3.7GB 并保持在那里。这显然远远快于操作预分配的字典虽然。供参考，原件如下*我刚刚写了这个小测试。我不知道你在存储什么，所以我刚刚创建了一个没有太多信息的无意义的类，并使用 int 作为关键，但我从中得到的两个要点是：在增加到大约 4000 万个项目之前，它似乎并没有逐渐变慢添加到字典中。运行针对 x64 的“Release”构建，每百万次插入需要大约 500 毫秒，然后从 41 到 46 需要大约 700-850 毫秒（在这一点上有明显的跳跃）它达到了超过 46,000,000 个项目，消耗了大约 4GB 的 RAM 并因内存不足异常而倒下。使用数据库，否则词典滥用团队会来找你。代码：class AThing{    public string Name { get; set; }    public int id { get; set; }}class Program{    static void Main(string[] args)    {        Dictionary<int, AThing> dict = new Dictionary<int, AThing>();        for (var c = 0; c < 100; c++)        {            DateTime nowTime = DateTime.Now;            for (var i = 0; i < 1000000; i++)            {                var thing = new AThing { id = (c * 1000000) + i, Name = $"Item {(c * 1000000) + i}" };                dict.Add(thing.id, thing);            }            var timeTaken = DateTime.Now - nowTime;            Console.WriteLine($"pass number {c} took {timeTaken.Milliseconds} milliseconds");        }    }}

用于大量项目的 C# 字典

3回答