假设我有一大串字符串,我想对它们进行排序,除了通常的 sort.Sort 和 sort.Slice 等之外,我想使用多个核心来加快速度。因此,在阅读大列表时,我将字符串添加到 2 个不同的切片中,即以 am 和 nz 开头的字符串(为了论证)。
同时,我启动了多个 go 例程来读取字符串切片通道,然后这些字符串切片将对其自己的子列表进行排序。到目前为止,一切都很好,“可能”并行处理列表,因此我的排序时间实际上减半了。伟大的。现在我的问题是如何将结果返回到主 goroutine?
最初每个 goroutine 有 2 个通道,一个用于传入的未排序列表,另一个用于排序列表。是的,它有效......但使用了太多内存(嘿,给出我正在为这个测试修改的数据量,这可能不是不合理的)。但后来我意识到,在通道上传递切片实际上只是传递引用,所以我实际上不需要传递任何东西。不必将生成的排序列表放入回程的通道中,显然对记忆的负担要小得多,但它(对我来说)有味道。
这意味着我可以让其中一个 Goroutine 进行排序,同时主 Goroutine(理论上)可以操作同一个列表。只要遵守纪律,这就不会成为问题,但显然仍然是一个问题。Go 中是否有一种普遍接受的最佳实践,即引用不应该作为输入从一个 goroutine 传递到另一个 goroutine...但是可以通过通道返回生成引用数据的 goroutine (因为 goroutine 然后会停止使用参考)。
在有人说之前,是的,我知道我不必通过渠道等传递这些信息,但这正是我正在修改并让我思考的情况。
我知道,手又长又波浪。这是显示上述内容的最小代码子集。
package main
import (
"bufio"
"fmt"
"os"
"sort"
"strings"
"sync"
"time"
)
var wg sync.WaitGroup
func sortWordsList(id int, ch chan []string ) {
l := <- ch
sort.Strings(l)
wg.Done()
}
func main() {
file, err := os.Open("big.txt")
defer file.Close()
if err != nil {
fmt.Printf("BOOM %s\n", err.Error())
panic(err)
}
// Start reading from the file with a reader.
reader := bufio.NewReader(file)
inCh1 := make(chan []string, 1000)
inCh2 := make(chan []string, 1000)
go sortWordsList(1, inCh1)
go sortWordsList(2, inCh2)
wg.Add(2)
words1 := []string{}
words2 := []string{}
for {
line, err := reader.ReadString('\n')
if err != nil {
break
}
sp := strings.Split(line, " ")
for _,w := range sp {
word := strings.ToLower(w)
word = strings.TrimSuffix(word, "\n")
if len(word) > 0 {
// figure out where to go.
// arbitrary split.
if word[0] < 'm' {
words1 = append(words1, word)
} else {
words2 = append(words2, word)
}
}
}
}
相关分类