並行性

Concurrency

この章のすべてのコードはここにあります

同僚がURLリストのステータスを確認する関数CheckWebsitesを作成しました。

これが設定です。

package concurrency
type WebsiteChecker func(string) bool
func CheckWebsites(wc WebsiteChecker, urls []string) map[string]bool {
results := make(map[string]bool)
for _, url := range urls {
results[url] = wc(url)
}
return results
}

チェックされた各URLのマップをブール値に返します-良好な応答の場合はtrue、不良応答の場合はfalse

単一のURLを取得してブール値を返すWebsiteCheckerも渡す必要があります。 これは、すべてのWebサイトをチェックする機能によって使用されます。

依存性の注入(DI)を使用すると、実際のHTTP呼び出しを行わずに関数をテストできるため、信頼性が高く、高速です。

ここに彼らが書いたテストがあります。

package concurrency
import (
"reflect"
"testing"
)
func mockWebsiteChecker(url string) bool {
if url == "waat://furhurterwe.geds" {
return false
}
return true
}
func TestCheckWebsites(t *testing.T) {
websites := []string{
"http://google.com",
"http://blog.gypsydave5.com",
"waat://furhurterwe.geds",
}
want := map[string]bool{
"http://google.com": true,
"http://blog.gypsydave5.com": true,
"waat://furhurterwe.geds": false,
}
got := CheckWebsites(mockWebsiteChecker, websites)
if !reflect.DeepEqual(want, got) {
t.Fatalf("Wanted %v, got %v", want, got)
}
}

この機能は運用中であり、数百のWebサイトをチェックするために使用されています。 しかし、あなたの同僚はそれが遅いという不満を持ち始めたので、彼らはあなたにそれを速くするのを手伝うように頼みました。

テストを書く

ベンチマークを使用して、CheckWebsitesの速度をテストし、変更の影響を確認してみましょう。

package concurrency
import (
"testing"
"time"
)
func slowStubWebsiteChecker(_ string) bool {
time.Sleep(20 * time.Millisecond)
return true
}
func BenchmarkCheckWebsites(b *testing.B) {
urls := make([]string, 100)
for i := 0; i < len(urls); i++ {
urls[i] = "a url"
}
for i := 0; i < b.N; i++ {
CheckWebsites(slowStubWebsiteChecker, urls)
}
}

ベンチマークは、100個のURLのスライスを使用してCheckWebsitesをテストし、WebsiteCheckerの新しい偽の実装を使用します。slowStubWebsiteCheckerは意図的に遅いです。 time.Sleepを使用して正確に20ミリ秒待機してからtrueを返します。

go test -bench=.を使用してベンチマークを実行する場合(またはWindows Powershellの場合go test -bench=".")。

pkg: github.com/gypsydave5/learn-go-with-tests/concurrency/v0
BenchmarkCheckWebsites-4 1 2249228637 ns/op
PASS
ok github.com/gypsydave5/learn-go-with-tests/concurrency/v0 2.268s

CheckWebsitesのベンチマークは2249228637ナノ秒で、約2.5秒です。

これをもっと速くしてみましょう。

成功させるのに十分なコードを書く

最後に、並行性について話します。これは、以下の目的のために、「複数の処理が進行中」であることを意味します。これは私たちが毎日自然に行うことです。

たとえば、今朝私はお茶を作りました。 私はやかんを置いてから、沸騰するのを待っている間に、冷蔵庫から牛乳を取り出し、食器棚からお茶を取り出し、お気に入りのマグカップを見つけ、ティーバッグをカップに入れました。 やかんが沸騰していたので、カップに水を入れました。

私がやらなかったのは、やかんを置いて、沸騰するまでやかんをじっと見つめてそこに立って、そしてやかんが沸騰したら、他のすべてのことをしました。

お茶を最初に作る方が速い理由を理解できれば、CheckWebsitesをより速くする方法を理解できます。 Webサイトの応答を待ってから次のWebサイトに要求を送信する代わりに、待機中に次の要求を行うようにコンピューターに指示します。

通常、Goで関数 doSomething()を呼び出すと、関数が返されるのを待ちます(返される値がない場合でも、関数が終了するのを待ちます)。この操作は blocking であると言います-完了するまで待機します。

Goでブロックしない操作は、ゴルーチン goroutine と呼ばれる別のプロセスで実行されます。 プロセスは、Goコードのページを上から下に読み取り、呼び出されたときに各関数の「内部」に移動して、その機能を読み取るものと考えてください。 別のプロセスが開始されると、別のリーダーが関数内で読み取りを開始し、元のリーダーがページを下に進むようにします。

Goに新しいgoroutineを開始するよう指示するには、キーワードの前にキーワードgoを置くことで、関数呼び出しをgoステートメントに変換します:「go doSomething()」。

package concurrency
type WebsiteChecker func(string) bool
func CheckWebsites(wc WebsiteChecker, urls []string) map[string]bool {
results := make(map[string]bool)
for _, url := range urls {
go func() {
results[url] = wc(url)
}()
}
return results
}

ゴルーチンを開始する唯一の方法は、goを関数呼び出しの前に置くことなので、ゴルーチンを開始したい場合は、しばしば 無名関数 を使用します。無名関数リテラルは、通常の関数宣言とまったく同じように見えますが、名前ががありません。 上記は、forループの本体で確認できます。

匿名関数には、それらを便利にするいくつかの機能があり、そのうち2つは上記で使用しています。まず、宣言と同時に実行できます-これは、無名関数の最後にある()が行っていることです。次に、定義されている字句スコープへのアクセスを維持します。無名関数を宣言した時点で使用可能なすべての変数は、関数の本体でも使用できます。

上記の無名関数の本体は、以前のループ本体とまったく同じです。唯一の違いは、ループの各反復が新しいgoroutineを開始することであり、現在のプロセス(WebsiteChecker関数)と同時に、その結​​果が結果マップに追加されます。

しかし、go testを実行すると

--- FAIL: TestCheckWebsites (0.00s)
CheckWebsites_test.go:31: Wanted map[http://google.com:true http://blog.gypsydave5.com:true waat://furhurterwe.geds:false], got map[]
FAIL
exit status 1
FAIL github.com/gypsydave5/learn-go-with-tests/concurrency/v1 0.010s

余談ですが、パラレルワールドに...

この結果が得られない可能性があります。

後で説明するパニックメッセージが表示される場合があります。それが得られても心配しないでください。

上記の結果が do になるまでテストを実行し続けてください。またはあなたがしたふりをします。 あなた次第です。同時実行へようこそ!

正しく処理されない場合、何が起こるかを予測することは困難です。心配しないでください。 それが、並行性を予測可能に処理していることを知るのに役立つようにテストを作成している理由です。

...戻ってきました

CheckWebsitesが空のマップを返す元のテストに引っ掛かっています。何が悪かったのか?

forループが開始したゴルーチンには、結果をresultsマップに追加するのに十分な時間がありませんでした。 WebsiteChecker関数は速すぎて、まだ空のマップを返します。

これを修正するには、すべてのゴルーチンが作業を行っている間待機してから、戻ることができます。

2秒でできるはずですよね?

package concurrency
import "time"
type WebsiteChecker func(string) bool
func CheckWebsites(wc WebsiteChecker, urls []string) map[string]bool {
results := make(map[string]bool)
for _, url := range urls {
go func() {
results[url] = wc(url)
}()
}
time.Sleep(2 * time.Second)
return results
}

テストを実行すると、または取得されません(上記を参照)

--- FAIL: TestCheckWebsites (0.00s)
CheckWebsites_test.go:31: Wanted map[http://google.com:true http://blog.gypsydave5.com:true waat://furhurterwe.geds:false], got map[waat://furhurterwe.geds:false]
FAIL
exit status 1
FAIL github.com/gypsydave5/learn-go-with-tests/concurrency/v1 0.010s

これは褒められたことではありません。

なぜ1つの結果しかないのでしょうか?

待機時間を増やすことでこれを修正する可能性があります-必要に応じて試してください。それは動作しません。

ここでの問題は、変数urlforループの反復ごとに再利用されることです。 毎回urlsから新しい値を取得します。

しかし、それぞれのゴルーチンはurl変数への参照を持っています。それらは独自の独立したコピーを持っていません。

つまり、イテレーションの最後にurlが持っている値、つまり最後のURLをすべて書きます。 これが、1つの結果が最後のURLである理由です。

これを修正するには

package concurrency
import (
"time"
)
type WebsiteChecker func(string) bool
func CheckWebsites(wc WebsiteChecker, urls []string) map[string]bool {
results := make(map[string]bool)
for _, url := range urls {
go func(u string) {
results[u] = wc(u)
}(url)
}
time.Sleep(2 * time.Second)
return results
}

各匿名関数にURLのパラメーター -u-を指定し、引数としてurlを使用して匿名関数を呼び出すことにより、uの値がurlの値として固定されていることを確認しますゴルーチンを起動するループの反復です。

uurlの値のコピーであるため、変更できません。

運が良ければ、次のようになります。

PASS
ok github.com/gypsydave5/learn-go-with-tests/concurrency/v1 2.012s

しかし、運が悪い場合はベンチマークで実行すると、より多くの試行が行われる可能性が高くなります。

fatal error: concurrent map writes
goroutine 8 [running]:
runtime.throw(0x12c5895, 0x15)
/usr/local/Cellar/go/1.9.3/libexec/src/runtime/panic.go:605 +0x95 fp=0xc420037700 sp=0xc4200376e0 pc=0x102d395
runtime.mapassign_faststr(0x1271d80, 0xc42007acf0, 0x12c6634, 0x17, 0x0)
/usr/local/Cellar/go/1.9.3/libexec/src/runtime/hashmap_fast.go:783 +0x4f5 fp=0xc420037780 sp=0xc420037700 pc=0x100eb65
github.com/gypsydave5/learn-go-with-tests/concurrency/v3.WebsiteChecker.func1(0xc42007acf0, 0x12d3938, 0x12c6634, 0x17)
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:12 +0x71 fp=0xc4200377c0 sp=0xc420037780 pc=0x12308f1
runtime.goexit()
/usr/local/Cellar/go/1.9.3/libexec/src/runtime/asm_amd64.s:2337 +0x1 fp=0xc4200377c8 sp=0xc4200377c0 pc=0x105cf01
created by github.com/gypsydave5/learn-go-with-tests/concurrency/v3.WebsiteChecker
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:11 +0xa1
... many more scary lines of text ...

これは長くて怖いですが、私たちがする必要があるのは、一息ついてスタックトレースを読むだけです。

致命的なエラー:同時マップ書き込み

テストを実行すると、2つのゴルーチンがまったく同時に結果マップに書き込む場合があります。Goのマップは、一度に複数のものが書き込もうとすると気に入らないため、「致命的なエラー(fatal error)」が発生します。

これは レース条件 であり、ソフトウェアの出力が、制御できないイベントのタイミングとシーケンスに依存している場合に発生するバグです。 各ゴルーチンが結果マップに書き込むタイミングを正確に制御することはできないため、2つのゴルーチンが同時に書き込むことに対して脆弱です。

Goは、組み込みの[racedetector](https://blog.golang.org/race-detector)で競合状態を特定するのに役立ちます。 この機能を有効にするには、raceフラグを指定してテストを実行します。go test -race

次のような出力が表示されます。

==================
WARNING: DATA RACE
Write at 0x00c420084d20 by goroutine 8:
runtime.mapassign_faststr()
/usr/local/Cellar/go/1.9.3/libexec/src/runtime/hashmap_fast.go:774 +0x0
github.com/gypsydave5/learn-go-with-tests/concurrency/v3.WebsiteChecker.func1()
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:12 +0x82
Previous write at 0x00c420084d20 by goroutine 7:
runtime.mapassign_faststr()
/usr/local/Cellar/go/1.9.3/libexec/src/runtime/hashmap_fast.go:774 +0x0
github.com/gypsydave5/learn-go-with-tests/concurrency/v3.WebsiteChecker.func1()
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:12 +0x82
Goroutine 8 (running) created at:
github.com/gypsydave5/learn-go-with-tests/concurrency/v3.WebsiteChecker()
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:11 +0xc4
github.com/gypsydave5/learn-go-with-tests/concurrency/v3.TestWebsiteChecker()
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker_test.go:27 +0xad
testing.tRunner()
/usr/local/Cellar/go/1.9.3/libexec/src/testing/testing.go:746 +0x16c
Goroutine 7 (finished) created at:
github.com/gypsydave5/learn-go-with-tests/concurrency/v3.WebsiteChecker()
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:11 +0xc4
github.com/gypsydave5/learn-go-with-tests/concurrency/v3.TestWebsiteChecker()
/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker_test.go:27 +0xad
testing.tRunner()
/usr/local/Cellar/go/1.9.3/libexec/src/testing/testing.go:746 +0x16c
==================

詳細は読みにくいですが、「警告:データレース(WARNING: DATA RACE)」は非常に明確です。エラーの本文を読むと、マップで書き込みを実行する2つの異なるゴルーチンがわかります。

'goroutine 8' で '0x00c420084d20'に書き込む(Write at 0x00c420084d20 by goroutine 8:

と同じメモリブロックに書き込んでいます

'goroutine 7'による'0x00c420084d20'での以前の書き込み(Previous write at 0x00c420084d20 by goroutine 7

さらに、書き込みが行われているコード行を確認できます。

/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:12

ゴルーチン'7'と'8'が開始されるコード行

/Users/gypsydave5/go/src/github.com/gypsydave5/learn-go-with-tests/concurrency/v3/websiteChecker.go:11

あなたが知る必要があるすべてはあなたのターミナルに表示されます。 あなたがしなければならないすべてはそれを読むのに十分な忍耐です。

チャネル

channels を使用してゴルーチンを調整することで、このデータ競合を解決できます。 チャネルは、値の受信と送信の両方が可能なGoデータ構造です。これらの操作とその詳細により、異なるプロセス間の通信が可能になります。

この場合、親プロセスと、それがURLでWebsiteChecker関数を実行する作業を行うために行う各ルーチン間の通信について考えたいと思います。

package concurrency
type WebsiteChecker func(string) bool
type result struct {
string
bool
}
func CheckWebsites(wc WebsiteChecker, urls []string) map[string]bool {
results := make(map[string]bool)
resultChannel := make(chan result)
for _, url := range urls {
go func(u string) {
resultChannel <- result{u, wc(u)}
}(url)
}
for i := 0; i < len(urls); i++ {
result := <-resultChannel
results[result.string] = result.bool
}
return results
}

resultsマップに加えて、同じ方法でmakeするresultChannelがあります。chan resultはチャネルのタイプです。resultのチャネルです。新しいタイプのresultは、WebsiteCheckerの戻り値をチェック対象のURLに関連付けるために作成されました。これは、stringおよびboolの構造体です。

どちらの値にも名前を付ける必要はないので、それらはそれぞれ構造体内で匿名です。 これは、値の名前を付けるのが難しい場合に役立ちます。

URLを反復処理するとき、mapに直接書き込む代わりに、 send statement を使用して、wcへの各呼び出しの result構造体をresultChannelに送信します。これは、<-演算子を使用して、左側にチャネル、右側に値を取得します。

// Send statement
resultChannel <- result{u, wc(u)}

次のforループは、各URLに対して1回反復します。 内部では、チャネルから受信した値を変数に割り当てる receive式 を使用しています。 これも<-演算子を使用していますが、2つのオペランドが逆になっています。チャネルが右側にあり、代入する変数が左側にあります。

// Receive expression
result := <-resultChannel

次に、受け取ったresultを使用してマップを更新します。

結果をチャネルに送信することにより、結果マップへの各書き込みのタイミングを制御して、一度に1つずつ発生するようにします。

wcの各呼び出しと結果チャネルへの送信はそれぞれ独自のプロセス内で並行して発生しますが、結果チャネルから値を取得するため、結果はそれぞれ一度に1つずつ処理されます。表現を受け取ります。

高速化したいコードの部分を並列化し、同時に実行できない部分は線形的に発生するようにしました。 また、チャネルを使用することにより、関連する複数のプロセス間で通信しました。

ベンチマークを実行すると

pkg: github.com/gypsydave5/learn-go-with-tests/concurrency/v2
BenchmarkCheckWebsites-8 100 23406615 ns/op
PASS
ok github.com/gypsydave5/learn-go-with-tests/concurrency/v2 2.377s

23406615ナノ秒(0.023秒)、元の関数の約100倍の速さ。

大成功。

まとめ

この演習は、TDDで通常よりも少し軽くなっています。 ある意味では、CheckWebsites関数の1つの長いリファクタリングに参加しています。

入力と出力が変更されることはなく、ただ速くなっただけです。しかし、実施したテストと作成したベンチマークにより、ソフトウェアがまだ機能しているという確信を維持しながら、実際に高速になったことを示す方法でCheckWebsitesをリファクタリングすることができました。

それをより速くすることで、私たちは

  • Goの並行処理の基本単位であるゴルーチン( goroutines )により、詳細を確認できます

    同時に複数のウェブサイト。

  • anonymous functions 各並行プロセスを開始するために使用しました

    ウェブサイトをチェックします。

  • channels 間の通信を整理および制御するのに役立ちます

    さまざまなプロセスにより、 レース状態 のバグを回避できます。

  • the race detector は、並行コードに関する問題のデバッグに役立ちました

速くする

ケントベックに誤解されていることが多い、ソフトウェアをアジャイルに構築する方法の1つの定式化は次のとおりです。

機能させる、正しくする、速くする

「機能させる」とはテストに合格すること、「正しくする」とはコードをリファクタリングすること、そして「速くする」とはコードを最適化して、たとえばすばやく実行することです。 「速くする」ことができるのは、それを機能させて正しくした後だけです。

与えられたコードは既に機能していることが実証されており、リファクタリングする必要がないことは幸運でした。他の2つのステップを実行する前に、「高速化」を試みるべきではありません。

早期最適化はすべての悪の根源 -- Donald Knuth