關于PHP協程與阻塞的思考
進程、線程、協程
關于進程、線程、協程,有非常詳細和豐富的博客或者學習資源,我不在此做贅述,我大致在此介紹一下這幾個東西。
- 進程擁有自己獨立的堆和棧,既不共享堆,亦不共享棧,進程由操作系統調度。
- 線程擁有自己獨立的棧和共享的堆,共享堆,不共享棧,線程亦由操作系統調度(標準線程是的)。
- 協程和線程一樣共享堆,不共享棧,協程由程序員在協程的代碼里顯示調度。
PHP中的協程實現基礎 yield
yield的根本實現是生成器類,而迭代器類是迭代器接口的實現:
- Generator implements Iterator {
- public mixed current ( void ) // 返回當前產生的值
- public mixed key ( void ) // 返回當前產生的鍵
- public void next ( void ) // 生成器繼續執行
- public void rewind ( void ) // 重置迭代器,如果迭代已經開始了,這里會拋出一個異常。
- // renwind的執行將會導致***個yield被執行, 并且忽略了他的返回值.
- public mixed send ( mixed $value ) // 向生成器中傳入一個值,并且當做 yield 表達式的結果,然后繼續執行生成器。如果當這個方法被調用時,生成器
- // 不在 yield 表達式,那么在傳入值之前,它會先運行到***個 yield 表達式。
- public void throw ( Exception $exception ) // 向生成器中拋入一個異常
- public bool valid ( void ) // 檢查迭代器是否被關閉
- public void __wakeup ( void ) // 序列化回調,拋出一個異常以表示生成器不能被序列化。
- }
以上解析可以參考PHP官方文檔。
http://php.net/manual/zh/clas...
以及鳥哥翻譯的這篇詳細文檔:
http://www.laruence.com/2015/...
我就以他實現的協程多任務調度為基礎做一下例子說明并說一下關于我在阻塞方面所做的一些思考。
自定義簡單定時執行任務示例:
(此例子必須依賴于以上鳥哥實現的協程調度代碼)
- class timer {
- private $start = 0; // 定時開始時間
- private $timer; // 間隔的時間差,單位秒
- private $value = 0; // 產生的結果值
- private $callback; // 異步回調
- private $isEnd = false; // 當前定時器任務是否結束
- public function __construct($timer,callable $callback)
- {
- $this->start = time();
- $this->timer = $timer;
- $this->callback = $callback;
- }
- public function run() {
- if($this->valid()) {
- $callback = $this->callback;
- $callback($this->value ++,$this);
- $this->start = time();
- }
- }
- /**
- * 定時執行檢查
- */
- public function valid() {
- $end = time();
- if($end - $this->start >= $this->timer) {
- return true;
- } else {
- return false;
- }
- }
- public function setEnd($isEnd) {
- $this->isEnd = $isEnd;
- }
- public function getEnd() {
- return $this->isEnd;
- }
- }
- /**
- * 模擬阻塞的協程1
- *
- */
- function taskObject1() {
- $timer = new timer(1,function($value,timer $timer) {
- if($value >= 5) {
- $timer->setEnd(true);
- }
- echo '<br>'.'A '.$value;
- });
- $tid = (yield getTaskId());
- while (true) {
- if($timer->getEnd() == true) {
- break;
- }
- yield $timer->run();
- }
- }
- /**
- * 模擬阻塞的協程2
- *
- */
- function taskObject2() {
- $timer = new timer(2,function($value,timer $timer) {
- if($value >= 3) {
- $timer->setEnd(true);
- }
- echo '<br>'.'B '.$value;
- });
- $tid = (yield getTaskId());
- while (true) {
- if($timer->getEnd() == true) {
- break;
- }
- yield $timer->run();
- }
- }
- $scheduler = new Scheduler;
- $scheduler->newTask(taskObject1());
- $scheduler->newTask(taskObject2());
- $scheduler->run();
以上實現的是:
- 產生兩個任務,并行執行,并且給每個任務在執行的時候模擬幾秒鐘的阻塞;
- 讓協程切換的時候能順利切換,其中的任務阻塞不相互影響;
思考:
我為什么要做以上這件事情呢?因為我發現協程實現雖然很強大也很有意思,能讓多任務并行,但是我在其中一個任務里調用系統函數 sleep() 的時候,阻塞任務會阻止協程切換,其實從協程的實現原理上來書也是這么回事。
那么,我也就想模擬協程阻塞,但是不產生阻塞看是否可行。PHP本身只提供了生成器為協程調用提供了支撐,如果不依賴擴展,沒有提供多線程的程序實現方式,沒有java那么強大,可以開子線程進行實現。
我印象中java的子線程是獨立執行且不會相互阻塞的,所以我在想,PHP既然可以實現類似于多線程這樣的機制,那么能不能實現調用過程中非阻塞呢?
經過這樣一個實現和思考,一開始是陷入了一個誤區的,是由于PHP原生函數 sleep() 阻塞造成的思維誤區,那就是認為要想真正實現非阻塞或者說實現異步的話,是必須依賴于語言底層的。
后來,我想明白了一個道理,既然某個方法或者函數在執行過程中,會產生阻塞,那么把當前這個方法換成自定義的,做成非阻塞(相對于整個協程調度來說)不就行了嗎?比如上面的定時執行我自己實現了一個。
而另一方面,協程調度本身的目的也是為了把任務執行過程切成盡量小片,從而快速切換執行,達到并行的目的。從這方面來看,協程應該也算是一種程序設計思想。
以下是一個程序切成盡量小片執行的例子:
- // 一個簡單的例子
- <?php
- function xrange($start, $end, $step = 1) {
- for ($i = $start; $i <= $end; $i += $step) {
- yield $i;
- }
- }
- foreach (xrange(1, 1000000) as $num) {
- echo $num, "\n";
- }
這個例子是把原本用 range 生成一個很大的整型數組的方式切換為分片執行,也就是說在遍歷的時候再去取到指定的值,從代碼上來看,內存消耗相對于之前來說就非常小了。