python - celery工作流的問(wèn)題
問(wèn)題描述
celery中,我做這樣的處理:一個(gè)url經(jīng)過(guò)a, b, c三個(gè)的函數(shù),分別獲得返回值,其中任意函數(shù)結(jié)果均與任意其他函數(shù)結(jié)果不相關(guān),然后匯總起來(lái),交給之后的流程.這樣,我自然想到并行運(yùn)行三個(gè)函數(shù)來(lái)加快處理速度.然而由于一開(kāi)始的設(shè)計(jì)問(wèn)題, a函數(shù)式被設(shè)計(jì)成了一次可以處理多個(gè)url的形式,而一個(gè)一個(gè)的處理會(huì)非常慢.
@celery.taskdef a(url_list): ’...do something...’ for url in url_list:b.delay(url)
我嘗試這樣控制,然而任務(wù)似乎并不能嵌套.那么,如何設(shè)計(jì)可以比較好的滿(mǎn)足我這種比較奇怪的流程和要求呢?
問(wèn)題解答
回答1:應(yīng)該把a(bǔ);b;c拆開(kāi),寫(xiě)成3個(gè)task, 同時(shí)數(shù)據(jù)庫(kù)里要保存一個(gè)狀態(tài)值,用來(lái)表示3個(gè)任務(wù)的執(zhí)行狀態(tài),一個(gè)任務(wù)執(zhí)行完成后,就修改狀態(tài)值,并檢查其他2個(gè)任務(wù)是否完成,如果都完成了,就匯總?cè)蝿?wù)結(jié)果,再處理。
回答2:@xiaoboost 手工維護(hù)狀態(tài)可行,但有點(diǎn)費(fèi)事。
Celery 是可以設(shè)計(jì)執(zhí)行流程的,參考文檔:Designing Work-flows題主的需求可以用 chords 搞定,在 celery task 里返回值就行。
BTW: 注意一下 Celery 配置中與返回值相關(guān)的幾個(gè)選項(xiàng),比如這個(gè) task_ignore_result
相關(guān)文章:
1. java - spring-data Jpa 不需要執(zhí)行save 語(yǔ)句,Set字段就可以自動(dòng)執(zhí)行保存的方法?求解2. html5 - 微信瀏覽器視頻播放失敗3. javascript - 這問(wèn)題怎么處理額4. css3 - 為什么css里面要帶-moz-|-webkit-后又來(lái)一個(gè)不帶它們的5. 網(wǎng)頁(yè)爬蟲(chóng) - Python 爬蟲(chóng)中如何處理驗(yàn)證碼?6. javascript - jQuery中l(wèi)ive事件在移動(dòng)微信端下沒(méi)有效果;代碼如下7. javascript - SuperSlide.js火狐不兼容怎么回事呢8. javascript - owl.carousel.js這個(gè)插件的原作者的網(wǎng)址是多少了?9. phpstady在win10上運(yùn)行10. 在應(yīng)用配置文件 app.php 中找不到’route_check_cache’配置項(xiàng)
