在您提供的代码中,由于每次执行都创建新的线程,导致线程数量无限增加,最终导致内存泄漏。为了避免这种情况,我们可以使用线程池来管理线程创建。
线程池
线程池是一个预先分配的线程组,可以在任务到来时重复利用。这样可以避免不必要地创建新线程,从而提高程序的效率和稳定性。
立即学习“Python免费学习笔记(深入)”;
semaphore
semaphore 是一个用于协调并发访问的锁对象。它允许我们限制同时执行的线程数量。
优化后的代码
使用线程池和 semaphore,我们可以优化您的代码如下:
import threading import time # 最大同时运行的线程数量 MAX_THREADS = 4 # 创建线程池 thread_pool = ThreadPool(MAX_THREADS) # Semaphore 用于控制线程池中的线程数量 sem = threading.Semaphore(MAX_THREADS) def processHTML(html_code): # ... def threadDown(): with sem: # 限制同时运行的线程数量 # ... def runStart(): while initial: # 从 initial 队列中获取一个关键词 keyword = initial.pop(0) # 创建线程任务并提交到线程池 thread_pool.submit(create_url, keyword) if __name__ == "__mAIn__": runStart()
登录后复制
在这个优化后的版本中,每次只能创建和运行最多 4 个线程。semaphore 确保这一点,即使 initial 队列中有更多的任务。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
【小浪云服务商 - 服务器12元起 - 挂机宝5元起】
THE END
暂无评论内容