Skip to content

Browser 模块文档

模块路径: FQBase.Crawler.browser源码: [browser.py](file:///Users/A.D.189/FQuant/FQuant.Server/FQBase/FQBase/Crawler/browser.py)

文档索引

文档说明
framework.md框架概述、核心特性、设计模式
architecture.md整体架构、组件架构、工作流程
design.md设计决策与权衡
api.md详细 API 参考
usage.md使用指南、代码示例
best-practices.md最佳实践、常见问题

模块组件

组件类型说明
TIMEOUT常量默认超时时间 90 秒
POLL_FREQUENCY常量默认轮询频率 0.2 秒
make_headless_browser()函数创建无头 Chrome 浏览器
BrowserPool浏览器池(单例模式)
BaseCrawler基础爬虫类
PageParser页面解析工具类
make_headless_browser_with_auto_save_path()函数创建带下载路径的 Firefox

快速开始

python
from FQBase.Crawler.browser import BaseCrawler, PageParser

class MyCrawler(BaseCrawler):
    def __init__(self):
        super().__init__(use_browser=False)

    def crawl(self, url):
        html = self.fetch_url(url)
        titles = PageParser.extract_by_regex(html, r'<title>(.*?)</title>', group=1)
        return titles