Python+Selenium自动化测试：从环境搭建到POM框架实战

发布时间：2026/6/22 20:51:15

1. 项目概述为什么是PythonSelenium如果你正在看这篇文章大概率是遇到了测试工作的瓶颈重复的点击、表单填写、数据校验每天像个机器人一样在浏览器里做着枯燥的“点点点”。或者你是一名开发者想确保每次代码提交后核心业务流程依然畅通无阻。手动测试不仅效率低下容易出错更无法应对现代快速迭代的开发节奏。这时自动化测试就成了必然选择。而在众多自动化测试方案中Python Selenium的组合几乎是Web UI自动化测试领域的“黄金标准”。为什么是它首先Python语法简洁学习曲线平缓即便没有深厚的编程基础也能快速上手写出可用的测试脚本。其次Selenium是一个强大的、支持多浏览器的开源Web自动化工具它能模拟真实用户的所有操作点击、输入、滚动、拖拽甚至处理弹窗和iframe。将Python的易用性与Selenium的强大能力结合你就能构建出一支不知疲倦、执行精准的“数字测试员”队伍。这个组合适合谁不仅仅是专业的测试工程师。对于后端开发、运维、甚至产品经理如果你需要定期检查线上功能、进行数据抓取在合规前提下或制作自动化的演示脚本掌握PythonSelenium都将让你事半功倍。接下来我不会只给你一堆代码片段而是带你从零开始搭建一个健壮、可维护的自动化测试框架并分享那些只有踩过坑才知道的实战经验。2. 环境搭建与核心组件解析工欲善其事必先利其器。搭建一个稳定可靠的自动化测试环境是成功的第一步。这里面的坑往往比写代码本身还要多。2.1 Python环境配置避开版本陷阱很多人倒在了第一步安装Python。并不是下载一个安装包点击“下一步”那么简单。首先版本选择至关重要。我强烈建议使用Python 3.8 到 3.11之间的版本。Python 3.12及以上版本虽然新但一些第三方库的兼容性可能还未完全跟上容易遇到意想不到的错误。Python 2.7早已停止维护绝对不要用。其次推荐使用虚拟环境。这是Python开发中的最佳实践它能将你的项目依赖与系统全局Python环境隔离。想象一下你同时在做两个项目一个需要Selenium 4另一个老项目需要Selenium 3如果没有虚拟环境版本冲突会让你焦头烂额。使用venv创建虚拟环境非常简单# 进入你的项目目录 cd your_automation_project # 创建名为‘venv’的虚拟环境 python -m venv venv # 激活虚拟环境 # 在Windows上 venv\Scripts\activate # 在macOS/Linux上 source venv/bin/activate激活后你的命令行提示符前通常会显示(venv)表示你正在虚拟环境中工作。之后所有通过pip安装的包都只存在于这个环境中。注意很多教程会推荐Anaconda但对于纯自动化测试项目venv更加轻量、纯粹且是Python标准库的一部分无需额外安装。2.2 Selenium与WebDriver灵魂与躯壳理解Selenium的架构是写出稳定脚本的关键。Selenium本身是一个API集合它定义了如何控制浏览器的“协议”。而真正驱动浏览器执行操作的是各个浏览器厂商提供的WebDriver。你可以把Selenium库我们通过pip install selenium安装的那个看作是一个“翻译官”或“指挥官”它接收你用Python写的指令如find_element,click。而WebDriver则是一个“驱动程序”是具体操作浏览器的“手”。指挥官Selenium通过一种通用的方式向驱动程序WebDriver发号施令驱动程序再将其翻译成浏览器能理解的原生操作。因此你必须为你要测试的浏览器下载对应的WebDriverChrome:ChromeDriverFirefox:geckodriverEdge:Microsoft Edge WebDriver这里有一个巨坑WebDriver版本必须与你的浏览器版本匹配尤其是Chrome版本不匹配是导致SessionNotCreatedException错误的最常见原因。最佳实践使用webdriver-manager自动管理。手动下载、配置路径、匹配版本太麻烦了。现在更流行的做法是使用webdriver-manager这个Python包。它会自动检测你本地安装的浏览器版本并下载、配置对应版本的WebDriver。pip install webdriver-manager在代码中你可以这样使用from selenium import webdriver from selenium.webdriver.chrome.service import Service from webdriver_manager.chrome import ChromeDriverManager # 自动下载和管理ChromeDriver service Service(ChromeDriverManager().install()) driver webdriver.Chrome(serviceservice)这行代码会帮你完成所有繁琐的版本匹配和路径设置工作强烈推荐。2.3 IDE选择不只是写代码一个好的集成开发环境IDE能极大提升效率。对于Python自动化测试我的首选是VS Code和PyCharm。VS Code轻量、免费、插件生态丰富。你需要安装“Python”和“Pylance”这两个核心扩展它们能提供智能补全、代码检查、调试支持。对于刚入门或者喜欢简洁的开发者VS Code非常友好。PyCharm是JetBrains出品专为Python设计功能更为强大和专业。它的专业版对Web开发如Django和科学计算支持更好但社区版对于做自动化测试已经绰绰有余。PyCharm在代码重构、导航、以及内置的测试运行器方面体验更佳。我个人更倾向于使用PyCharm因为它对项目结构、虚拟环境的管理更加直观其内置的调试器在追踪复杂的自动化测试脚本问题时非常给力。你可以将断点打在click()操作之前然后一步步执行观察页面状态和变量变化这对于定位那些“时灵时不灵”的异步加载问题至关重要。3. Selenium核心操作与定位策略详解环境搭好了现在我们进入核心战场如何用代码告诉浏览器做什么。Selenium的操作可以概括为“找元素”和“操作元素”。3.1 八大元素定位法稳准狠地找到目标定位元素是自动化测试的基石。Selenium提供了多种定位方式你需要根据页面实际情况选择最稳定的一种。1. ID定位优先级最高。ID在HTML中应该是唯一的。driver.find_element(By.ID, “username”)2. Name定位常用于表单元素。driver.find_element(By.NAME, “password”)3. Class Name定位注意class可能有多个用空格分隔。driver.find_element(By.CLASS_NAME, “btn-primary”)4. Tag Name定位通过标签名定位如input,a。通常用于找多个同类元素。driver.find_elements(By.TAG_NAME, “input”)5. Link Text定位专门用于定位超链接a标签通过链接的完整文本。driver.find_element(By.LINK_TEXT, “忘记密码”)6. Partial Link Text定位通过链接的部分文本定位用于文本可能动态变化的情况。driver.find_element(By.PARTIAL_LINK_TEXT, “忘记”)7. CSS Selector定位功能强大语法灵活性能通常优于XPath。可以通过id、class、属性、层级关系等组合定位。driver.find_element(By.CSS_SELECTOR, “#loginForm .submit-btn”)8. XPath定位最强大的定位方式可以遍历XML/HTML文档的任何节点。但写起来复杂且性能相对较差。driver.find_element(By.XPATH, “//input[id‘username’]”)定位策略的心得首选ID因为唯一且稳定。其次是Name和Class但要注意是否唯一。对于复杂或动态元素CSS Selector是首选。它的语法更简洁浏览器原生支持解析速度更快。例如要找id为container的div下所有class包含item的li元素#container li.item。XPath作为最后的手段。虽然强大但表达式容易写得冗长且脆弱。特别是绝对路径以/开头的XPath页面结构稍有变动就会失效。尽量使用相对路径和属性结合如//button[contains(class, ‘search’)]。永远不要依赖页面上的文本或顺序来定位除非没有其他属性可用。文本内容是最容易变化的。3.2 常用操作API模拟真实用户行为找到元素后就可以对它进行操作了。这些操作都非常直观点击element.click()输入文本element.send_keys(“your_text”)。在输入前通常先用element.clear()清空原有内容。获取文本text element.text获取属性value element.get_attribute(“href”)判断是否显示/可用element.is_displayed(),element.is_enabled()一个完整的登录示例from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import Keys import time driver webdriver.Chrome() driver.get(“https://www.example.com/login”) # 定位用户名输入框并输入 username_input driver.find_element(By.ID, “username”) username_input.clear() username_input.send_keys(“testuser”) # 定位密码输入框并输入 password_input driver.find_element(By.NAME, “password”) password_input.send_keys(“securepassword123”) # 定位登录按钮并点击 login_button driver.find_element(By.CSS_SELECTOR, “button[type‘submit’]”) login_button.click() # 等待一下观察结果 time.sleep(2) driver.quit()注意上面的例子中使用了time.sleep(2)这是一种“强制等待”在实际项目中应尽量避免。我们后面会讲到更优雅的“显式等待”。3.3 处理特殊场景弹窗、iframe与多窗口真实的网页充满“惊喜”自动化脚本必须能处理这些特殊情况。1. 处理JavaScript弹窗Alert/Confirm/PromptSelenium 提供Alert类来处理。from selenium.webdriver.common.alert import Alert # 触发一个alert后 alert Alert(driver) # 获取弹窗文本 print(alert.text) # 点击“确定” alert.accept() # 点击“取消”针对confirm和prompt # alert.dismiss() # 向prompt弹窗输入文本 # alert.send_keys(“Some text”)2. 处理iframe内嵌框架如果元素位于iframe内部你必须先切换到该iframe下才能定位其中的元素。# 通过id或name切换 driver.switch_to.frame(“iframe_id_or_name”) # 或者通过定位到的iframe元素切换 iframe_element driver.find_element(By.TAG_NAME, “iframe”) driver.switch_to.frame(iframe_element) # 在iframe内操作元素... # ... # 操作完成后切回主文档 driver.switch_to.default_content() # 或者切回上一级iframe # driver.switch_to.parent_frame()忘记切换回主文档是导致后续元素定位失败的常见原因。3. 处理多窗口/标签页点击一个链接可能会打开新窗口你需要管理这些窗口句柄。# 获取当前所有窗口的句柄 main_window driver.current_window_handle all_windows driver.window_handles # 这是一个列表 # 点击某个打开新窗口的链接 driver.find_element(By.LINK_TEXT, “Open New Window”).click() # 等待新窗口出现简单处理 time.sleep(1) # 再次获取所有窗口句柄 new_windows driver.window_handles # 找到新出现的窗口句柄差集 new_window [window for window in new_windows if window not in all_windows][0] # 切换到新窗口 driver.switch_to.window(new_window) # 在新窗口操作... # ... # 关闭新窗口切回主窗口 driver.close() driver.switch_to.window(main_window)4. 等待机制解决自动化不稳定的头号元凶“脚本在本地运行得好好的一上服务器就报错找不到元素。”——这十有八九是等待没处理好。页面加载、元素渲染、AJAX请求都是需要时间的。4.1 三种等待方式剖析1. 强制等待time.sleep(seconds)这是最原始、最不推荐的方式。它让脚本无条件暂停固定时间。时间设短了元素还没加载出来设长了白白浪费执行时间降低效率。除非在极少数调试场景下否则应避免使用。2. 隐式等待driver.implicitly_wait(seconds)设置一个全局的等待时间。在查找任何元素时如果元素没有立即出现WebDriver会轮询DOM默认每0.5秒直到找到该元素或超时。它只对find_element和find_elements方法生效。driver.implicitly_wait(10) # 设置隐式等待10秒 element driver.find_element(By.ID, “dynamic-element”) # 会等待最多10秒缺点不够灵活无法等待特定的条件如元素可点击、元素包含特定文本。并且它一旦设置对整个driver生命周期都有效可能会在某些不需要等待的地方产生不必要的延迟。3. 显式等待WebDriverWait配合expected_conditions这是最强大、最推荐的等待方式。它允许你为某个特定的条件设置等待条件满足则立即继续超时则抛出异常。from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # 创建一个WebDriverWait对象设置最长等待时间10秒轮询间隔0.5秒默认 wait WebDriverWait(driver, 10) # 等待直到ID为‘submit-btn’的元素可被点击 submit_button wait.until(EC.element_to_be_clickable((By.ID, “submit-btn”))) submit_button.click() # 等待直到ID为‘result’的元素包含特定文本 result_element wait.until(EC.text_to_be_present_in_element((By.ID, “result”), “Success!”))4.2 Expected Conditions 常用条件expected_conditions模块提供了大量预定义的条件以下是最常用的几个presence_of_element_located: 元素出现在DOM中不一定可见、可点击。visibility_of_element_located: 元素不仅存在而且可见。element_to_be_clickable: 元素可见且可点击最常用。text_to_be_present_in_element: 元素包含特定文本。title_is/title_contains: 页面标题是/包含特定文字。alert_is_present: 出现JS弹窗。实战心得混合使用隐式和显式等待是常见做法。通常我会设置一个较短的全局隐式等待如5秒作为基础保障。然后在关键交互点如点击按钮后等待页面跳转或新内容加载使用更精确的显式等待。显式等待的超时时间不宜过长。一般10-15秒足够。超时意味着很可能出问题了应该尽快失败并记录日志而不是无谓地等待。自定义等待条件。如果内置条件不满足需求你可以传入一个自定义的函数callable。例如等待某个元素的某个属性值变化def element_attribute_contains(driver, locator, attribute, value): def _predicate(driver): try: element driver.find_element(*locator) return value in element.get_attribute(attribute) except StaleElementReferenceException: return False return _predicate # 使用自定义条件 wait.until(element_attribute_contains((By.ID, “progress-bar”), “style”, “width: 100%”))5. 构建可维护的自动化测试框架写几个独立的测试脚本不难难的是如何管理几十上百个测试用例让它们易于编写、维护和运行。这就需要引入一些框架设计和最佳实践。5.1 Page Object Model (POM)页面对象模型这是Selenium自动化测试中最核心的设计模式。其核心思想是将测试代码业务逻辑与页面定位细节分离。传统脚本的问题# 不好的写法定位器和操作混杂在测试逻辑里 def test_login(): driver.find_element(By.ID, “username”).send_keys(“user”) driver.find_element(By.ID, “password”).send_keys(“pass”) driver.find_element(By.ID, “loginBtn”).click() assert “Welcome” in driver.page_source如果登录页面的输入框ID从username改成了userName你需要修改所有用到这个定位的测试脚本。POM的解决方案创建页面对象类每个页面或页面中的重要组件对应一个类。封装页面元素将页面的所有元素定位器如By.ID, “username”作为这个类的属性。封装页面操作将在这个页面上可能进行的操作如登录、搜索封装成这个类的方法。示例# pages/login_page.py from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC class LoginPage: # 定位器 USERNAME_INPUT (By.ID, “username”) PASSWORD_INPUT (By.NAME, “password”) LOGIN_BUTTON (By.CSS_SELECTOR, “button[type‘submit’]”) ERROR_MESSAGE (By.CLASS_NAME, “alert-error”) def __init__(self, driver): self.driver driver self.wait WebDriverWait(driver, 10) def enter_username(self, username): element self.wait.until(EC.visibility_of_element_located(self.USERNAME_INPUT)) element.clear() element.send_keys(username) return self # 支持链式调用 def enter_password(self, password): self.driver.find_element(*self.PASSWORD_INPUT).send_keys(password) return self def click_login(self): self.wait.until(EC.element_to_be_clickable(self.LOGIN_BUTTON)).click() from pages.home_page import HomePage # 避免循环导入 return HomePage(self.driver) # 返回下一个页面的对象 def get_error_message(self): try: return self.driver.find_element(*self.ERROR_MESSAGE).text except: return None # tests/test_login.py import pytest from pages.login_page import LoginPage def test_valid_login(driver): # 假设driver通过fixture注入 home_page LoginPage(driver)\ .enter_username(“valid_user”)\ .enter_password(“valid_pass”)\ .click_login() assert home_page.is_welcome_message_displayed() def test_invalid_login(driver): login_page LoginPage(driver) login_page.enter_username(“invalid”) login_page.enter_password(“invalid”) login_page.click_login() # 点击后仍停留在登录页 assert “Invalid credentials” in login_page.get_error_message()POM的优势高可维护性页面元素定位器只在一处定义。UI变更时只需修改对应的Page类。高可读性测试用例读起来像自然语言清晰表达了业务逻辑。低冗余页面操作被复用避免了代码重复。5.2 测试用例的组织与运行有了页面对象我们还需要一个框架来组织测试用例、管理测试前置后置条件、生成报告。pytest是目前Python生态中最主流、最强大的测试框架远超原生的unittest。为什么选择pytest简洁不需要写类函数加上test_前缀就是测试用例。强大的Fixture用于提供测试依赖如初始化driver、清理数据可以灵活设定作用范围函数、类、模块、会话。丰富的插件生态如生成HTML报告pytest-html、并行执行pytest-xdist、控制执行顺序等。参数化测试轻松用多组数据运行同一个测试逻辑。基础项目结构your_automation_project/ ├── conftest.py # pytest全局配置定义fixture ├── requirements.txt # 项目依赖 ├── pages/ # 页面对象类 │ ├── __init__.py │ ├── login_page.py │ └── home_page.py ├── tests/ # 测试用例 │ ├── __init__.py │ ├── test_login.py │ └── test_search.py ├── utils/ # 工具函数如读取配置文件、处理数据 │ ├── __init__.py │ └── config_reader.py └── reports/ # 测试报告输出目录自动生成一个典型的conftest.py示例# conftest.py import pytest from selenium import webdriver from selenium.webdriver.chrome.service import Service from webdriver_manager.chrome import ChromeDriverManager pytest.fixture(scope“function”) # 每个测试函数执行一次 def driver(): “”“初始化WebDriver”“” # 创建Chrome选项可配置无头模式、禁用沙盒等 chrome_options webdriver.ChromeOptions() # chrome_options.add_argument(“--headless”) # 无头模式不打开浏览器窗口 chrome_options.add_argument(“--no-sandbox”) chrome_options.add_argument(“--disable-dev-shm-usage”) chrome_options.add_argument(“--disable-gpu”) chrome_options.add_argument(“--window-size1920,1080”) service Service(ChromeDriverManager().install()) driver_instance webdriver.Chrome(serviceservice, optionschrome_options) yield driver_instance # 将driver实例提供给测试用例 # 测试结束后执行清理 driver_instance.quit() pytest.fixture(scope“session”) # 整个测试会话只执行一次 def base_url(): “”“返回基础测试URL”“” return “https://www.your-test-site.com”一个使用fixture的测试用例# tests/test_login.py import pytest from pages.login_page import LoginPage class TestLogin: def test_admin_login(self, driver, base_url): “”“测试管理员登录”“” driver.get(f“{base_url}/login”) login_page LoginPage(driver) home_page login_page.login(“admin”, “admin123”) assert home_page.get_welcome_text() “Welcome, Admin” pytest.mark.parametrize(“username, password, expected_error”, [ (“”, “pass123”, “Username is required”), (“user”, “”, “Password is required”), (“wrong”, “wrong”, “Invalid login credentials”), ]) def test_login_failure_cases(self, driver, base_url, username, password, expected_error): “”“参数化测试多种登录失败场景”“” driver.get(f“{base_url}/login”) login_page LoginPage(driver) login_page.enter_username(username) login_page.enter_password(password) login_page.click_login() # 假设登录失败后仍停留在登录页并显示错误信息 actual_error login_page.get_error_message() assert expected_error in actual_error运行测试只需在项目根目录执行pytest tests/ -v --htmlreports/report.html。-v显示详细信息--html生成漂亮的HTML报告。6. 高级技巧与实战避坑指南掌握了基础框架我们再来看看那些能让你的自动化脚本从“能用”到“健壮、高效、优雅”的高级技巧和常见陷阱。6.1 处理动态元素与AJAX加载现代网页大量使用JavaScript动态加载内容元素可能稍后才出现或者状态不断变化。策略1更智能的显式等待。不要只等待元素出现要等待它进入“可交互”的稳定状态。element_to_be_clickable比visibility_of_element_located更好因为它确保了元素不仅可见而且未被禁用。策略2使用相对定位和模糊匹配。如果元素的ID或Class是动态生成的如item_12345不要试图匹配完整字符串。CSS Selector:使用属性前缀、后缀或包含选择器。[id^‘item_’]选择id以‘item_’开头的元素。[class*‘btn-’]选择class包含‘btn-’的元素。XPath:使用contains(),starts-with()函数。//div[contains(id, ‘item_’)]//button[starts-with(class, ‘btn-’)]策略3重试机制。有时候即使等待了由于网络波动或前端框架的微妙时机操作仍可能失败。可以封装一个带重试的操作函数。from selenium.common.exceptions import StaleElementReferenceException, ElementClickInterceptedException import time def retry_click(element, retries3, delay1): “”“尝试点击元素失败后重试”“” for attempt in range(retries): try: element.click() return True except (StaleElementReferenceException, ElementClickInterceptedException) as e: if attempt retries - 1: raise e print(f“点击失败第{attempt1}次重试...”) time.sleep(delay) # 可能需要重新定位元素这里简化处理 return False6.2 测试数据管理测试数据如用户名、密码、商品信息不应该硬编码在测试脚本里。推荐的方式是外部化。1. 使用配置文件如JSON, YAML, .ini// config/test_data.json { “users”: { “admin”: {“username”: “admin”, “password”: “admin123”, “role”: “administrator”}, “customer”: {“username”: “test_customer”, “password”: “pass123”, “role”: “customer”} }, “products”: { “sample”: {“name”: “Test Product”, “sku”: “TP-001”, “price”: 99.99} } }在代码中用json.load()读取。2. 使用环境变量或.env文件对于敏感信息如真实环境的登录凭证使用python-dotenv包管理。# .env文件 TEST_USERNAMEautomation_user TEST_PASSWORDsuper_secret BASE_URLhttps://staging.example.com3. 使用数据文件CSV, Excel当需要大量参数化数据时可以使用pandas读取CSV或Excel文件。6.3 日志与报告让问题无处可藏当测试在无人值守的服务器上运行时详细的日志和清晰的报告是定位问题的生命线。1. 使用Python标准库loggingimport logging logging.basicConfig( levellogging.INFO, format‘%(asctime)s - %(name)s - %(levelname)s - %(message)s’, handlers[ logging.FileHandler(“automation.log”), # 输出到文件 logging.StreamHandler() # 输出到控制台 ] ) logger logging.getLogger(__name__) # 在代码中记录 logger.info(“开始执行登录测试...”) try: login_page.click_login() logger.info(“登录按钮点击成功”) except Exception as e: logger.error(f“点击登录按钮失败: {e}”) # 可以附加截图 driver.save_screenshot(“login_error.png”)2. 集成Allure报告虽然pytest-html不错但Allure报告更加美观、强大能展示测试层级、附件截图、日志、步骤描述等。安装pip install allure-pytest。运行pytest tests/ -v --alluredir./allure-results。生成报告allure serve ./allure-results需要先安装Allure命令行工具。3. 失败自动截图这是必备的调试手段。可以通过pytest的钩子函数hook实现全局的失败截图。# conftest.py import pytest from datetime import datetime pytest.hookimpl(hookwrapperTrue) def pytest_runtest_makereport(item, call): “”“在每个测试执行后生成报告如果失败则截图”“” outcome yield report outcome.get_result() if report.when “call” and report.failed: # 获取测试用例中的driver fixture for fixture_name in item.fixturenames: if “driver” in fixture_name: driver item.funcargs[fixture_name] break else: return # 生成截图文件名 timestamp datetime.now().strftime(“%Y%m%d_%H%M%S”) screenshot_name f“{item.name}_{timestamp}.png” screenshot_path f“./screenshots/{screenshot_name}” driver.save_screenshot(screenshot_path) # 将截图路径附加到测试报告中Allure报告支持 if hasattr(report, “extra”): report.extra.append(pytest.allure.attach.file(screenshot_path, name“失败截图”, attachment_typepytest.allure.attachment_type.PNG))6.4 常见疑难杂症与解决方案问题1ElementNotInteractableException或ElementClickInterceptedException原因元素被其他元素如弹窗、遮罩层、另一个div遮挡或者元素当前不可见/不可交互如disabled状态。解决使用element_to_be_clickable等待条件。检查是否有弹窗需要先关闭。尝试用JavaScript直接点击driver.execute_script(“arguments[0].click();”, element)。这能绕过一些前端框架的交互检测。如果被固定导航栏遮挡可以滚动元素到视图中心driver.execute_script(“arguments[0].scrollIntoView({block: ‘center’});”, element)问题2StaleElementReferenceException原因你之前找到并存储在一个变量里的元素由于页面刷新、AJAX更新或DOM重排已经“过期”了。你持有的引用指向了一个旧的、不再属于当前DOM树的元素。解决最根本的避免在页面可能刷新的操作后使用旧的元素引用。在每次需要操作前重新查找元素。在Page Object的方法内部进行元素查找而不是在测试用例中存储元素对象。使用重试机制如上面retry_click的例子在捕获到此异常时重新定位元素。问题3 文件上传原因通过input type“file”上传文件时不能使用send_keys()直接操作那个隐藏的input而是需要先点击触发文件选择对话框的元素通常是一个按钮但Selenium无法与系统文件对话框交互。解决直接找到文件上传的input元素然后send_keys(文件绝对路径)。前提是这个input元素是可见的或者至少是存在于DOM中的。# 假设有一个隐藏的file input其id为‘file-upload’ upload_input driver.find_element(By.ID, “file-upload”) # 直接发送文件路径不要点击 upload_input.send_keys(“/Users/yourname/Downloads/test_file.pdf”)如果页面是通过点击一个按钮触发了隐藏的input你可能需要先执行JavaScript让这个input变为可交互状态。问题4 下拉选择框Select原因对于标准的HTMLselect元素Selenium提供了专门的Select类。解决from selenium.webdriver.support.ui import Select select_element driver.find_element(By.NAME, “country”) select Select(select_element) # 三种选择方式 select.select_by_value(“us”) # 通过value属性 select.select_by_visible_text(“United States”) # 通过显示的文本 select.select_by_index(1) # 通过索引从0开始 # 获取所有选项 all_options select.options for option in all_options: print(option.text)自动化测试是一条持续学习和优化的路。从编写第一个简单的脚本到构建一个健壮、可维护的测试框架你会不断遇到新的挑战比如测试分布式系统、集成CI/CD管道、管理测试环境与数据。但只要你掌握了PythonSelenium这个核心组合理解了等待机制、POM设计模式并学会了如何排查和解决常见问题你就已经具备了应对这些挑战的坚实基础。记住好的自动化测试不是一蹴而就的它需要像开发产品代码一样被精心设计、重构和维护。

Python+Selenium自动化测试：从环境搭建到POM框架实战

相关新闻