3步教你用AI大模型+Python實現web自動化:一套提示詞完成所有AI自動化指令
為什么要用AI大模型+Python做web自動化?
Python因其簡潔易用和豐富的生態系統,成為自動化領域的首選語言。Playwright作為微軟推出的跨瀏覽器自動化框架,支持Chromium、Firefox和WebKit,功能強大且穩定。結合AI大模型的智能對話能力,我們可以讓瀏覽器“聽懂”指令,自動完成復雜任務,極大提升工作效率。
@
- 為什么要用AI大模型+Python做web自動化?
- 一、環境的安裝
1、前提條件
2、創建虛擬環境以及對應包
- 二、獲取大模型API
- 三、代碼的編寫
- 結語
一、環境的安裝
1、前提條件
- 已安裝 Python(建議 3.7 及以上版本)
- 已配置好 Python 環境變量(可在命令行輸入?
?python --version?
? 驗證) - Windows 操作系統(本文以 PowerShell 為例)
2、創建虛擬環境以及對應包
- 打開 PowerShell,進入你想創建項目的目錄,例如:
cd D:\browser-use
- 創建名為?
?browserUse?
? 的虛擬環境:
python -m venv browserUse
該命令會在當前目錄下生成一個名為 ??browserUse?
? 的文件夾,里面包含獨立的 Python 運行環境。
- 激活虛擬環境:
.\browserUse\Scripts\activate
激活后,命令行提示符通常會出現 ??(browserUse)?
?,表示當前處于該虛擬環境中。
在這里插入圖片描述
- 升級 pip(Python 包管理器)到最新版本,確保安裝包順利:
pip install --upgrade pip
- 安裝 browser-use 包:
pip install browser-use
- 安裝 Playwright Python 包:
pip install playwright
- 安裝 Playwright 瀏覽器驅動
Playwright 需要下載對應的瀏覽器二進制文件,執行以下命令:
python -m playwright install
該命令會自動下載 Chromium、Firefox、WebKit 等瀏覽器驅動,確保 Playwright 可以正常運行。
示例圖如下:
二、獲取大模型API
在瀏覽器中打開能用AI API,根據下面的圖片教程獲取自己的Base_url 和 Api_key。https://ai.nengyongai.cn/register?aff=PEeJ
根據此步驟我們可以獲取到兩個重要的數據:
Base_url = "https://ai.nengyongai.cn/v1"
Api_key = "你自己的key"
三、代碼的編寫
下面是一個完整示例,演示如何用用AI大模型+Python實現自動打開瀏覽器,搜索“今天的天氣”,并輸出我們想要的結果。
# 導入所需的模塊和類
from langchain_openai import ChatOpenAI # 用于調用自研大模型接口
from browser_use import Agent, Browser, BrowserConfig # 瀏覽器自動化相關類
import asyncio # 異步編程模塊
from dotenv import load_dotenv # 用于加載環境變量
import os # 操作系統接口模塊
# 加載當前目錄下的.env文件中的環境變量
load_dotenv()
# 設置Base_url接口地址
Base_url = "https://ai.nengyongai.cn/v1"
# 這里填寫你自己的Api_key,建議放在環境變量中,避免明文寫在代碼里
Api_key = "你自己的key"
# 將Api_key設置到環境變量中,供ChatOpenAI調用
os.environ["OPENAI_API_KEY"] = Api_key
# 創建一個瀏覽器實例,配置如下:
browser = Browser(
cnotallow=BrowserConfig(
headless=False, # 是否無頭瀏覽器,False表示有界面,方便調試
disable_security=True, # 禁用瀏覽器安全策略,方便跨域等操作
)
)
# 定義異步主函數
asyncdef main():
try:
# 創建一個Agent實例,負責執行任務
agent = Agent(
task="""
1、訪問https://www.baidu.com/,
2、搜索內容為“今天的天氣”,
3、將今天的天氣內容輸出出來.
""", # 任務描述,告訴Agent要做什么
llm=ChatOpenAI(
model='gpt-4o-mini', # 使用的模型名稱
base_url=Base_url, # base_url
api_key=Api_key # api_key
),
)
# 運行Agent,執行任務,返回結果
result = await agent.run()
# 打印任務執行結果
print(result)
except Exception as e:
# 如果運行過程中出現異常,捕獲并打印錯誤信息
print(f"運行出錯: {e}")
# 程序入口,運行異步主函數
if __name__ == '__main__':
asyncio.run(main())
我們直接右鍵運行,這里差不多要等到5-10秒鐘,才能自己執行web自動化。(注意:windows如果出現了啟動報錯等問題,那么請直接關閉殺毒軟件。因為殺毒軟件會阻止我們啟動瀏覽器。)
我們可以看到它根據提示詞的指示,自動獲取啟動瀏覽器,去完成我們的目標。
結語
用AI大模型+Python做Web自動化,不僅是技術的結合,更是緊跟時代以及提升效率的開始。原先的我們需要用到各種定位,現在只需簡單幾步,你就能讓電腦幫你完成繁瑣的瀏覽器操作,希望這篇文章能幫你快速入門,開啟自動化新篇章!
本文轉載自????愛學習的蝌蚪????,作者:hpstream
