成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

用Python爬取天氣并且語言播報

作者：程序員小鵬 2020-11-03 14:10:45

爬蟲是爬取網頁的相關內容，了解HTML能夠幫助你更好的理解網頁的結構、內容等。 TCP/IP協議，HTTP協議這些知識了解一下就可以，能夠讓你了解在網絡請求和網絡傳輸上的基本原理，這次的小案例用不到。

一、預備知識

此案例實現功能：利用網絡爬蟲，爬取某地的天氣，并打印和語音播報。要用到requests庫，lxml庫，pyttsx3庫，沒有的，可以先安裝一下，都可以通過pip安裝：

pip install requests 
pip install lxml 
pip install pyttsx3

Requests庫是個功能很強大的網絡請求庫，可以實現跟瀏覽器一樣發送各種HTTP請求來獲取網站的數據。

Lxml庫是處理XML和HTML功能最豐富，最易于使用的庫，通常用lxml庫中的etree使HTML轉化為文檔。

Pyttsx3庫是一個很簡單的播放語音的庫，你給它什么，它就讀什么，當然別在意生硬的語氣。基本用法如下：

import pyttsx3 
 
word = pyttsx3.init() 
 
word.say('你好') 
# 關鍵一句，沒有這行代碼，不會播放語音 
word.runAndWait()

碼字不易廢話兩句：有需要學習資料的或者有技術問題交流可以私信小編發送“01”即可

爬蟲是爬取網頁的相關內容，了解HTML能夠幫助你更好的理解網頁的結構、內容等。 TCP/IP協議，HTTP協議這些知識了解一下就可以，能夠讓你了解在網絡請求和網絡傳輸上的基本原理，這次的小案例用不到。

二、詳細說一說

2.1. get請求目標網址

我們首先導入requests庫，然后就用它來獲取目標的網頁，我們請求的是天氣網站中的北京天氣。

import requests 
# 向目標url地址發送請求，返回一個response對象 
req = requests.get('https://www.tianqi.com/beijing/') 
# .text是response對象的網頁html 
print(req.text)

打印出的結果就是網站上顯示的內容，瀏覽器就是通過這些內容“解析”出來我們看到的結構如下：

用python爬取天氣并且語言播報

我們請求后的獲得的數據

用python爬取天氣并且語言播報

注意啦，小伙伴們有很大可能運行之后得不到網頁代碼，而是顯示403，這是什么意思呢?

403錯誤是一種在網站訪問過程中，常見的錯誤提示，表示資源不可用。服務器理解客戶的請求，但拒絕處理它。

我們寫的爬蟲一般會默認告訴服務器，自己發送一個Python爬取請求，而很多的網站都會設置反爬蟲的機制，不允許被爬蟲訪問的。

所以，我們想讓目標服務器響應，那就把我們的爬蟲進行一下偽裝。此小案例就用常用的更改User-Agent字段進行偽裝。

改一下之前的代碼，將爬蟲偽裝成瀏覽器請求，這樣就可以進行正常的訪問了。

import requests 
 
headers = {'content-type':'application/json', 'User-Agent':'Mozilla/5.0 (Xll; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0'} 
 
# 向目標url地址發送請求，返回一個response對象 
req = requests.get('https://www.tianqi.com/beijing/',headers=headers) 
# .text是response對象的網頁html 
print(req.text)

User-Agent字段怎么來的呢?我們以Chrome瀏覽器為例子，先隨便打開一個網頁，按鍵盤的F12或在空白處點擊鼠標右鍵選擇“檢查”;然后刷新網頁，點擊“Network”再點擊“Doc”，點擊Headers，在信息欄查看Request Headers的User-Agent字段，直接復制，咱們就可以用啦。

2.2. lxml.etree登場

我們從網頁請求獲得的數據繁雜，其中只有一部分是我們真正想得到的數據，例如我們從天氣的網站中查看北京的天氣，只有下圖中使我們想要得到的，我們如如何提取呢?這就要用到lxml.etree。

用python爬取天氣并且語言播報

整個代碼中只有一小部分我們想要的信息，我們發現想要的天氣、溫度啊都在“class='weather_info'”這一層級下，那這就好辦了。我們在請求的代碼的后面加上：

html_obj = etree.HTML(html) 
html_data = html_obj.xpath("//d1[@class='weather_info']//text()")

我們print(html_data)一下看看提取是不是我們想要的數據。

用python爬取天氣并且語言播報

發現連網頁中換行符啊什么的也都提取出來了，還有，別忘了，提取出來的是列表哦。我們還要做一下處理。

word = "歡迎使用天氣播報助手" 
 
for data in html_data: 
    word += data

處理完我們打印一下看看，嗯，我們想要的都有了。不過還多了一個[切換城市]，我們精益求精，最后把這個最后再去掉。

用python爬取天氣并且語言播報

2.3. 把結果說出來

我們想要的數據都在word變量里啦，現在就讓他讀出來，用pyttsx3這個庫，

ptt = pyttsx3.init() 
ptt.say(word) 
ptt.runAndWait()

好的，現在都已完成。我們一步一步都摸索過來，現在整合在一起，最后播放效果還是不錯的，這是一次很美好的爬蟲之旅，期待下次爬取!

責任編輯：未麗燕來源：今日頭條

Python 爬取天氣爬蟲

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：欧美老少妇一级特黄一片 | 欧美成人一区二区三区 | 久色网 | 久久久久91 | 欧洲av一区 | 欧美日韩免费 | 精品久久久一区二区 | 91资源在线观看 | 日韩视频专区 | 成人国产精品色哟哟 | 久久久毛片 | 国产精品一区二区视频 | 二区不卡 | 天天艹日日干 | 嫩呦国产一区二区三区av | 日本一区二区高清视频 | 亚洲成人三区 | 国产成人免费视频 | 久久久精品一区二区 | 欧美色综合天天久久综合精品 | 尹人av | 亚洲日本乱码在线观看 | eeuss国产一区二区三区四区 | 成人精品一区二区三区四区 | 国产在线精品免费 | 国产91av视频在线观看 | 国产精品网址 | 超碰97人人人人人蜜桃 | 97超碰站 | 日韩福利在线观看 | 欧美一区在线视频 | 久久久国产一区二区三区 | 色频 | 日韩欧美中文字幕在线视频 | 99av成人精品国语自产拍 | 欧美精品一区二区三区四区五区 | 久久久久久久久久爱 | a中文在线视频 | 免费国产视频 | 99国产精品视频免费观看一公开 | 欧美日一区二区 |