成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python3實現火車票查詢工具

開發 前端
使用 Python3抓取12306 網站信息提供一個命令行的火車票查詢工具。通過該項目的實現,可以熟悉 Python3 基礎及網絡編程,以及 docopt,requests,prettytable 等庫的使用。

[[170826]]

項目簡介:使用 Python3 抓取 12306 網站信息提供一個命令行的火車票查詢工具。通過該項目的實現,可以熟悉 Python3 基礎及網絡編程,以及 docopt,requests,prettytable 等庫的使用。

項目由小蝸牛發布在實驗樓,項目在線練習地址:Python3 實現火車票查詢工具,可以直接在教程中下載代碼使用demo。

一、實驗簡介

當你想查詢一下火車票信息的時候,你還在上 12306 官網嗎?或是打開你手機里的 APP?

下面讓我們來用 Python 寫一個命令行版的火車票查看器, 只要在命令行敲一行命令就能獲得你想要的火車票信息!如果你剛掌握了Python基礎,這將是個不錯的小練習。

1.1 知識點

  • Python3 基礎知識的綜合運用
  • docopt、requests 及 prettytable 庫的使用

1.2 效果截圖

 

二、接口設計

一個應用寫出來最終是要給人使用的,哪怕只是給你自己使用。

所以,首先應該想想你希望怎么使用它?讓我們先給這個小應用起個名字吧,既然及查詢票務信息,那就叫它 tickets 好了。

我們希望用戶只要輸入出發站,到達站以及日期就讓就能獲得想要的信息,比如要查看8月25號上海-北京的火車余票, 我們只需輸入:

  1. $ tickets shanghai beijing 2016-08-25 

注意: 由于實驗樓環境中無法輸入中文,所以我們的參數設計為拼音的形式,在這里思考下使用拼音是否有什么弊端?

對這一接口進行抽象得到:

  1. $ tickets from to date 

另外,火車有各種類型,高鐵、動車、特快、快速和直達,我們希望可以提供選項只查詢特定的一種或幾種的火車,所以,我們應該有下面這些選項:

  • -g 高鐵
  • -d 動車
  • -t 特快
  • -k 快速
  • -z 直達

這幾個選項應該能被組合使用,所以,最終我們的接口應該是這個樣子的:

  1. $ tickets [-gdtkz] from to date 

接口已經確定好了,剩下的就是實現它了。

三、代碼實現

首先安裝一下實驗需要用到的庫:

  1. $ sodo pip install requests prettytable docopt 
  • requests, 不用不多介紹了吧,使用 Python 訪問 HTTP 資源的必備庫。
  • docopt, Python3 命令行參數解析工具。
  • prettytable, 格式化信息打印工具,能讓你像 MySQL 那樣打印數據。

3.1 解析參數

Python有很多寫命令行參數解析工具,如 argparse, docopt, click,這里我們選用的是 docopt 這個簡單易用的工具。docopt 可以按我們在文檔字符串中定義的格式來解析參數,比如我們在 tickets.py:

注意: 實驗樓中無法輸入中文,參數后的中文可以使用拼音代替。

  1. # coding: utf-8 
  2. """Train tickets query via command-line. 
  3.  
  4. Usage: 
  5.     tickets [-gdtkz] <from> <to> <date
  6.  
  7. Options: 
  8.     -h,--help   顯示幫助菜單 
  9.     -g          高鐵 
  10.     -d          動車 
  11.     -t          特快 
  12.     -k          快速 
  13.     -z          直達 
  14.  
  15. Example: 
  16.     tickets beijing shanghai 2016-08-25 
  17. ""
  18. from docopt import docopt 
  19.  
  20. def cli(): 
  21.     """command-line interface""" 
  22.     arguments = docopt(__doc__) 
  23.     print(arguments) 
  24.  
  25. if __name__ == '__main__'
  26.     cli()  

下面我們運行一下這個程序:

  1. $ python3 tickets.py beijing shanghai 2016-08-25 

我們得到下面的結果:

 

3.2 獲取數據

參數已經解析好了,下面就是如何獲取數據了,這也是最主要的部分。首先我們打開 12306,進入余票查詢頁面,如果你使用 Chrome,那么按 F12 打開開發者工具,選中 Network 一欄,在查詢框鐘我們輸入 上海 到 北京,日期 2016-08-25, 點擊查詢,我們在調試工具發現,查詢系統實際上請求了這個URL:

https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate=2016-07-01&from_station=SHH&to_station=BJP

并且返回的是JSON格式的數據!

接下來問題就簡單了,我們只需要構建請求URL然后解析返回的Json數據就可以了。但是我們發現,URL里面 from_station 和 to_station 并不是漢字或者拼音,而是一個代號,而我們想要輸入的是漢字或者拼音,我們要如何獲取代號呢?我們打開網頁源碼看看有沒有什么發現。

果然,我們在網頁里面找到了這個鏈接:https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955 這里面貌似是包含了所有車站的中文名,拼音,簡寫和代號等信息。但是這些信息擠在一起,而我們只想要車站的拼音和大寫字母的代號信息,怎么辦呢?

正則表達式就是答案,我們寫個小腳本來匹配提取出想要的信息吧, 在parse_station.py中:

  1. # coding: utf-8 
  2.  
  3. import re 
  4. import requests 
  5. from pprint import pprint 
  6.  
  7.  
  8. url = 'https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.8955' 
  9. text = requests.get(url, verify=False
  10. stations = re.findall(r'([A-Z]+)\|([a-z]+)', text) 
  11. stations = dict(stations) 
  12. stations = dict(zip(stations.values(), stations.keys())) 
  13. pprint(stations, indent=4) 

注意,上面的正則表達式匹配出的結果轉為字典后,字典的鍵是大寫字母大號,這顯然不是我們想要的結果,于是,我們通過一個變換將鍵值反過來。 我們運行這個腳本,它將以字典的形式返回所有車站和它的大寫字母代號, 我們將結果重定向到 stations.py 中,

  1. $ python3 parse_station.py > stations.py 

我們為這個字典加名字,stations, 最終,stations.py文件是這樣的:

 

現在,用戶輸入車站的中文名,我們就可以直接從這個字典中獲取它的字母代碼了:

  1. ... 
  2. from stations import stations 
  3.  
  4. def cli(): 
  5.     arguments = docopt(__doc__) 
  6.     from_staion = stations.get(arguments['<from>']) 
  7.     to_station = stations.get(arguments['<to>']) 
  8.     date = arguments['<date>'
  9.     # 構建URL 
  10.     url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format( 
  11.         date, from_staion, to_station 
  12.     )  

萬事俱備,下面我們來請求這個URL獲取數據吧!這里我們使用 requests 這個庫, 它提供了非常簡單易用的接口,

  1. ... 
  2. import requests 
  3.  
  4. def cli(): 
  5.     ... 
  6.     # 添加verify=False參數不驗證證書 
  7.     r = requests.get(url, verify=False
  8.     print(r.json())  

從結果中,我們可以觀察到,與車票有關的信息需要進一步提取:

  1. def cli(): 
  2.     ... 
  3.     r = requsets.get(url); 
  4.     rows = r.json()['data']['datas' 

3.3 解析數據

我們封裝一個簡單的類來解析數據:

  1. from prettytable import PrettyTable 
  2.  
  3.  
  4. class TrainCollection(object): 
  5.  
  6.     # 顯示車次、出發/到達站、 出發/到達時間、歷時、一等坐、二等坐、軟臥、硬臥、硬座 
  7.     header = 'train station time duration first second softsleep hardsleep hardsit'.split() 
  8.  
  9.     def __init__(self, rows): 
  10.         self.rows = rows 
  11.  
  12.     def _get_duration(self.row): 
  13.         ""
  14.         獲取車次運行時間 
  15.         ""
  16.         duration = row.get('lishi').replace(':''h') + 'm' 
  17.         if duration.startswith('00'): 
  18.             return duration[4:] 
  19.         if duration.startswith('0'): 
  20.             return duration[1:] 
  21.         return duration 
  22.  
  23.     @property 
  24.     def trains(self): 
  25.         for row in self.rows
  26.             train = [ 
  27.                 # 車次 
  28.                 row['station_train_code'], 
  29.                 # 出發、到達站 
  30.                 '\n'.join([row['from_staion_name'], row['to_station_name']]), 
  31.                 # 出發、到達時間 
  32.                 '\n'.join([row['start_time'], row['arrive']]), 
  33.                 # 歷時 
  34.                 self._get_duration(row), 
  35.                 # 一等坐 
  36.                 row['zy_num'], 
  37.                 # 二等坐 
  38.                 row['ze_num'], 
  39.                 # 軟臥 
  40.                 row['rw_num'], 
  41.                 # 軟坐 
  42.                 row['yw_num'], 
  43.                 # 硬坐 
  44.                 row['yz_num'
  45.             ] 
  46.             yield train 
  47.  
  48.     def pretty_print(self): 
  49.         ""
  50.         數據已經獲取到了,剩下的就是提取我們要的信息并將它顯示出來。 
  51.         `prettytable`這個庫可以讓我們它像MySQL數據庫那樣格式化顯示數據。 
  52.         ""
  53.         pt = PrettyTable() 
  54.         # 設置每一列的標題 
  55.         pt._set_field_names(self.header) 
  56.         for train in self.trains: 
  57.             pt.add_row(train) 
  58.         print(pt)  

3.4 顯示結果

最后,我們將上述過程進行匯總并將結果輸出到屏幕上: 

  1. ... 
  2.  
  3. class TrainCollection: 
  4.     ... 
  5.     ... 
  6.  
  7. def cli(): 
  8.     arguments = docopt(__doc__) 
  9.     from_staion = stations.get(arguments['<from>']) 
  10.     to_station = stations.get(arguments['<to>']) 
  11.     date = arguments['<date>'
  12.     # 構建URL 
  13.     url = 'https://kyfw.12306.cn/otn/lcxxcx/query?purpose_codes=ADULT&queryDate={}&from_station={}&to_station={}'.format( 
  14.         date, from_staion, to_station 
  15.     ) 
  16.     r = requests.get(url, verify=False
  17.     rows = r.json()['data']['datas'
  18.     trains = TrainCollection(rows
  19.     trains.pretty_print() 
  20.  
  21.  
  22. if __name__ == '__main__'
  23.     cli()  

3.5 最后一米

至此, 程序的主體已經完成了, 但是上面打印出的結果是黑白的,很是乏味,我們來給它添加顏色吧:

  1. def colored(color, text): 
  2.     table = { 
  3.         'red''\033[91m'
  4.         'green''\033[92m'
  5.         # no color 
  6.         'nc''\033[0' 
  7.     } 
  8.     cv = table.get(color) 
  9.     nc = table.get('nv'
  10.     return ''.join([cv, text, nc])  

修改一下程序,將出發車站與出發時間顯示為紅色, 將到達車站與到達時間顯示為綠色: 

  1. ... 
  2. '\n'.join([colored('green', row['from_staion_name']) 
  3.            colored('red', row['to_station_name'])]), 
  4. '\n'.join([colored('green', row['start_time']) 
  5.            colored('red', row['arrive_time'])]), 
  6. ...  

四、總結

本課程使用 Python3 抓取 12306 網站信息提供一個命令行的火車票查詢工具。通過該項目的實現,可以學習并實踐 Python3 基礎及網絡編程,以及 docopt,requests,prettytable 等庫的使用。

感興趣的同學可以實現更多擴展功能:

  • 顯示商務坐, 無坐
  • 添加參數支持,用戶可以指定火車類型
  • 支持更多的時間格式,如:20161010

本項目的完整代碼及demo,可在實驗樓查看并在線完成,立即【開始實驗

更多Python經典項目:Python全部 - 課程

責任編輯:龐桂玉 來源: segmentfault
相關推薦

2018-01-10 22:19:44

2011-01-24 15:37:32

火車票

2012-01-05 13:14:42

火車票

2023-09-15 09:34:54

2020-12-18 08:55:20

Python火車票代碼

2018-12-29 16:24:58

Python12306火車票

2018-01-02 09:56:04

Python12306火車票

2023-07-07 14:18:57

攜程實踐

2011-01-28 15:48:11

Chrome插件Page Monito火車票

2022-09-09 15:49:03

攜程火車票組件化管理優化

2015-03-18 15:05:12

12306驗證碼

2022-04-27 13:36:18

12306鐵路12306

2013-01-07 17:34:47

火車票搶票瀏覽器

2012-11-15 09:40:18

2019-04-26 15:16:02

馬蜂窩火車票系統

2023-06-28 14:01:13

攜程實踐

2018-01-05 09:33:10

Python火車票春運

2023-10-20 09:17:08

攜程實踐

2011-12-20 14:09:40

2012-01-05 09:14:05

Firefox
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩伦理一区二区 | 成人a网 | 欧美精品日韩 | 久草免费在线视频 | 极品粉嫩国产48尤物在线播放 | 97人人澡人人爽91综合色 | 亚洲精品区 | 伦理二区| 黄色网页在线观看 | 国产高清自拍视频在线观看 | 国产激情综合五月久久 | 天天干com | 欧美国产精品一区二区三区 | 久久精品色视频 | 国产精品国产成人国产三级 | 国产精品久久免费观看 | 国产在线www | 亚洲视频免费播放 | 亚洲精品高清视频在线观看 | 一区二区三区精品 | 色久电影| 国产成人精品一区二区 | 午夜a级理论片915影院 | 国产欧美精品一区二区 | 精品久久精品 | 久久国产精品免费一区二区三区 | 国产精品中文字幕在线 | 欧美婷婷 | 国产精品视频网 | 91视频在线看 | 国产精品成人一区二区 | 69性欧美高清影院 | 亚洲免费在线 | 久久视频免费看 | 欧美中文字幕在线 | 久久成人午夜 | 久久久精彩视频 | 中文字幕一区在线观看视频 | xx视频在线| 国产精品国色综合久久 | 少妇精品久久久久久久久久 |