成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

花了兩個小時,第一次運行起來 Python 工程

開發 前端
對于每個 PowerPoint 文件,它加載演示文稿并逐一遍歷每張幻燈片。對于每張幻燈片,它收集文本和圖像信息,并將其格式化為 CSV 文件的一行。CSV 文件的每一行包括文件名、頁碼、幻燈片文本、幻燈片的演講者備注以及圖像列表。

人工智能時代,最需要學習的編程語言是:python 。

筆者是個 python 小白,昨天花了兩個小時,第一次成功運行起來 python 項目 。

圖片圖片

項目是  powerpoint-extractor ,可以將 ppt 文件中的圖片提取出來,并輸出到固定的目錄。

1 安裝 python 環境

首先打開終端,打開后輸入 python3 。確定電腦上是否已安裝 python3,如果輸入 python 是查看 mac 上的自帶版本。

命令:python3【直接回車】

出現下面是頁面,表示已經安裝python3 【退出時可輸入:exit()然后點回車】

圖片圖片

若沒有安裝,安裝 python3 如下兩種方式:

  1. 第一種方法 brew  安裝 python3 :brew install python3
  2. 第二種方法 官網  Python Releases for macOS ,根據自己的需求下載自己需要的版本下載 。

圖片圖片

2 項目 powerpoint-extractor

通過 git 命令 clone 該項目 :

git clone git@github.com:2TallTyler/powerpoint-extractor.git

因為項目依賴 python-pptx 組件,通過清華的鏡像執行如下的命令:

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple python-pptx

圖片圖片

執行完成之后,可以通過 pip3 list 命令查看已安裝包列表 :

圖片圖片

3  PyCharm 配置

通過 PyCharm 打開該項目 :

圖片圖片

上圖,我們發現 python 解釋器并沒有配置好 ,py 腳本顯示 import 包失敗 

圖片圖片

點擊添加 python 解釋器按鈕,勾選繼承全局包,并確認好 python3 的執行目錄是否正確,點擊 OK 即可完成配置。

點開 extract.py ,核心代碼非常容易理解:

for eachfile in glob.glob(self.input_dir + os.sep + "*.pptx"):
    ppt = Presentation(eachfile)
    print("* " + eachfile)
    presentation_count += 1
    self.cur_image_index = 1

    name = self.generate_image_name_part(eachfile)

    # 遍歷每張幻燈片
    for page, slide in enumerate(ppt.slides):
        # 將幻燈片上的所有文本收集到一個字符串中,以換行符分隔
        text = ''
        for shape in slide.shapes:
            if shape.has_text_frame and shape.text.strip():
                text += os.linesep
                text += shape.text

        # 收集每張幻燈片中的圖像
        self.cur_slide_images = []

        # 保存幻燈片中的圖像
        for shape in slide.shapes:
            self.drill_for_images(shape, page + 1, name)

        # 將頁碼、收集到的文本和演講者備注作為新行寫入CSV文件
        image_list = ''
        if len(self.cur_slide_images) > 0:
            image_list = ','.join(self.cur_slide_images)  # 將圖像列表轉換為逗號分隔的字符串

        # 將信息寫入CSV文件
        writer.writerow([eachfile, page + 1, text, slide.notes_slide.notes_text_frame.text, image_list])

這段代碼執行了以下操作:

  • 對于每個 PowerPoint 文件,它加載演示文稿并逐一遍歷每張幻燈片。
  • 對于每張幻燈片,它收集文本和圖像信息,并將其格式化為 CSV 文件的一行。
  • CSV 文件的每一行包括文件名、頁碼、幻燈片文本、幻燈片的演講者備注以及圖像列表。

4 運行項目

將測試 ppt 拷貝到 input 目錄,點擊 run 。

圖片圖片

當執行完成后,ppt 中有的圖片拷貝到 images 目錄,同時生成了一個 text.csv 。

圖片圖片

當然,我們也可以通過如下的命令直接執行:

圖片圖片

責任編輯:武曉燕 來源: 勇哥Java實戰
相關推薦

2011-07-21 21:01:37

諾基亞塞班蘋果

2017-03-22 15:38:28

代碼架構Java

2023-09-11 00:14:46

后端團隊項目

2022-08-15 08:16:56

shiroWeb認證

2022-03-16 14:59:28

打包debian模板文件

2012-04-13 10:11:58

Windows 8泄露

2021-03-15 08:02:37

程序員996打工

2022-06-21 09:26:28

開源項目PR

2015-10-26 16:38:17

2021-02-05 08:35:21

私活程序員

2010-01-18 08:51:35

Java SE 6

2012-01-18 11:18:12

Web App

2013-02-25 09:43:22

LambdasJava8

2018-11-21 14:51:00

Windows 功能系統

2018-08-15 10:34:30

戴爾

2017-08-08 12:50:51

Serverless云端數據庫

2015-11-02 14:42:12

2018-09-11 17:05:12

戴爾

2013-05-13 11:35:53

獨立開發開發經驗開發感悟

2013-06-03 09:28:49

游戲設計
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品爱久久久久久久 | 中国一级大黄大片 | 五月槐花香 | 欧美日韩91 | 中文字幕日韩一区 | 成人精品一区亚洲午夜久久久 | 最近中文字幕在线视频1 | 欧美国产精品一区二区三区 | 久产久精国产品 | 免费成人国产 | 少妇一级淫片免费播放 | 九九视频在线观看视频6 | 中文字幕一区二区视频 | 成人在线视频免费观看 | 欧美激情欧美激情在线五月 | 91婷婷韩国欧美一区二区 | 国产激情视频网站 | 91免费福利视频 | 久久久久国产精品 | 亚洲精品在线免费观看视频 | 日韩午夜电影在线观看 | 亚洲欧美日韩在线一区二区 | 色婷婷久久久亚洲一区二区三区 | 国产精品色 | 日韩电影中文字幕 | 成人免费在线视频 | 91.色| 极品一区 | 孰女乱色一区二区三区 | 香蕉国产在线视频 | 亚洲视频中文 | 91免费观看国产 | 草草草影院 | 精品欧美在线观看 | 久久麻豆精品 | 亚洲大片一区 | 国产精品视屏 | 日本成人中文字幕 | 精品乱码一区二区三四区 | 日本一区二区三区四区 | 国产精品久久久久久一区二区三区 |