成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ChatGPT | 用GPT實現高考志愿系統

人工智能
數據采集首先用到的想到是爬蟲,但是卻面臨一個問題,數據的異構性,針對每個頁面都去寫爬蟲解析是非常麻煩,而且隨著頁面變動,可能原來解析方式又需要重新修改,為此結合GPT,出現了很多用GPT解析和整理網頁數據的開源項目,其中:ScrapeGraphAI比較好用。

高考出分將近,看到各種高考志愿一對一輔導,其實是利用信息差掙錢,但是隨著AI的技術快速發展,數據平權的時代已經到來,信息差不是特定人員的優勢。為此,我和小伙伴們利用ChatGPT技術,開發了高考志愿智能填報系統。

圖片圖片

志愿系統

體驗地址:http://gaokao.su007.club/

邀請碼:6mRtf GyJwco rhGXoK qDGln8 OPC7Ys

1、架構設計

架構設計架構設計

  • 構建大語言模型的LLM,通過爬蟲抓取數據,進行清洗
  • 數據清洗后,按照格式入庫到sqlite中
  • 將sqlite按照格式,提供給LLM繼續微調
  • 微調后,將模型部署提供API Server對外訪問

2、數據采集

數據采集首先用到的想到是爬蟲,但是卻面臨一個問題,數據的異構性,針對每個頁面都去寫爬蟲解析是非常麻煩,而且隨著頁面變動,可能原來解析方式又需要重新修改,為此結合GPT,出現了很多用GPT解析和整理網頁數據的開源項目,其中:ScrapeGraphAI比較好用。

開源地址:https://github.com/VinciGit00/Scrapegraph-ai

ScrapeGraphAIScrapeGraphAI

使用樣例:

from scrapegraphai.graphs import SmartScraperGraph

graph_config = {
    "llm": {
        "model": "ollama/mistral",
        "temperature": 0,
        "format": "json",  # Ollama needs the format to be specified explicitly
        "base_url": "http://localhost:11434",  # set Ollama URL
    },
    "embeddings": {
        "model": "ollama/nomic-embed-text",
        "base_url": "http://localhost:11434",  # set Ollama URL
    },
    "verbose": True,
}

smart_scraper_graph = SmartScraperGraph(
    prompt="整理學校信息,包括學校名稱、地址 ...",
    source="https://www.gaokao.cn/school/search",
    cnotallow=graph_config
)

result = smart_scraper_graph.run()
print(result)
  • 這里的輸出結果由于敏感,所以就不輸出;
  • 由于高考數據在互聯網上比較多,所以可以搜一些相關的網頁都整理到AI Scraper中,自動分析數據;
  • 如果有興趣的小伙伴可以嘗試一下,不過爬蟲可能被限制,然后需要遵守法律法規進行數據的爬取;

3、模型微調

數據整理好以后,就可以進行模型微調,解決AI志愿的推薦問題,當然這里又有另一種方式,就是通過few-shot Prompt,通過上下文進行對話,這樣也可以達到類似的效果,缺點就是上下文不能太長。

這里微調就使用:LLamaFactory+LLama3,使用界面就可以進行:

LLamaFactoryLLamaFactory

整理的數據集如下:

[
{
    "conversations": [
        {
            "from": "human",
            "value": "2024年高考600分,希望選北京的學校,該怎么選?"
        },
        {
            "from": "gpt",
            "value": "根據北京2023年xxx錄取分數線:{爬取的分數線數據和專業數據},2022年xxx錄取分數線:{爬取的分數線數據和專業數據},2021年xxx錄取分數線:{爬取的分數線數據和專業數據},推薦...,原因是..."
        },
        ...
    ]
}
]

大約整理了10w條數據,經過一些調整參數最后微調完成以后,就可以部署到API Server中。

6、功能上線

圖片圖片

圖片圖片

圖片 圖片

責任編輯:武曉燕 來源: 周末程序猿
相關推薦

2019-06-28 15:54:49

大數據

2020-07-08 14:14:48

AI高考人工智能

2015-06-17 14:44:36

大數據填高考志愿

2025-06-12 13:03:13

2020-07-27 15:01:59

大數據人工智能高考志愿

2023-06-26 07:20:51

2024-06-27 10:37:56

2025-04-21 08:13:58

ChatGPTAINLP

2022-06-23 15:54:15

NLP訓練

2012-07-18 15:26:49

2019-07-23 09:08:43

Python操作系統高考

2024-06-13 20:27:05

2023-03-01 16:15:16

2018-06-25 11:00:48

人工智能機器人高考

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-03-02 22:46:48

2022-12-25 10:35:09

ChatGPTPython

2022-06-15 15:00:30

人工智能高考計算機科學
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人免费av | 日韩1区 | 日韩精品视频在线播放 | 国产成人综合在线 | 青青草原精品99久久精品66 | 黑人久久久 | 在线观看视频h | 成人网在线观看 | 国产精品中文字幕在线 | 性国产丰满麻豆videosex | 亚洲免费高清 | 国产亚洲日本精品 | 亚洲精品久久久蜜桃网站 | 国产成人免费视频网站高清观看视频 | 国产精品久久久久久久久久久久久 | 久久精品一区二区三区四区 | 欧美午夜在线 | 国产亚洲一区二区三区 | 国产精品国产三级国产aⅴ无密码 | 国产国产精品 | 成人av电影在线观看 | 日日摸日日碰夜夜爽2015电影 | 激情久久网 | 中文字幕在线观看一区 | 国产精品日日摸夜夜添夜夜av | 成人精品久久日伦片大全免费 | 一区二区三区中文字幕 | 超碰在线97国产 | 久久高清精品 | 久久午夜精品福利一区二区 | 中文字幕精品一区久久久久 | 国产www在线 | 精品视频在线观看 | 色av一区二区 | 亚洲精品中文字幕中文字幕 | 在线激情视频 | 国产成人精品免费视频大全最热 | 欧美中文一区 | 毛片一级片 | 精品一区av | 亚洲精品www |