成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

新聞 前端
當NLP模型產生了語法錯誤,怎么辦?沒關系,現在可以像小時候的英語老師,改作文一樣簡單。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

 當NLP模型產生了語法錯誤,怎么辦?

比如,He wants that you send him an email.

沒關系,現在可以像小時候的英語老師,改作文一樣簡單。

[[376989]]

只要裝上一個專門糾正語法錯誤的庫就可以,還是毫秒鐘就可揪出來的那種。

這不,把“that”改成“to”不就可以了嗎~

糾正過來就是:

He wants you to send him an email.

(不會真有人看不出其中的語法錯誤吧)

再比如這句。

I can due his homework.

應該變成:I can do his homework.

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

好像這些語法錯誤,都有點太過明顯了。那就來復雜一點的。

Thanks for your’s and Lucy’s help.

系統就會改成:

Thanks for yours and Lucy’s help.

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

這就是最近一位AI專業本科生Benjamin Minixhofer,利用假期時間開發出來的一款快速糾正語法錯誤的庫NLPRule

[[376990]]

它是由Rust編寫的一個基于LanguageTool語法規則的逆向工程。

LanguageTool是一款開放源代碼校對軟件,適用于英語,法語,德語,波蘭語,俄語以及20多種其他語言,它可以發現許多拼寫檢查器無法檢測到的錯誤。

一經發出,就在Reddit上獲得了200+的熱度。

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

如何實現?

NLPRule是將語法規則與ML模型結合起來,主要應用于NLP的預處理和NLG的后處理。

在作者看來,使用基于語法規則的方法有兩大優勢。

一是速度。作者使用第8代英特爾,糾正一個句子只需要不到1毫秒的時間。

二是語法錯誤的訓練數據極度稀少,ML模型無法處理。

比如,就像這句“It is enough for all intensive purposes. ”

就包含了一個錯誤。除非特別說明,ML模型基本上不能糾正這個錯誤,因為它幾乎不會出現在其訓練數據當中。

而若是放在其他語言數據中,肯定會比英語更少。

比如,中文。

作者創建這個庫的目的在于創建一個快速、輕量級的引擎來運行自然語言規則,無需依賴JVM(Java虛擬運行環境)速度、內存的影響。

目前,這個庫支持英語和德語。

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

具體安裝可分成如下四個步驟,詳細可戳文末鏈接。

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

在GPT-2進行文本測試

接著,作者就嘗試用GPT-2生成的文本來測試,結果產生了大量的改進建議。

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

比如語法錯誤。

Before: …t out, as a condition of its being operated. Each lock keeper should ensure >that all locks are operated and tha…

After: …t out, as a condition of its being operated. Each lockkeeper should ensure that all locks are operated and tha…

Message: This noun is normally spelled as one word.

Type: grammar

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

再比如拼寫錯誤。

Before: …he Z-machine version (in the standardised format) is comprised of 32 (in total) >bytes, one per line. …

After: …he Z-machine version (in the standardised format) comprises 32 (in total) bytes, one per line. …

Message: Did you mean comprises or consists of or is composed of?

Type: misspelling

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

一經發出,不少網友直呼:Fantastic!

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

也有網友想到,如果跟BERT或者其他Transformer模型結合起來,會不會生成更好的句子呢?

NLP模型也有“老師”了!裝上這個開源庫,1毫秒糾正語法錯誤

想要了解更多細節,吶~傳送門送上!

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2013-11-11 11:17:45

AngularJS性能優化

2012-03-11 15:27:57

微軟

2014-08-04 15:13:27

光纖

2021-04-27 06:20:25

MySQL集群優化

2025-06-27 09:05:47

2009-12-09 10:46:06

PHP檢查語法錯誤

2017-10-31 15:28:27

RUDP傳輸優化實踐

2022-06-15 11:27:15

開源代碼項目

2017-05-31 13:58:05

戴爾宕機服務器

2021-03-29 10:37:35

開源技術 開發

2024-11-08 15:08:17

2021-12-08 09:47:21

安卓系統模型

2024-04-12 09:02:15

JavaCPU執行時間線程

2018-11-23 10:01:57

5G標準網絡

2021-02-06 13:00:11

工具監控服務器

2025-04-03 09:45:51

2021-04-22 07:29:46

數據展現方式

2023-12-05 18:00:27

MySQLSQL
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 玩丰满女领导对白露脸hd | 国产三级 | 日韩欧美在线观看 | 99re6在线视频精品免费 | 网站黄色在线 | 免费观看www7722午夜电影 | 国产亚洲黄色片 | 在线免费亚洲视频 | 久久ww| 亚洲免费在线视频 | 中文字幕亚洲视频 | 最新黄色毛片 | 日本淫视频 | 亚洲免费观看视频网站 | 日韩在线免费视频 | 国产一区二区三区在线 | 91电影 | 久草中文在线 | 可以在线看的黄色网址 | 极品粉嫩国产48尤物在线播放 | 精品国产欧美一区二区 | 97超碰免费 | 狠狠草视频 | 岛国av一区二区 | 一区二区免费 | 欧美一区二区三区免费电影 | 在线观看涩涩视频 | 亚洲一区二区三区在线 | 欧美一区二区三区视频 | 91毛片在线观看 | 91久久精品日日躁夜夜躁国产 | 日韩在线国产 | 成人在线免费电影 | 国产欧美一区二区精品久导航 | 成人精品一区二区三区中文字幕 | 亚州视频在线 | 欧美精品综合 | 亚洲视频在线免费观看 | 在线免费国产视频 | 日韩在线精品视频 | 亚洲精品视频一区 |