成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

人大附高中生中NeurIPS,入選高中賽道Spotlight,頂會真卷到中學了

人工智能 新聞
NeurIPS率先把AI頂會卷到了高中里,正式面向高中生征集論文,還為此專門設置了高中生賽道(High School Projects Track)。

NeurIPS 2024放榜,人大附中有高中生一作入選。

今年,NeurIPS率先把AI頂會卷到了高中里,正式面向高中生征集論文,還為此專門設置了高中生賽道(High School Projects Track)

現在結果終于出爐,北京大學計算機學院的張銘教授分享了一則入圍消息:

人大附中吳悠,有一篇一作論文入選該賽道,還被選為了Spotlight Project。

圖片

論文題為《Vision-Braille:An End-to-End Tool for Chinese Braille Image-to-Text Translation》,提出了一種中文盲文圖像到文本的端到端翻譯工具。

據張銘教授介紹,吳悠在2022年高一加入她的課題組時,就提出了這個項目的想法。

圖片

端到端中文盲文圖像到文本翻譯工具

具體來說,該項目基于谷歌的mT5模型,采用Curriculum Learning(課程學習)方法微調出了一個盲文翻譯模型。

圖片

其中的難點主要包括幾個方面:

  • 缺少數據集:中文盲文翻譯數據集非常稀缺,數據的采集也比較困難,需要耗費大量人力。
  • 盲文數據的特殊性:盲文通過最多三個單元格來表示每個漢字的發音,即聲母、韻母和音調。但在實際使用中,盲文使用者通常會省略大部分聲調符號,這給盲文翻譯帶來了挑戰。
  • 同音字混淆:中文中存在大量同音字,并且由于聲調符號經常被省略,同音字的區分變得更加困難。

為此,論文作者們首先構建了一組中文-盲文數據集,包括Chinese-Braille-Full-Tone、Chinese-Braille-No-Tone和Chinese-Braille-10per-Tone。

作者從萊比錫數據集中收集了100萬個不同的中文句子,使用中文盲文在線平臺提供的工具,將收集到的中文句子轉換為“全音”盲文。

而后,為了模擬真實世界中盲文使用者省略聲調的情況,作者識別出這些盲文中代表聲調的部分,并隨機去除了其中90%的聲調,創建Chinese-Braille-10per-Tone以反映現實世界中中文盲文的使用情況。

數據按照8:1:1的比例被劃分為訓練集、驗證集和測試集。

圖片

訓練方法方面,作者使用RetinaNet來執行盲文OCR任務,將盲文圖像轉換為數字盲文字符。

接著,采用課程學習策略——即從簡單到復雜地安排訓練任務,分三個階段微調了多語言Transformer模型mT5:

第一階段:使用Chinese-Braille-Full-Tone數據集作為訓練的簡單部分,讓模型學習基本的翻譯規則。這個數據集中的盲文包含完整的聲調信息。

第二階段:使用Chinese-Braille-No-Tone數據集,讓模型在沒有聲調信息的情況下,學會根據上下文猜測正確的中文字符。

第三階段:使用Chinese-Braille-10per-Tone數據集,讓模型更好地適應實際應用場景。

實驗結果顯示,在驗證集和測試集上,該模型的BLEU得分分別達到了62.4和62.3,顯著提高了盲文翻譯的準確度。

論文作者已經放出了項目Demo,效果是醬嬸的,感興趣的小伙伴們可以戳文末鏈接自行測試:

圖片

(正確答案:不過,對于自己外向的性格,埃托奧說,“這就是真實的我,我不會為此改變。)

該項目是在吳悠高三時完成。張銘教授透露,他目前已進入康奈爾大學就讀計算機和生物醫藥工程專業。

論文致謝中提到,吳悠主要是在張銘教授博士生、論文第二作者袁野的指導下完成了這項研究。

張銘,北京大學計算機學院教授,博士生導師,研究領域包括文本挖掘、知識圖譜、圖神經網絡和計算機教育研究等。她合作發表的科研學術論文曾獲ICML 2014最佳論文、ICDM 2022最佳論文提名等榮譽。Google Scholar顯示,她的論文引用量接近2萬,h指數為48。

NeurIPS高中生賽道

NeurIPS是今年剛設的“高中生賽道”,主要征集“機器學習的社會影響”方向的論文。

圖片

公告是這樣寫的:

提交項目必須說明完全由高中生作者獨立完成的工作。希望每個提交的項目都能突出顯示積極的社會影響,或者使用機器學習產生積極社會影響的潛力。

詳細來說,就是允許高中生們找外部導師來合作完成項目,但必須把導師以及合作者的貢獻,和高中生作者的貢獻區分開來。

公告中還規定了,作者需要提交高中在讀證明,所有補充材料均應完全由作者完成,包括視頻、Demo、海報、網站或源代碼。

值得一提的是,其他頂會也有積極接觸和影響高中生的趨勢。

比如,CVPR的做法是和高中合作,開展CV領域的專業講座等課外活動。

圖片

論文地址:https://arxiv.org/abs/2407.06048
Demo地址:https://vision-braille.com/

責任編輯:張燕妮 來源: 量子位
相關推薦

2019-07-04 15:57:16

數據安全互聯網

2009-05-20 09:02:53

IT職業培訓就業高中生

2023-06-20 18:33:00

DOM框架React

2011-04-19 09:40:31

2024-04-15 07:20:00

AI頂會

2009-04-14 15:30:25

2009-08-10 17:08:52

計算機專業就業IT培訓

2010-01-29 10:24:17

2021-03-24 10:15:18

人工智能機器學習技術

2015-03-16 12:50:44

2015-10-20 17:40:42

2020-12-09 13:59:15

神經網絡AI算法

2021-01-14 16:25:18

iPhone 7服務器開發者

2020-10-09 10:29:05

Python 開發編程語言

2022-02-14 16:26:23

機器學習C++

2024-10-15 14:30:00

AI應用

2025-03-31 09:20:00

AI模型測試

2021-08-02 10:40:45

機器人人工智能算法

2020-03-11 11:10:12

開發技能代碼

2009-05-04 09:22:16

百度李彥宏互聯網
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产日韩一区二区三免费高清 | 欧美mv日韩mv国产网站91进入 | 亚洲大片一区 | 欧美日韩在线观看视频网站 | 毛片一级片 | 欧美一区二区三区日韩 | 午夜三级在线观看 | 自拍偷拍中文字幕 | 久草视频网站 | 国产综合精品 | 狠狠操av | 久草福利| 91欧美精品成人综合在线观看 | 国产精品极品美女在线观看免费 | 黄色免费在线观看网址 | 久久久久久久电影 | 日本精品视频一区二区三区四区 | 国产精品久久在线观看 | av毛片| 亚洲欧美一区二区三区视频 | 亚洲乱码国产乱码精品精98午夜 | 亚洲一卡二卡 | 国产传媒毛片精品视频第一次 | 国产精品完整版 | 亚洲五码在线 | 日本不卡一区二区三区在线观看 | 孰女乱色一区二区三区 | 亚洲一区二区免费视频 | 三级成人在线 | 亚洲一区 中文字幕 | 91av在线视频观看 | 国产精品性做久久久久久 | 亚洲精品1区2区3区 91免费看片 | 中文字幕在线观看一区二区 | 亚洲色图第一页 | 国产精品美女久久久久久免费 | 亚洲久久一区 | 久久精品欧美一区二区三区不卡 | 欧美精品三区 | 日韩成人影院在线观看 | 日本精品视频 |