成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

T 前線 | 專訪作業幫首席AI架構師王巖:AI的普惠性在于思路創新

原創
人工智能
AI研究熱潮的多次起伏,始終伴隨著應用落地這個難題。如何將“高大上”的AI技術穩步推向落地?如何看待AI與細分行業的深度融合?如何看待大模型的研究熱?T前線有幸邀請到了作業幫智能技術實驗室首席架構師王巖先生為我們提供他對這些問題的見解。

嘉賓 | 王巖

作者 | 云昭

欄目介紹:“T前線”是51CTO內容中心專為技術人物開設的深度訪談欄目之一,通過邀請技術界內的業務負責人、資深架構師、資深技術專家等對當下的技術熱點、技術實踐和技術趨勢進行深度的解讀和洞察,推動前沿科技的傳播與發展。?

人工智能被稱為第四次工業革命,被社會各界寄予了無窮大的期望。它在改善人們生活的同時,提高了整個社會的運行效率。近年以來的大模型、多模態也再一次助推了相關研究的火熱。

?而在聚光燈下,可能大家更多看到的是,業內正在將AI推向極致的一面,卻往往忽略了它“水利萬物”的另外一面。

技術的發展離不開實際的場景,AI研究熱潮的多次起伏,始終伴隨著應用落地這個難題。如何將“高大上”的技術穩步推向落地?如何看待AI與細分行業的深度融合?如何看待大模型的研究熱?

懷揣著這些問題,“T前線”采訪了深耕教育場景的科技公司:作業幫。作為一家致力于用科技手段助力教育普惠的企業,運用人工智能、大數據等前沿技術,不論面向數億規模的C端用戶,還是成千上萬的B端客戶,都提供了一系列高效的學習和教育解決方案與產品。

尤其在教育領域,AI技術的探索和落地,不管是用戶規模和技術選型,作業幫都具有很好的代表性。這也為我們思考如何用人工智能推動行業變革,給出了重要的借鑒與參考。T前線有幸邀請到了作業幫智能技術實驗室首席架構師王巖先生為我們提供他對這些問題的見解。

教育產品的基座:題庫建設三板斧

提起作業幫,大家可能印象深刻的還是強大的題庫功能。作業幫是全國最早建立題庫的教育科技公司之一,到目前已經擁有5.4億+的題庫體量。如此龐大的題庫是如何建設起來的?據王巖介紹,題庫建設的成功,得益于三個方面的條件。

首先,源于作業幫的先天優勢:眾所周知,作業幫最開始是百度內部孵化的業務,最初定位于一個問答互助社區,后來推出搜索答疑業務。為了優化搜索答疑結果,作業幫通過組建全職教研和兼職老師團隊,搭建起了線上最大的題庫生產平臺。這也是源于百度知道的模式,在崇尚分享交流的社區氛圍中,鼓勵用戶相互解決問題,也非常貼近網友實際的問答和交流場景。而不是當時別家的做法:讓兼職大學生做題庫。這樣通過對用戶產出的內容進行深入的分析挖掘,我們就逐漸清楚了在學習的場景中,用戶到底最關注哪些問題,哪些是問題更難的、哪些問題是多數人都會遇到的。這是一個重要的前提,它明確了我們的建設方向。

第二,作業幫非常重視資源的價值與建設,對題庫足夠重視。題庫不僅在用戶交流中作用巨大,在答疑和教學中也是非常重要的一環。憑借眾包的體系,將題庫的建設拆分成難度較小的獨立工藝環節,使得題庫較好較快,也相對比較全面的建立起來,這樣很好地保證了題庫建設的規模性。

第三,光有一道道題目還不夠,還需要將題目關聯起來,比如:所考察的知識點、難易度以及所依賴的其他知識點等標簽術語關聯起來。這就涉及標簽的加工,并與知識圖譜、知識樹等技術基礎設施關聯起來。這樣才能讓題庫具備可被高效檢索和篩選的能力,讓題庫的價值得以真正發揮出來。當然,題庫本身建設過程中有很多環節一開始都使用人工操作,后來不斷引入了AI技術,比如題目拍照等大多數電子化錄入步驟,AI將這些圖像自動識別變成計算機可理解的格式化的數據和語言。通過自動打標簽、格式化公式、AI糾錯技術等AI能力來進行自動化輔助處理,準確率大幅提升,也大大降低了人工成本。得益于題庫的建設以及對AI技術的不斷深入和擴大,作業幫通過落地一系列AI加速技術,把搜索答疑的響應時間優化到1秒,而早期同類產品的響應時間都在8秒左右。

在對接公立學校的項目中,題庫在輔助教學場景中發揮了很大的作用。一個亮點的場景就是具備個性化精準推題能力的高質量作業系統。該系統的本質是將基于不同的學生狀態,比如做題時長,不同知識點掌握程度進行數據分析進行個性化推題。因為對學生而言,太容易和太難都會讓題目失去價值。同樣一道題目對于不同的學生而言價值就會不同。所以需要對學生有充分的了解,結合題庫本身豐富的標簽維度,精準匹配,題庫在高質量作業產品設計中的輔助作用很大,有利于學生鞏固真正需要鞏固的知識。

自動輔助批改:機器如何解圖形題

作業場景方面,除了題庫,比較重要的就是自動輔助批改技術。相較于客觀題,主觀題的批改就難度很大。以數學的解答題為例,利用多年積累的OCR技術對學生的作答內容進行精準的識別,在通過NLP技術進行結構化的分析,比如答題內容的邏輯分析,再根據答題規范識別錯誤點等;此外,還運用了知識圖譜的能力,不僅指出學生哪里錯了,還可以告訴學生為什么會錯,再配合用戶畫像和推薦算法的能力生成學生專屬的學習報告,幫助學生找出學習過程中的薄弱點。同時,依賴于作業幫云原生、多云容災的一套體系,為這套服務體系提供了高穩定性和高可靠性。因此這也就保證了即便很多學校同時用,也不會產生宕機的情況,保證了用戶的穩定使用。

據王巖介紹,出于作業幫多年的大規模用戶體量的積累,他們會定期對作業系統進行性能評測,評測結果也處于行業領先的地位,相較于市面上同類的產品,目前作業幫也支持更多的題型,準確率也更高。

1、步驟級自動輔助批改

知識的學習存在一個閉環:老師通過教學傳授知識,學生通過做練習題檢驗自己哪些知識點是學會的,哪些是不會的,不會的知識又需要不斷的學習與練習。在這個“講題→做題→判題→講題”的教學閉環中,老師反復批改大量的作業成為了一大痛點,老師過去很難精準地去輔導每個學生。用AI來輔助批改,可以幫教師有效降低批改負擔,大幅減少不必要的時間和精力,同時讓更多的學生有效提高成績。

目前,作業產品系統有著很高的使用率,教師們幾乎每天都在使用。而且,這套系統還可以融合老師的教學經驗和風格,根據老師的不同需求做定制化。目前,主觀題、應用題可以做到基于步驟級的批改。后期的改進,還是以繼續降低教師在批改作業中的人工占比為主要方向。

2、圖形題的解答內有乾坤

相較于文字題而言,一般通過OCR、文字檢索等就能在題庫中識別和匹配出正確題目。然而,對于某一類題目比較特殊,那就是圖形題。比如試卷上經常會有這樣的題目:求下列圖形的陰影面積,這時候需要提取的特征就不只是文字了,還需要提取圖片的特征。因為僅通過文字檢索,題庫背后的檢索系統可以搜到類似的題干,但得到的結果中每道題目的形狀都不一樣。這時候我們就需要對圖像進行向量化特征提取。數字化的向量表達,與大量題庫的特征聚合起來,就形成了“文字+圖像”的特征。尤其小學題目中的經常有許多圖像文字混合的題目,不光需要理解題干文字,還需要理解框與框之間的結構化關系,包括“連線題”提取線條的特征的起始位置,提取軌跡來進行判定。畫圖題也是這樣。

3、試卷還原:黑科技往往植根于現實

在輔助教學場景下,作業幫也積累了很多OCR、語音、圖像識別、作業批改方面的技術專利。比如我們已經公開的人工智能高效矯正扭曲圖像專利,這是一個在非常剛需的場景里研究出來的。眾所周知,“錯題重做”是教學場景下很重要的環節,學生家長與教師需要將試卷還原成未答題的狀態,但給試卷拍照后,經常會出現字跡不平整,試卷題目扭曲的情況,所以需要技術來解決排版矯正的問題。

我們通過采用深度神經網絡,將人的手寫筆跡進行識別并與試卷字體區分開,結合圖像增強的技術等,可以非常有效的還原試卷,目前這項技術已經在作業幫的App里上線,并且已應用到打印機產品,可以將紙質的試卷還原到初始的狀態,從拍照到還原僅需幾秒鐘。放到以前的做法,一般是需要學生把題目手動抄一篇,再重新做。這可以說是一種功能強大的“黑科技”了。當然,這項技術不僅用于還原試卷,還可以用于網課提交作業之前,對拍照的作業進行矯正和美化,以還原成更好的排版狀態,一方面利于保存,另一方面也是可以提高內容的識別精度。

4、知識圖譜:專家知識的聚集地

知識圖譜的建設離不開人類的經驗體系,教育場景也是如此。我們的知識圖譜能力更多的是在課程場景中積累起來的。大量的教研老師在教研過程中總結知識點的前后關系、依賴關系和學習路徑。這些關系和路徑可以將零散的知識點聯結成網狀,這樣就有了知識圖譜的雛形。教研老師提供了豐富的專家經驗和知識點體系,研發部門在這個過程中采用一系列自動化的AI機器學習能力來進行大范圍的落地。有了圖譜以后,我們就可以做出下一步個性化作業設計,比如推薦與能力相當甚至有一定挑戰的題目,去學習更深層次的知識點。目前知識圖譜在作業幫的應用場景十分廣泛:教學場景、作業批改、個性化學習、作業診斷、包括剛才介紹的題庫中有關題目的關聯,本質是讓題目有了更精準的維度去做檢索和推薦。

從數字化到AI:尊重用戶原有習慣

在過去教學場景中,一方面紙質的書、教師的板書、PPT等都沒有做到數字化,另一方面,學生的作答內容,包括答題的正確與否、作業和考試成績等也需要做數字化。為什么要做數字化?因為如果沒有把自然物理世界的內容轉化成為計算機可以理解的數據信息,我們在計算機領域相關的先進技術研究不僅無法落地,甚至僅僅是提高效率的技術,比如檢索和推薦等,都會無用武之地。因此,不管說語音還是圖像,都是傳遞教學思想和知識的重要媒介與載體,這些都需要做深度的數字化。

近些年,隨著教育信息化的不斷推進,大部分的教室配備上了數字化大屏,日常上課所用的教學課件已經完成了數字化,而我們現在做的就是要推進作業場景完成數字化。但值得注意的是,現階段使用AI的能力,要尊重教師和學生的原來習慣,不宜輕易改變。比如原有的教學模式,大家都習慣了紙質試卷,如果你取消紙質試卷,全都搬到線上,就會出現“水土不服”的嚴重問題。雖然要求網上答題也可以數字化,但這就改變了習慣。而一改變習慣,就很難大規模使用。

基于此,出于尊重教師批卷和學生作答的真實習慣,作業幫創新了業務思路:在作業系統中引進了“原卷留痕”這個功能。所以,在王巖看來,我們更多需要的是進行思路上的創新,去降低技術的使用門檻,以不改變習慣的情況下進行數字化。

從作業場景放大到教育場景,就會發現很多新場景下的新的需求。比如體育場景:體育老師在上課期間非常注重每位學生可以承受的運動強度,比如心率的監控。當學生運動時心率過高了,就應該提醒學生停下來休息。再比如“跳繩計數”,我們不用計數器,而是讓攝像頭去自動識別和計數會更加便捷。另外,肢體動作類的捕捉也是一個實用的技術,來幫助學生查看動作是否標準和規范,這些AI都可以做輔助糾正。

1、如何為AI尋找落地機會

作業幫是一家技術驅動的公司。開發團隊經常會問這樣的問題:還有哪些技術可以有用武之地?有沒有好的技術可以讓過去沒有滿足很好的需求現在可以滿足、原來不可完成的現在可以完成?基于此,如何為AI尋找落地機會,王巖總結了背后的邏輯:我們應清楚自己掌握了哪些技術,擁有哪些資源,然后再考慮如何把合適的技術應用到具體場景上。基于已有的技術資源,做場景匹配。下一步就是思考和權衡技術能做到什么程度,然后再去做試點和優化。

2、B端精準度要求更苛刻

作業場景下,相較于C端場景, B端客戶的需求比較特殊,有定制化的要求。比如學校在準確率方面的要求會更高,像批改的環節,更不能出錯。而C端產品更多的是突出功能的豐富度、使用體驗,對精準度的預期并沒有那么極致。

關于AI行業的看法

1、基礎研究是底座,前沿技術更香

基礎研究是我們的技術底座,這些技術已經有相當的廣泛的應用場景,對基礎技術的優化,會帶來相當大規模的應用性能的提升,所以對基礎研究的投入,是必不可少的。而前沿技術的研究,帶來的則可能是玩法的變化,隨著技術不斷發展創新,原來不能做的也許突然某一天就可以實現了,鼓勵實驗室的同學分配20%到30%的精力去關注和跟進。對于候選人能力方面,希望具備一定的學術研究能力的同時,也會看重工程化能力。更強的工程化能力就意味著更強的落地能力,而要真正把AI技術推動落地,就需要不斷在應用層面上做扎實。當然,理想情況下希望人才具備全棧的能力,可以獨立完成實驗設計和應用落地,去快速驗證某些創新點在實際應用中帶來的提升效果。

2、模型不能單純追求大,惠及也要廣

教育領域與通用行業的實踐和發展經驗,跟通用的技術還是有一定區別的。AI現在已經應用到各行各業中,但細分到教育場景,基于通用場景的模型多數不能“普惠”到具體的場景。王巖為我們舉了一個形象的例子,比如手寫輸入法中的手寫字識別,算法模型有一個假定前提:成年人書寫的字跡。但作業場景中,不同年齡段的學生寫的字是不一樣,工整度,整潔度沒有那么大的要求 。所以對于教育領域來說,AI需要基于具體的場景進行細化,需要下沉到具體場景里去沉淀,去解決掉通用領域不太好的地方,探索并發現新的業務需求,在解決實際問題的過程中去推動相關技術的發展。

被廣泛使用的,必是大眾可承擔的。“大模型取得了公認的性能提升,但距離用戶的廣泛使用還是有很遠的距離。”在王巖看來,大模型、多模態的研究確實可以帶來的精度上提升,但往往一個任務的準確率的提升,比如從95提升到96,這一個點提升的背后是以巨大的算力犧牲為代價的。現在千億、萬億級別參數規模的大模型,都需要非常龐大的集群去支撐和運行,這對于實際場景,如果沒有龐大算力集群去使用,原本一秒內就可以跑出結果的大模型,可能就需要相當漫長的運行時間。雖然集群硬件的性能在不斷提升,對應的單位算力成本在不斷降低,但能被廣泛應用的技術一定是成本低廉的、可負擔的。把精力全放在算力的追求上某種程度上看,有些舍本逐末。AI的廣泛落地,更在于思路上的創新,在于追求技術本身的性價比。

如何將技術惠及到成千上萬的用戶,如何將噱頭一樣的功能在實際生活中廣泛使用到,是一個關鍵的問題。我們目前用戶量非常龐大,每秒鐘都有非常多的用戶在使用,所以如果用“堆算力”的方式去做,成本將是難以想象的。目前在可負擔的情況下 ,我們要做的是為用戶提供盡可能豐富的功能和服務。一方面,我們思考如何將算力的利用率提高,讓設備不閑著,另一方面,我們去探索如何在模型和工程架構做改進和優化,用最合理的成本去提供每秒數萬次級別的大型AI服務。更重要的是,如何進行思路創新。只有從解決問題的思路上進行創新,讓更多的人用戶去切實觸摸和感受技術帶來的便利,才能釋放出更大的價值。

嘉賓介紹

王巖,作業幫首席架構師,作業幫智能技術實驗室負責人。曾任百度知道、百度百科技術負責人,目前擔任作業幫智能技術實驗室負責人,專注于人工智能、圖像技術、大規模高并發在線架構等技術領域的相關研究及落地應用,主要負責作業幫搜索答疑、AI批改、題庫等相關業務。

責任編輯:薛彥澤 來源: 51CTO
相關推薦

2024-05-15 23:53:27

火山引擎豆包大模型火山方舟

2017-08-28 15:24:36

AIWIFI網絡

2016-08-29 11:33:23

京東云云計算云安全

2011-12-23 15:56:02

2018-11-20 16:57:19

華為云

2018-08-28 18:12:58

華為云

2023-04-27 09:04:02

亞馬遜云科技

2010-04-24 22:15:21

Python豆瓣洪強寧

2020-09-06 20:20:26

百度黃埔學院

2009-12-18 10:22:50

Ray Ozzie架構師

2020-01-13 19:53:09

AI

2020-10-15 15:42:12

天翼云普惠AI

2018-06-28 22:04:25

智能體華為云人工智能

2012-03-21 17:30:21

百度架構師

2021-10-15 18:09:24

人工智能AI架構百度飛槳
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91电影| 亚洲欧美国产视频 | 香蕉久久久久久 | 精品视频一区在线 | 高清黄色网址 | 国产精品一区久久久 | 免费在线一区二区三区 | 精品一区在线看 | 日韩精品视频在线观看一区二区三区 | 成人片免费看 | 国产日韩欧美中文字幕 | 免费精品一区 | 91看片| 亚洲影音| 亚洲欧美一区二区三区1000 | 日韩免费 | 久久久久免费精品国产 | 在线中文一区 | 亚洲自拍偷拍欧美 | 国产一级片免费看 | 亚洲人成网站777色婷婷 | 精品一区电影 | 国产电影一区二区 | 亚洲成年人免费网站 | 日本黄色大片免费看 | 无码日韩精品一区二区免费 | 午夜色播| 不卡视频在线 | 精品久久国产 | 久久久久久国产 | 91精品国产91久久久久久密臀 | 成人毛片一区二区三区 | 久久久看 | 国产精品久久久久久久7电影 | 激情欧美一区二区三区 | 日韩在线精品 | 欧美日韩一 | 日韩av在线一区 | 亚洲人成人一区二区在线观看 | 日本天堂一区 | 久久久久久亚洲精品 |