要不要一起爬山?百度大腦EasyDL邀你一起翻越企業AI落地的高山
在企業AI模型的開發中,從數據準備到模型訓練再到服務部署,每個環節都需要企業加以關注。數據的質量直接影響模型效果,企業需要高效率、低成本完成數據的采集、上傳、清洗與標注并快捷接入模型訓練。在傳統醫藥物流行業的分揀業務中,藥盒種類多、背景復雜、檢測速度要求快,人工分揀和復核已難以滿足需求。商務服務業、知識密集型產業則面臨著海量數據的理解與處理難題,培養一名理解行業的員工需要耗時多年,但經驗傳授卻難上加難,企業培養人才成本高。
EasyDL零門檻AI開發平臺,面向企業開發者提供智能標注、模型訓練、服務部署等全流程功能,針對AI模型開發過程中繁雜的工作,提供便捷高效的平臺化解決方案。針對數據管理問題,EasyDL中的EasyData智能數據服務平臺,提供覆蓋采集、清洗、標注、加工等一站式數據處理功能,并與模型訓練環節無縫對接,通過數據閉環功能支持高效的模型迭代。EasyDL面向不同人群提供了經典版、專業版、行業版三種產品形態,其中EasyDL專業版支持深度開發高精度業務模型,內置了豐富的預訓練模型,能適用于多種場景,僅需少量數據即可達到優異的模型效果。
剛剛結束的EasyDL產業應用系列公開課從案例出發,為你帶來行業洞察與模型開發實操演示,錯過直播也不必擔憂,本文精選三個經典案例,提取行業AI應用的核心知識點,助你翻越企業AI應用的高山!
核心解決問題:覆蓋數據采集、清洗、擴充、智能標注的一站式數據服務
典型案例:智能云秤實現自動稱重結算
面對疫情,減少人員聚集被反復強調。在社區果蔬店中,如何做到減少人員聚集,通過智能果蔬識別結算秤代替人工結算被中科立業所關注。但在數據準備階段,主要遇到了兩個問題:水果種類繁多,包裝情況復雜,對數據量要求高;重復圖片和模糊圖片數量多,數據質量需要提升。這兩個問題也不僅僅出現在這一個案例中,許多企業在采集訓練數據時都會遇到采集上傳困難、數據需預先處理耗費大量精力等問題。
為此,中科立業開始使用EasyData數據智能服務平臺,通過將平臺提供的SDK部署到智能秤的攝像頭中,不僅可以自定義修改抽幀頻率和運行時間,可根據果蔬店運營時段設定圖片采集時間;還可以直接將攝像頭采集到的一手圖片數據,傳輸至EasyData平臺,進行清洗、標注等后續操作。由于常見水果的出現頻率高、部分采集圖片模糊不清等原因,出現了大量重復圖片與人眼都難以識別的模糊圖片,中科立業使用EasyData數據清洗中的“去重復”與“去模糊”功能,去掉重復率高的圖片與高模糊度的圖片,優化訓練數據,進一步提升數據集的質量。
通過EasyData平臺對數據進行采集、處理與標注,并依托EasyDL的圖像分類模型進行訓練,中科立業成功訓練了一個果蔬識別模型,目前已經可以成功識別50種水果,識別準確率達到95%以上,已在20家店鋪成功落地應用;同時,仍在持續優化模型效果、增加水果種類。
立即使用智能數據處理服務,可百度搜索“EasyData”或訪問:https://ai.baidu.com/easydata/
核心解決問題:醫藥物流行業的分揀流程,機器人替代人工高效精準抓取
典型案例:藥盒檢測分揀模型的開發
近年來,隨著互聯網醫藥的快速發展、醫藥流通市場的逐步規范、零散藥品內復核、整箱外復核的推行,醫藥物流行業顯現出兩個特點:拆零占比大、訂單碎片化程度大。零散的藥盒分揀與復核,單純采取人工進行工作,每個工人負責的分揀區域較大,出庫頻率較低,這一工作方法在日益龐大的醫藥物流體系中難以長久維系。因此,越來越多企業希望把AI能力應用到產品與服務中,然而,基于開源框架的模型開發需要專業算法團隊的支持,付出的成本使許多企業望而卻步。
浙江工業大學信息工程學院的付老師,根據企業對高效率、高性能、低成本AI開發平臺的需求,找到了EasyDL。
經過對分揀場景需要精準定位藥盒這一需求的細致了解,付老師選擇了EasyDL專業版的物體檢測模型。為盡可能提高模型精度,在準備原始數據集時,與實際應用時選擇了同樣的設備與背景進行藥盒采樣,并盡量覆蓋各種角度,以保證訓練數據與實際業務數據盡量一致。EasyDL專業版的物體檢測模型支持開發者根據自己對模型性能和精度的需求靈活進行網絡選型,在藥盒檢測中,付老師推薦使用高精度的FasterRCNN、YoloV3或mobilenetSSD網絡,也鼓勵用戶根據頁面上的選型提示查看不同網絡的特點。在啟動訓練后,付老師選擇了支持數據閉環,持續不斷優化模型效果。
在具體部署時,企業需要根據應用場景進行選擇。在藥盒分揀場景中,對時延要求很高,因此推薦進行離線部署。付老師選擇的EasyDL-EdgeBoard VMX加速卡軟硬一體方案,將模型部署到VMX加速卡,直接集成到機械臂中。在實際落地過程中,該物體檢測模型的3D定位精度精確到1-2毫米,每完成一次分揀任務的周期是7秒左右,并且相對人工覆蓋區域更大,可24小時不間斷工作,實現了分揀場景的智能化轉型。
立刻嘗試EasyDL專業版,可百度搜索“EasyDL專業版”或直接訪問:
https://ai.baidu.com/easydl/
核心解決問題:海量復雜文本的結構化與靈活部署
典型案例:獵頭行業實現復雜文本分類
獵頭行業作為知識密集型行業,看似門檻低,但在實際工作中要求從業人員對其所專注的行業擁有深入的認知和理解,只有掌握行業內不同公司的各類工作信息,才能為候選人提供全面的顧問咨詢服務。因此,獵頭行業中,從入門的小白到掌握行業信息的專家,往往需要多年的經驗累積和知識沉淀。
然而,已經積累下的海量數據,是否能夠通過結構化處理,將沉淀的歷史數據和源源不斷的新數據通過AI賦能變為規則化的標簽,幫助從業人員進行快速解讀被瀚才獵頭的負責人譚笑然所關注。
在瀚才獵頭的模型開發中,譚笑然分享了一個提升模型訓練效率的關鍵點:數據清洗與關鍵信息的留存。在第一次進行模型訓練時,十萬條數據訓練了近六天,效率很低。通過EasyDL后臺工單的協助,重新進行了數據處理:首先對數據進行數字化統一,通過OCR等功能將不同格式的數據統一為文本格式;下一步進行數據的結構化,留下需要的模型數據,最后將冗余數據和模糊數據剔除。由此獲得的高質量語料,在提升模型訓練速度的同時,大大提高了模型的準確率。
瀚才獵頭公司累積了10余年的近200萬條候選人數據,通過EasyDL專業版的文本分類模型,將企業內部經營信息及候選人信息高效、安全、低成本地進行了結構化分類。由于EasyDL提供端云協同的多種靈活部署方式,用戶可以根據自己的具體業務場景和訓練的模型類型,選擇適應的部署方式,包括公有云API、設備端SDK、離線服務器與軟硬一體部署方案。在瀚才獵頭的模型開發完成后,根據公司日常業務處理的需要,笑然將模型集成到公司工作管理平臺,結合使用實現了海量數據的結構化處理,大大降低了學習成本與數據的處理成本。
快速開發高精度業務AI模型:百度搜索“EasyDL”或直接訪問:https://ai.baidu.com/easydl/
以上三個典型案例,在數據處理、模型訓練與服務部署各有側重,是否也為你帶來了AI落地產業應用的啟發?在EasyDL產業應用系列公開課中,行業資深專家聯手百度研發工程師,從行業深度解讀到產品實際應用,幫助你快速理解業務、掌握技術,成長為一名懂行業的AI工程師,協助企業完成智能化轉型的飛躍!
查看覆蓋各行業經典案例:
https://ai.baidu.com/customer?industry=0&technology=8&clickType=industry
課程重點回顧與錄播視頻,可百度搜索“EasyDL產業應用公開課”,或訪問:
https://ai.baidu.com/support/news?action=detail&id=2075
對課程或產品使用有問題或建議,可微信搜索“BaiduEasyDL”添加小助手,或掃描下方二維碼。