【摘要】 針對“人工智能”課程實驗中存在的各種問題,提出在實驗教學中引入企業云服務平臺,支持實驗實訓等實踐教學環節的方法。在云平臺的支持下,可以實現大數據量、高運算能力要求的AI算法實驗。云端實驗平臺的引入豐富了教學手段,解決了實驗算力不足、實驗數據存儲量不足、實驗過程難以監控,以及實驗教學效果難以評價的問題。實驗平臺的引入有助于激發學生的主觀能動性和創新實踐能力。
劉麗玨; 陽春華; 陳白帆; 王雅琳; 高琰, 工業和信息化教育 發表時間:2021-10-22
【關鍵詞】人工智能;云實驗;ModelArts;AI平臺;交叉學科
0 引言
人工智能主要研究如何利用計算機和自動機去模擬、延伸、創造和擴展生物的智能,設計和建造具有擬人智能水平的智能系統[1],并把這類系統應用到科學技術、國民經濟、社會和人民生活的各領域。“人工智能”課程涉及認知科學、計算機科學、控制論、生物信息學、數學、人工生命、腦科學、心理學、生理學和哲學等學科,是一門綜合性強、實踐性強、創新性強、應用領域廣、多學科高度交叉的前沿課程[2]。
中南大學自動化學院設有智能科學與技術專業,擁有國家級教學團隊——智能科學基礎系列課程教學團隊。“人工智能”課程已開設30余年,是國家級精品課程、國家級資源共享課、新世紀網絡課程、國家級雙語教學示范課程、國家級精品視頻公開課、中南金課、中南大學開放式精品示范課堂。“人工智能”課程以人工智能和智能系統理論為指導,以智能機器人、智能識別和智能信息處理系統為應用背景,依托精品課程群,發揮了示范作用[3]。
1 “人工智能”課程教學中存在的問題
隨著新一代深度感知、高速傳輸、海量存儲和智能處理等技術的不斷發展與成熟[4],人工智能技術不再是紙上談兵的理論,這對課程的實踐環節提出了更高的要求。受學校實驗室環境和設備的限制,綜合性、前沿性實驗難以開展,主要表現在如下3個方面。
(1)實驗內容過于簡單,缺乏綜合性實驗。課程實驗往往只注重對知識點的強化,而忽略了其實際應用場景。多數實驗均為演示型、體驗型實驗,無法真正讓學生領會到實際應用中的問題并培養解決問題的能力。如神經網絡實驗中,只能通過演示型實驗讓學生了解網絡迭代優化的過程,而對較重要的應用場景——圖像識別的實驗卻難以支撐。
(2)實驗設備老舊,無法滿足新技術要求。學校的實驗室設備仍然停留在單臺計算機的水平,且實驗室的設備只能在學生實驗期間使用,學生一旦離開則不能繼續運行。與此相對應的,是以機器學習、深度學習為代表的主要靠數據、算力和算法支撐的新一代人工智能技術實驗需求,其中很多實驗需要學生長時間自行訓練和學習。老舊設備無法承載大數據存儲和高速運算的需求,實驗室管理辦法也沒有跟上新的需求。即便是進行簡單的手寫數字識別實驗,1臺實驗室的計算機完成1次實驗訓練也需要15~30分鐘。
(3)實驗考核困難,難以定量分析。由于條件限制,以往的實驗只能是驗證性實驗,且由于單機的形式,實驗數據、實驗環境難以統一,使得評價指標的計算基礎不一致,教師對學生實驗環節的表現多半只能通過實驗報告來評價。這里面摻雜了很多主觀因素。例如,對于回歸分析的實驗,每名學生1份數據,每人的機器都有區別,導致最后只能從擬合程度來判斷實驗效果,而無法對時間性能、空間性能進行更全面的評價。且數據量受到單機存儲量限制,只能進行小樣本實驗,無法再現實際工作中可能出現的問題。
2 云實驗的引入與設計
在高校實驗環境建設相對落后的同時,很多科技企業開始布局人工智能領域[5],并且推出相應的云端計算服務平臺。ModelArts是華為公司面向開發者提供的云端AI開發平臺,為機器學習與深度學習提供海量數據預處理及半自動化標注、大規模分布式訓練、自動化模型生成,及端— 邊—云模型按需部署能力,幫助快速創建和部署模型,管理全周期AI工作流。中南大學于2018年底申請教育部產學合作協同育人項目,與華為公司達成協同育人協議,將ModelArts引入“人工智能”等相關課程的實驗教學中,為課程實驗提供云端算力支持。
2.1 ModelArts應用背景
ModelArts是華為公司針對AI開發者面臨的一系列困難設計開發的一站式開發平臺,所謂 “一站式”是指AI開發的各環節,包括數據處理、算法開發、模型訓練、模型部署都可以在 ModelArts上完成。從技術上看,ModelArts底層支持各種異構計算資源,開發者可以根據需要靈活選擇使用,而不需要考慮底層的技術。同時, ModelArts支持Tensorflow、PyTorch等主流開源的AI開發框架,也支持開發者使用自研的算法框架。面向不同經驗的AI開發者,提供便捷易用的使用流程。例如,面向業務開發者,不需關注模型或編碼,可使用自動學習流程快速構建AI 應用;面向AI初學者,不需關注模型開發,使用預置算法構建AI應用;面向AI工程師,提供多種開發環境,多種操作流程和模式,方便開發者編碼擴展,快速構建模型及應用。對不同層次使用者的支持,正好符合課程實驗中不同需求何難度的實驗要求,非常適合作為實踐教學平臺。 ModelArts中典型的AI算法訓練和發布流程,如圖1所示。
ModelArts預置了大量已標注數據集,可以支持目標檢測、目標識別等多種任務,還支持用戶上傳自建的數據集,并提供了標注工具;在算法開發過程中,Tensorflow、PyTorch等主流框架均已集成進去,并有大量預置算法模型供使用者選擇使用,有利于快速實現課堂上介紹的各種框架和算法,便于學生對之建立起感性認識;至于訓練模型,平臺提供分布式集群進行訓練,遠超老舊實驗設備所能提供的計算資源,大大縮短了訓練時間,另外零編程的自動學習方式方便課堂演示實驗效果,激發學生的學習興趣;訓練后的模型可以很容易地進行部署,提供預測推理功能,支持各類應用。
2.2 課程實驗安排
“人工智能”課程作為智能科學與技術專業的專業基礎課,在涉及機器學習部分的教學中主要關注學生的基本理論學習和應用體會。學生在這部分學習中主要需要了解學習系統的構建過程及可能遇到的各種問題,讓學生在實驗過程中對技術的應用先有整體認識,以便在后續的“模式識別”“機器學習”等課程中更加關注具體的技術和方法。結合ModelArts功能和課程實際情況,課程實驗內容設計如下。
(1)回歸分析。①分析胚胎發育B超測量數據,利用ModelArts開發環境中的Notebook自編代碼,建立合適的回歸模型,進行胚胎發育情況的趨勢模型編寫,并對指定測試集的數據進行預測;②前列腺癌預測,利用ModelArts開發環境中的Notebook自編代碼,對前列腺癌數據進行回歸分析,統一測試集進行測試。
(2)手寫數字識別。①利用ModelArts上的 Minist手寫數字集,訓練和測試手寫數字識別; ②將回歸模型稍加修改,遷移到美國郵政編碼手寫數字集的數字識別上,檢測識別率并進行改進。
(3)找?;?。請學生搜集校園中各處出現的中南大學?;請D片,統一形成數據集上傳ModelArts,利用平臺標注工具為數據進行標注,仿照云平臺中的“找云寶”實驗,完成找?;諏嶒?。實驗的設計從易到難,先完成線上編程,再完成從數據到應用的完整實驗流程,讓學生在實踐過程中不斷提高解決問題的能力。實驗以分組形式完成,每名學生均需完成所有實驗內容,但可取最好的實驗結果作為本組的最后成績。實驗完成后組織集體匯報,學生以組為單位匯報實驗內容與結果,同時統計每組最終成績,公布排行榜。每名學生在每個實驗部分的得分按照其個人在組內排名和整組排名綜合計算。
3 云實驗教學特色
(1)課堂教學手段更加豐富。以往受制于計算資源,課堂上的案例都只能給出過程描述和結果截圖,引入云端資源后,即便是在教室的機器上,也可以通過實操來向學生展示教學案例的實現過程,使其對其中的問題和解決辦法有更直觀的認識。
(2)實驗安排更加靈活。專業課的授課學生普遍較少,其中的實驗學時就更少了。以往2學時實驗的安排及集中在實驗室進行的方式都使得大規模綜合性實驗難以開展。云實驗的出現,使學生可以不受空間和時間的限制,同時擴大了實驗內容的范圍。
(3)學生學習更加主動。隨著實驗內容綜合性、實用性的提高,學生完成實驗的熱情也逐漸提高。演示型、體驗型實驗學生只能被動參與,云實驗由于只限定了輸入、輸出及基本辦法,具體的處理過程和方法細節都可以由學生設計,臺可為培養大數據應用型人才提供重要保障,滿足師生多元化與多終端的需求。
論文指導 >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >