<menu id="68a8e"></menu><nav id="68a8e"></nav>
  • <menu id="68a8e"><menu id="68a8e"></menu></menu>
  • 中國人民大學朝樂門:不用已知解決未知 做數據科學的拓荒者

    圖片1.png

    摘要:隨著中國信息技術飛速的發展,云計算、AI、5G等創新技術被更多地運用到教育手段變革、教育資源共享之中。阿里云提出的“飛天加速計劃”也在后疫情時代,通過云力量幫助中國高校培養新一批創新人才。

    自21世紀初以來,人們發現大數據在量級、類型、價值密度以及處理速度要求等方面已經遠遠超出了傳統知識解決問題的能力,但現階段人們掌握的知識卻并未隨之升級。這一矛盾便催生了一門新的學科——數據科學。

    與此同時,整個2000年代,國外大量頂尖的學術期刊開始承認數據科學是門新興的學科。2009年,Natahn Yau首次提出了“數據科學家”的概念,并將其定義為采用科學方法、運用數據挖掘工具尋找新的數據洞察的工程師;2012年,數據科學家Thomas H. Davenport和 D.J. Patil 在《哈佛商業評論》發表了一篇文章《數據科學家:21世紀最性感的職業》,這一新興的職業群體開始被更多人好奇并在國外迅速走紅。

    同年,中國人民大學信息資源管理學院的朝樂門正在研究基于語義web的知識處理。但平時常常瀏覽數據科學領域頂尖人物發言和論文的他驚奇地發現,不僅自己崇拜的技術大牛在討論數據科學,就連全球著名的統計學家、計算機科學家,包括一些知名實驗室都開始進行數據科學的研究。

    憑借對學術的敏感,朝樂門認定,數據科學絕對是未來產業,迅速懷著一腔熱血進入了在國內尚屬無人之境的數據科學領域。迄今,朝樂門已經在數據科學道路上走過了十年。

    打破質疑,做專業的拓荒者

    其實,在朝樂門正式轉到數據科學專業之后,身邊的同事和朋友都不是很看好,甚至有的人認為數據科學是不值得研究的偽科學。在朝樂門看來,別人對數據科學的誤解,是因為不夠了解,那就更需要有人在這個專業做一個拓荒者。

    朝樂門提起一件趣事,有一次他在一場學術報告上講到要培養數據科學家,有位老教授委婉地對他說,教書育人是教師的天職,但通過一門課程和幾個學期培養一個科學家不太現實。朝樂門這時才知道,聽眾理解的數據科學家和作為一個崗位存在的數據科學家根本不是一回事兒,那周圍人不看好這個專業再正常不過了!這也給了朝樂門啟發,一定要花時間把核心的概念界定明確,如果不能真正的理解,就不會對這門學科產生真正的興趣。

    懷揣這份熱忱,辛苦耕耘三年多,朝樂門終于在2016年出版了我國第一部系統闡述數據科學理論與實踐的重要專著《數據科學》。朝樂門介紹,一開始不少老師是不買賬的,質疑的聲音此起彼伏,他就給這些老師每人都送了本書。果不其然,老師們看完就對朝樂門的態度發生180度大轉變,因為這本書深入淺出地講解了大數據及其背后的新理論、新方法與新技術,既涵蓋了數據科學的基本內容,又避免了課程低級重復。同時,很多老師也看到了朝樂門是在認真做研究,被他腳踏實地、嚴謹治學的研究態度和做事態度感動了,不僅稱贊連連,還對數據科學產生了新認知。

    《數據科學》這本書填補了國內數據科學的空白,也讓求學者的Email和電話像雪片一樣飛向朝樂門。他們希望朝樂門能夠提供教學資源、PPT代碼等,朝樂門便把這些資源全分享在GitHub上,建立了數據科學導論開源課程社區,讓大家可以在自己課程的基礎上不斷更新優化,最終開發出一個可以通用的版本。據了解,目前已有超過200所學校的教師申請加入了《數據科學導論》課程的開源行動。

    不知不覺間,朝樂門也發現了身邊的變化。那些曾經在他轉變方向時提醒他或質疑他的人,現如今也投身數據科學及相關領域,甚至相繼從事相關課題研究、編寫專業書籍或開設相關課程。在數據科學的漫漫求索路上,朝樂門終于有了伙伴。

    面對新鮮的概念,不能用已知解決未知

    考慮到這門學科的難度,朝樂門在教學中形成了一個固定的習慣。凡是自己組里有新來的碩士生和博士生,都必須先讀完幾本最權威、專業的文獻或入門書籍。

    有一次,朝樂門在周五給一個學生下了為期三個星期的讀書任務,結果周一這個學生就讀完了,因為看不懂的地方全都跳過了。朝樂門當場批評了這種讀書方式,他告訴學生,只在自己了解的領域里讀書是不能改變自己認知和知識結構的。尤其是做數據科學,越難以理解的部分越要讀,把薄的書讀厚,把厚的書讀薄,才能真正把數據科學的知識和自己的知識體系鏈接起來。

    在未知的問題上花無限的心思鉆研,不僅是朝樂門對學生讀書的要求,在帶領學生實踐調研中,他也是這么做的。因為數據科學專業的特殊性,朝樂門每年都會帶領學生進行課程調研工作,學生在調研工作中主要負責采集數據,朝樂門則負責分析數據。有時候學生會把自己知道的東西直接放在內容里,在朝樂門的多次提醒下,學生們逐漸在心里刻下了老師的教導——“數據科學是沒有數據就沒有發言權的一門學科,不能把已知的東西來解決未知的問題,也不能擅長什么就講什么,我們要跟數據科學對齊,而不是讓數據科學跟我們對齊!”

    在朝樂門看來,這也是他與其他數據科學老師最大的不同。探索數據科學本身的內核及其自然的屬性是他關注的重點,“不用已知解決未知”是他始終堅持的教學觀點,也是他對數據科學最基本的尊重。

    朝樂門對這門學科的尊重也收獲著回報。有正在籌備數據科學項目的單位對朝樂門拋出合作的橄欖枝。他們說,這幾年親身感受到數據科學越來越熱,但研究外圍問題的人比真正研究數據科學的人多太多,所以希望有一個朝樂門這樣的真正的數據科學家加入。

    平衡社會需求與學生興趣,加速人才培養

    大數據時代,數據科學短短幾年發展迅速,很多企業都提供了有競爭力的崗位。朝樂門對此喜聞樂見,但同時也在教學中遇到了與社會需求脫節的問題,這讓朝樂門開始把適應社會需求放在最重要的位置。

    朝樂門記得,第一次重視這個問題是因為看到學生在為了參加企業面試刷數據科學的題目,感到很疑惑,因為他覺得聽自己的課就夠了。結果學生毫不留情地跟他說,“你講的東西人家不一定考的?!边@件事讓朝樂門陷入了沉思,隨后便立刻成立了小組,搜集數據科學和大數據領域的各種面試題,按照出現頻次排序,形成了一個近2000道題的題庫。

    經歷這次學生面試帶來的“刺激”,朝樂門在后來的教學課程建設和內容優化中一直以適應社會需求為原則,并大刀闊斧地展開了一系列新動作:堅持每年進行三大調研——更新崗位面試題、課程建設、專業建設。

    更新面試題庫,讓每一屆學生在面試時都得到最新的知識補給。通過調研全球范圍內一流大學的數據科學課程建設,優化自己的教材內容和大綱。補充調研相關的課程,及時關注數據科學專業是否有新增課程或特殊課程。

    每年秋季,朝樂門會帶領學生開展調研工作,完成后深度消化,就可以應用在來年的春季學期了,這種更新速度一定程度上也保持了學生學習的興趣。

    與此同時,朝樂門也越來越注重學生應用實踐能力的培養,希望讓學生走入社會后能夠真的學有所用。

    要適應社會需求,光更新理論是不行的,還要找一個工業級的平臺讓學生模擬實驗。朝樂門在收到學校發的教育部產學合作協同育人項目通知后了解到,阿里云可以為教學提供工業級的實訓平臺,與市場上最新的應用案例和前沿技術接軌,便迅速展開了與阿里云的合作。朝樂門在阿里云天池實驗室中增加了數據分析與數據科學案例,將全部課程實驗和作業都搬到了阿里云上。

    為了讓學生更愿意鉆研實踐,朝樂門還依托天池開發了一個實訓項目——《數據科學實訓課程研發:上市公司營收大數據分析》,分為5分鐘、15分鐘、45分鐘、135分鐘等多種版本的教學案例,使其更適合教師在課堂教學中引用。

    朝樂門介紹,在自己主講的《數據科學理論與實踐》課程中引入實訓項目,學生們都很喜歡。他們的認可反映在課程評分中,為這門課打出了99.89的高分,還在評價系統里驕傲地留言,“這是我們做的一個大項目”。朝樂門對項目取得的效果很滿意,“對于一門有難度的課程而言,能夠讓學生獲得滿滿的成就感并不容易,而培養學生的興趣更是比講授多少知識點都重要?!?/p>

    據介紹,通過與阿里云的此次合作,朝樂門的課程項目成果之《數據科學的產教融合課程建設》獲得了教育部產學合作協同育人項目專家組認定的優秀案例項目稱號,這是產學合作領域的最高榮譽。朝樂門希望,通過產教融合,能夠讓學生既能培養學習興趣和熱情,也幫助學生快速成長為滿足社會需求的專業人才。

    精進篤行,做數據科學領域最努力的人

    堅持、努力、不斷的精進,讓朝樂門在數據科學領域取得了璀璨的成績。他開發的《數據科學導論》課程憑借線上線下互補的教學模式和科學全面的教學內容建設先后榮獲“國家精品在線開放課程、國家級一流本科課程”稱號;負責主編的教材《數據科學理論與實踐(第二版)》榮獲“北京市高等學校優質教材”稱號;圍繞與阿里云合作的課程建設,成功申請并獲得1項國家級項目和2項省部級項目。

    無論是發表在核心期刊上的論文數量,還是編寫的數據科學教材、開發的優質課程、合作的產學項目,朝樂門都是數據科學領域國內產出最多甚至最早的老師之一。

    2021年秋季學期,熱衷創新的朝樂門又馬不停蹄地開了一門新課《數據故事化技術前沿》。他在這門課里添加了很多前沿核心技術和新穎好玩的故事,希望能在教學中帶給學生更好的學習體驗效果。在開這門新課的同時,他也提到了自己關于產學合作更具體的規劃,因為任教的中國人民大學是一所人文學科氛圍濃厚的學校,他想要把數據科學與人大的社會科學管理結合起來。他也希望數據故事化能成為數據分析軟件的主要功能模塊之一。

    跟著朝樂門做調研、做項目的學生曾經問過他,“老師這么拼,是不是想做領域里最牛的人?”朝樂門回答,自己只想做數據科學里最努力的人。他想趁著年輕多學一些東西,多干一些實事,如此,方能在無法再在這條路上奔跑的年紀擁有談論收獲的資格。

    關于“飛天加速計劃”:

    “飛天加速計劃”是阿里云2020年推出的項目,通過為全國高校師生、開發者提供免費ECS算力資源,以加速云計算的校園普及,助力培養數字新基建人才?!帮w天加速計劃”自發布以來,已累計輸出6.4億小時免費ECS算力,2200所高校十萬余名師生因此認識了云計算,并且借助云的力量便捷地使用計算資源開發自己的應用,搭建“小而美”的云上世界,同時成就自我。

    2021年,阿里云持續加碼,推出“飛天加速計劃2.0”,致力于在3年內提供價值15億元的資源扶持,助力開發者應用創新,助力開發者全生命周期成長,培育數字時代的創新人才。https://developer.aliyun.com/plan/articles


    相關文章