“雖然我們沒能完成最終作品的提交,但還是學到了不少知識。”
“這次的考題完全找不到頭緒,如果給我一周時間,也許可以給出更好答案。”
“居然沒有有效的標注數據,幾乎奔潰了,這比賽太真實了吧。”
“我們是搞圖像識別的,這回領教了語義識別的難度。”
在剛剛結束的第三屆大賽中,AI參賽者們遇到了“巨大”的困難。這究竟是個什么比賽,為什么大家叫苦不迭,讓小編給大家說說看。
9月2日,第三季 “Power AI 人工智能馬拉松編程大賽”在馬哥孛羅酒店開幕,此次大賽主題是“挖掘制造工藝和流程的金礦”,活動由CSDN、IBM、e-works聯合舉辦,旨在推動人工智能在傳統制造業的應用落地。大賽的消息放出去以后,在國內人工智能算法領域引起廣泛關注,報名踴躍。活動報名123人,主辦方經過嚴格選拔后由76位開發者自由組隊形成的20個團隊參加了現場決賽圈的比賽(因為題目很難,只有11支團隊提交了可以運行的作品), 10000+以上用戶通過映客平臺觀看了活動直播。
跟其他人工智能算法大賽相比,本次Power AI馬拉松大賽有三個特點:
亮點1:技術架構領先
PowerAI架構可獨享 NVIDIA NVLink 技術的 AI 計算平臺,開發平臺支持TensorFlow,訓練速度可提升100倍以上,與x86架構形成鮮明對比……優勢多多,絕非俗流,未來在金融、電信、保險、制造等核心業務領域中將有廣泛的應用。
亮點2:緊貼行業
本次大賽面向AI技術精英及在校優秀學生,通過開放真實的制造業數據,結合行業難點課題,向算法天才征集AI解決方案。參賽選手將通過對大量非結構化文本數據建立相關模型,分析和理解其中語義。類似模型可以在制造業的新產品設計、工藝和流程改進等方面,幫助設計和研究人員更快速借鑒既有經驗從而加速產品設計、工藝和流程改進的過程,從而有力的推動人工智能在傳統制造業中的創新應用。
活動亮點3:AI評判
比賽使用了自己開發的一套裁判程序。其中包括一個“搶答”部分一個答案自動判斷部分。主辦方從兩個方面來考察選手的模型和程序:一個是inference的速度,另一個是答案的準確性。
選手通過每一輪的問題進行搶答,只有第一個送回正確答案的隊伍才能在這一題得分。關于如何判斷答案的時間順序,程序中使用了消息隊列來記錄選手送回答案的時間。正確性的判斷通過使用的語料構建了一個模型來進行自動判斷。
除此之外,如果選手的模型中使用到了大賽說明中提到的一些比較前沿的算法的話,評獎嘉賓也會有相應的額外附加分,基本上還是以搶答部分的得分為主的。
(AI比賽,AI自己評判結果,這個創意絕了!)
考官挖了哪些坑?
1、數據沒有清洗
這里面涉及到中文的繁體、簡體問題,有編碼問題,全角、半角的問題,這些其實都是中文里非常常見的問題。數據一旦清洗的不是很好,一定會影響到后面訓練的過程。如果這方面經驗不足,就會很容易與其他團隊拉開差距。
2、特意規避了一些字詞
你如果試圖用關鍵字、關鍵詞、關鍵短語來搜索問題的答案是找不到的,因為有很多問題的答案是跨行的,甚至是有順序關系的。我們想看看這些選手在這種最新的領域里面,是不是能夠很快地把新的paper轉換成能夠實驗、嘗試的模型。
(畫外音:大部分考生都哭暈在考場)
這么難的題,誰獲獎了?
一等獎團隊合影
一等獎團隊,來自中科院聲學所,現金獎10000元。
二等獎兩支獲獎團隊,分別由來自中國科學院自動化研究所和騰訊公司(北京)組成的第五組,以及來自北京大學&微軟亞洲研究院的第十九組,現金獎8000元。
三等獎三支獲獎團隊,現金獎5000元。
為啥她們是第一名?
IBM中國系統實驗室高性能計算部門開發部經理宋煜表示:“就技術而言,大賽看重模型的設計能力,不只是復制和使用既有的模型,更重要的是能夠有模型設計上的創新。來自中科院聲學所的冠軍團隊使用了兩種方案。在最后的方案中使用了Bi-direction LSTM+Attention-LSTM。由于標簽數據量有限,他們用R-Net的Attention機制對問題和篇章進行表示,然后再次使用Attention-RNN在篇章上進行Auto Encoder最后使用帶Attention的Decoder生成答案,替換掉原來R-Net的輸出層,巧妙降低了標簽數據不足的影響。同時,在比賽中,該團隊有著良好的項目分工,在轉碼,異常字符處理,詞和字的特征提取以及匹配算法上都做了相應的調整和優化,最后達到一個良好的效果,從而贏得了比賽。”
(畫外音:小伙子們,你們不行啊!)
一等獎的美眉團隊(唯一男組員哭了)有技術、有分工,巾幗不讓須眉,又一次把男同胞拍在了沙灘上!
獲獎MM選手感言
“最大的收獲,我們能在一個團隊中工作搭配的很完美,這是最重要的。借用一句話獨狼死,群狼生。”“有了這一萬元明天先吃頓大餐,我們組寫代碼都沒吃晚飯。”嘉賓寄語
“當下,人工智能正處于深耕行業應用的關鍵點,中國也將人工智能上升為國家戰略。但把新技術應用到實踐中,不是一蹴而就的。比如,開發者學了模型、訓練數據后,并不一定能真地用在生產線。相信一天的比賽下來,選手們遇到不少挑戰,而賽題的設計就是一步一步地帶領大家解決這些難題,在其中體驗、學習人工智能最新的技術,學會用人工智能解決行業中的實際問題。IBM希望通過舉辦這樣的活動,發掘、培養更多人工智能創新人才和團隊,共同引領人工智能在行業實現新的突破、新的繁榮。” ——IBM全球副總裁、IBM中國系統開發中心總經理謝東博士表示。
除此之外,CSDN &《程序員》總編孟迎霞前往現場致辭, TCL集團副總裁、虧聯網事業本部總裁、豪客虧聯網有限公司CEO孫良先生帶來遠方寄語。
賽后合影
小結
云計算、大數據、VR/AR、人工智能、區塊鏈……技術圈每幾年都會出現各種新的技術潮流,對于開發者來說,如果我們選對了未來技術方向,那必將事半功倍。現在,最火的技術非人工智能莫屬了,我們轉型AI的決心就差這一場實戰馬拉松了。CSDN 作為中國最大的開發者社區,還將攜手IBM等合作伙伴共同主辦了多場不同行業、不同技術點的人工智能大賽,希望大家繼續關注我們的更多報道。
本次大賽的一等獎團隊美眉主打天下,下次比賽男同胞們要加油了。