由于人工智能取代人類活動的爭論越來越激烈,數據科學家開始體驗人工智能輔助自動化的好處和風險。
人們開始對人工智能被用來自動化一切事物的前景感到不安?,F在人工智能已經證明了它有能力替代一些藍領工作(通過機器人等)和白領職業(通過自然語言生成等),圍繞這種技術的文化敏感度正在上升。
這也許可以解釋為什么當談到人工智能的影響時,開始看到人們使用“自動化”這樣近似同義詞的描述。當討論自動化侵入到人工智能驅動應用程序的開發中時,一些觀察者更喜歡使用諸如“操作化”,“生產化”,“擴充”和“加速”等術語。人們還看到圍繞“自助服務”工具建立“可重復工作流程”等等的討論,這聽起來像是實現工作流程自動化的下一個邏輯步驟。
這種對“自動化”這個可怕字眼的厭惡,可能源于這樣一個事實,即使是數據科學家也開始擔心人工智能對于取代自己工作的潛在影響。正是在這種文化時代精神的考慮下,安德魯·布魯斯特(Andrew Brust)最近的一篇關于Alteryx“機器學習模型”的新操作工具的文章提供了一個非常好的討論,不僅討論了數據科學提高生產力的好處,而且討論了來自其他供應商的不同解決方案,所有這些都不同程度地將自動化推向了數據科學開發、部署和優化工作流程。
在對Wikibon的研究中,人們看到“數據科學的開發者”的激增,這是自動化的另一種委婉說法。雖然布魯斯特說,在數據科學工作流程中取代人工的前景“沒有什么好處”,但顯然具有很多功能并不完善,否則可能由不太熟練的數據科學家處理。
Alteryx的工具正處于前沿數據科學工具供應商現在所提供的主流,所以他們很好地展示了自動化數據科學家可以期待的方式:
·在推廣和部署階段,無代碼的Alteryx Designer tool自動生成定制的RESTAPI和機器學習模型的Docker鏡像。
·Alteryx新推出的工具,使用最近與Yhat獲得的數據科學模型管理技術,在Alteryx Serveranalytics平臺上自動部署模型執行。
·Promote可以根據不斷變化的應用程序需求自動縮放每個模型的運行時資源消耗。
·設計師工作流程可以自動訓練機器學習模型,使用新的數據接口,然后促進自動重新部署。
·反過來,通過跟蹤當前部署的模型版本并確保在生產中始終有一個足夠的預測模型,從而自動確保模型治理。
也許不應該夸大自動化的潛力,把數據科學家放在這個困境上。如果有的話,數據科學自動化工具將幫助他們少花錢多辦事。這些功能甚至可以減輕重復的任務,使數據科學家能夠將他們的技能發展到更具創造性和挑戰性的領域。自動化甚至可以讓數據科學家避免職業勞動力短缺的困境。正如“麻省理工學院技術評論”最近的一篇文章所指出的那樣,缺乏有技能的人員如果沒有達到一定的自動化程度,就可能會讓人工智能/機器學習革命中斷。
即使熟練的數據科學家也無法掌握交易的每一個技巧,這為自動化工具打開了大門,可以幫助他們動態優化模型超參數。
自動化正在進入數據開發、部署和管理流程的每個部分。更多的數據專業人士正在采用工業級自動化功能,以加快數據采集、準備、清洗和交付等可重復過程的執行。