隨著越來越多的組織采用大數據技術處理大量、快速、多變的信息資產,通常很快就會面臨如何從中有效地獲得洞察力和商業價值的問題。
Talend公司產品高級總監Jean-Michel Franco為此表示,“大數據技術自然可以帶來高級分析措施。但當組織可以捕獲有關可以改進業務主題的大量信息時,不要只是了解事物表面,還想發現事物本質,找出根本原因,預測將要發生的事情,并準確地解決問題。而人類在沒有機器幫助的情況下獨自完成是很難做到的。”而人工智能技術已經成為一種理解所有信息的方式,并且實際上成為一種需要大量數據才能實施的學科。
因此,大數據和人工智能技術總是結合在一起是很自然的。商業轉型和外包咨詢服務商PaceHarmon公司總監JP Baritugo說:“大數據和人工智能之間存在著緊密的關系。大數據是燃料,人工智能是手段。”
但是在這一過程中,人們對人工智能和大數據如何協同工作產生了一些誤解,導致潛在的混亂,IT領導者應在采用數據驅動型策略時進行澄清:
1.某些類型的人工智能可能不需要大數據
例如,一些聊天機器人學習的輸入數據集可能比人工智能技術還要少。
Baritugo說,“‘垃圾輸入,垃圾輸出’的數據分析理念是適用的,因為組織需要足夠的良好數據來從其人工智能工作中驅動具有意義的價值。但需要多少數據可能會有所不同。”
Everest集團執行副總裁兼資深分析師Sarah Burnett為此解釋說:“大數據意味著由結構化和非結構化數據組成的大數據集,可以為人工智能的一些應用提供數據,例如需要大量數據來訓練人工智能、分析信息以發現模式,并用概率來提出問題的答案時,并非所有人工智能都需要大量數據。”
Baritugo 說,“通過設計,人工智能通常需要大型的規范化數據集(即大數據的“清理”子集)來有意義地識別模式并生成必要的輸出,其所需的數據量(包括培訓和評估數據集)主要由問題的復雜性、需要評估的輸入功能的數量以及所使用的算法決定。”
例如,機器學習(ML)通常需要比深度學習(機器學習的另一個子集)更少的數據來進行訓練。
2.并非所有大數據都需要人工智能的應用
人工智能可能有助于推動數據分析,但不一定需要從大數據中提取價值。ISG公司認知自動化和創新總監Wayne Butterfield說,“高級分析已成為大多數組織多年來利用的概念。這實際上取決于數據集的大小和需要分析的不同數據集的數量。就算專家擁有最聰明的頭腦,也不可能在有限的時間內在一些大型數據集中找到具有洞察力的模式,因此機器學習在完成繁重工作方面具有一定優勢,但是并非所有數據集都是龐大而多樣的,因此不一定總是需要采用機器學習(ML)才能從中獲得洞察力。”
IT組織還可以使用商業智能、分析和數據倉庫解決方案來分析數據并可視化見解。
3.高級分析和人工智能并不一樣
很多時候,人們使用“大數據”一詞來更廣泛地描述這些信息資產的高級分析,這并沒有什么問題。但是他們可能認為高級分析和人工智能也是可以互換的術語,這種想法是不對的。
Burnett說:“人工智能和高級分析緊密聯系在一起,但存在一些關鍵區別。例如,人工智能可以嘗試各種假設、自我學習并增強其分析。盡管人工智能技術可以分析數據,卻無法自我學習,只能依靠人類來設置其參數。”
4.大數據可能會扭曲人工智能模型
Franco說,“大數據為人工智能和機器學習奠定了基礎。獲得的數據越多,模型就越好。但是當數據不受控制時,也會給人工智能和機器學習帶來偏差。”
過分關注數據的數量而不是質量往往是罪魁禍首。Franco說:“當人們無法控制基礎數據時,人工智能和機器學習不可避免地會遭遇失敗。將大量數據收集到數據湖中并不能為人工智能和機器學習的成功奠定足夠的基礎。”
5.組織可能已經將人工智能和大數據結合在一起但卻不知情
Burnett談到智能文檔處理(IDP)軟件時說:“有些軟件解決方案已經內置了人工智能功能,可以隨時安裝、訓練和使用。這些解決方案加速了人工智能的采用,并幫助組織處理特定的業務需求。在這些情況下,不一定需要了解人工智能技術才能獲得收益。”
6. 人類證明了將大數據和人工智能結合起來的必要性
當涉及大數據和人工智能時,信任和透明度是關鍵。Franco說,“組織需要扎實的數據基礎,才能使用人工智能獲得正確的見解。而且,組織員工需要參與到數據治理的過程,以控制數據(數據質量、代表性、數據隱私)和算法(使用可解釋的人工智能能夠理解算法的內容)。”
7.并非所有數據都對人工智能有用
Butterfield說:“與人工智能結合使用時,通常在擁有大量數據和擁有正確數據以提供見解之間有著很好的平衡。人工智能并不是解決所有問題的靈丹妙藥,至少到目前為止是這樣。企業領導者需要意識到這一點。”
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。