在本次大會中,大地量子憑借產(chǎn)品“空間數(shù)據(jù)引擎”,在14日下午獲得了Best of WGDC獎的“2018年年度最佳口碑產(chǎn)品獎”。
領(lǐng)獎合照,左起第二位是大地量子創(chuàng)始人兼COO呂童博士。大地量子從參與評選的數(shù)百家企業(yè)中脫穎而出,成為46家獲獎企業(yè)之一。圖片來源:泰伯網(wǎng)
了解榜單更多詳情,請點擊:http://t.cn/RBWglw6
同時,大地量子出席了15日下午的智慧農(nóng)業(yè)峰會,并為大家?guī)砹司实难葜v,分享了關(guān)于目前時空大數(shù)據(jù)在基于農(nóng)業(yè)又廣于農(nóng)業(yè)上的各類應用前景和存在問題。
以下是演講全文。
王馳:
尊敬的汪院士、各位前輩、各位專家,大家好!我是王馳,是大地量子的創(chuàng)始人。我們公司是成立于去年年初的創(chuàng)業(yè)公司,現(xiàn)在主要做空間大數(shù)據(jù)應用。公司位于成都,目前是十幾個人的規(guī)模,其中有5位博士,而我自己在博士期間是做量子計算的。以上是我們公司基本的情況。
今天想在此作一些關(guān)于時空大數(shù)據(jù)結(jié)合農(nóng)業(yè)大問題的分享。時空大數(shù)據(jù)是關(guān)于時間和空間的大數(shù)據(jù),在座都是專家,我就不再班門弄斧,只是分享一下自己對于這個問題的感受。
時空大數(shù)據(jù)最大的問題是“大”
相比于其它大數(shù)據(jù)比起來,特點是大。例如遙感行業(yè)的朋友們會了解到,它每天的新增數(shù)據(jù)量是20T,每年新增數(shù)據(jù)量是7PB。7PB是是什么樣的概念呢?以家用的100M帶寬,要連續(xù)下載19年,才把這些數(shù)據(jù)下載完。然而,這樣大的數(shù)據(jù)并沒有很好地利用起來,利用率非常低,這就是時空大數(shù)據(jù)很大的挑戰(zhàn)。光是為了儲存這些數(shù)據(jù),每年都要買上1000張左右的硬盤。
演講中的王馳(趙盈 攝)
回顧全球人造衛(wèi)星,總共發(fā)射了963顆。隨著美國政策的不斷開放,美國FAA預計在未來十年,再發(fā)射2619顆衛(wèi)星,差不多是過去十年的三倍。這意味著,數(shù)據(jù)質(zhì)量會不斷上升,數(shù)據(jù)成本會不斷下降,也意味著數(shù)據(jù)總量會大幅度增加。
我們拿著這些數(shù)據(jù)干什么?怎么做我們想做的事情?
我認為有兩點至關(guān)重要:
1、算法;好比系統(tǒng)的大腦
2、算力;好比肌肉
算法的創(chuàng)新可以帶來更多的應用,比如說可以去監(jiān)測海浪的能量來幫助潮汐發(fā)電站正確的選址;算力則可以讓應用得到更好的發(fā)展。
關(guān)于算力
在實際應用過程中,會發(fā)現(xiàn)算力的提升比算法的創(chuàng)新更困難,且并不意味著多買一些CPU、一些硬盤,就可以提高算力,實際上整個過程相當復雜,而有些時候量變會導致質(zhì)變。對于我們來講,要兩手抓兩手硬——既要在算法上創(chuàng)新,也要在算力上提升,這樣才可以拓寬應用面。
舉例,我們拿著一個玉米的模型,想要去計算北京周邊種了多少玉米,可這樣的數(shù)據(jù)誰會關(guān)心?似乎沒有人關(guān)心北京周邊種了多少玉米。但如果把數(shù)據(jù)擴展到全球或者是中國,像中國種了多少的玉米,或是全球種了多少玉米,這樣的問題就有很多公司關(guān)心,例如期貨、基金、農(nóng)糧公司。不斷提高算力,會帶來更大的應用面,而這些應用面在小范圍內(nèi)是無法挖掘到的,這就是量變到質(zhì)變。
關(guān)于算法
在遙感衛(wèi)星數(shù)據(jù)的基礎上能開發(fā)出很多的算法,有些算法甚至是以前從來沒想過的。例如滑雪——通過遙感衛(wèi)星監(jiān)測雪的厚度,并把這個數(shù)據(jù)交給滑雪愛好者,讓他們在滑雪前可以先看一下雪場的雪有多厚,幫助他們做出正確的決策。這說起來挺簡單的,而實際做起來時,不僅有商業(yè)模式的問題,也有技術(shù)上的問題。而目前,更多的是技術(shù)問題。
龐大的數(shù)據(jù)量(趙盈 攝)從農(nóng)業(yè)延伸更廣闊的應用 我們回到農(nóng)業(yè)大問題。遙感在農(nóng)業(yè)中的應用,其實在美國已經(jīng)做得比較成熟了,特別是美國比較代表性的公司Farmlogs ,基于NDVI指數(shù),在農(nóng)田領(lǐng)域做得比較成熟,在美國擁有三分之一以上的市場。
而這樣的應用場景,中國是否可以復制?從衛(wèi)星遙感、衛(wèi)星時空大數(shù)據(jù)角度而言,它的優(yōu)勢在于大范圍地監(jiān)測、大范圍地去回答一些比較大的問題。在農(nóng)場級別,能做,但不是一個優(yōu)勢點。
可能一提到農(nóng)業(yè),大家就想到農(nóng)場,實際上農(nóng)業(yè)并不僅僅停留在農(nóng)場,農(nóng)業(yè)有很多的產(chǎn)業(yè)。
比如,作為一個農(nóng)場,要采購農(nóng)藥、化肥和種子。我們是否可以把宏觀的數(shù)據(jù),比如說作物分類的數(shù)據(jù)提供給這樣的農(nóng)資公司,讓他們進行市場決策?買了農(nóng)資之后,他可能會去貸款,找農(nóng)村金融、農(nóng)村信貸,或者是流轉(zhuǎn)土地。而偏金融的行業(yè)(在拿到農(nóng)業(yè)相關(guān)的宏觀數(shù)據(jù)后)是否可以做一些跟風控相關(guān)的東西?比如查看一個農(nóng)戶若干年的種植情況,判斷他是否認真種地,從而推斷他的信用。
再比如,農(nóng)場發(fā)生災害之后。大多數(shù)農(nóng)戶都購買了農(nóng)業(yè)保險,而農(nóng)業(yè)保險公司要去定損。現(xiàn)在的方法是派人到地里面去,拿著GPS在地里測。那么,這個定損過程能否(通過衛(wèi)星遙感大數(shù)據(jù)產(chǎn)品來)減少保險公司的人力?是否可以通過更大范圍的數(shù)據(jù)洞察,幫助再保險更好的服務于農(nóng)業(yè)保險,從而更好的服務農(nóng)戶?
(以上)這些是農(nóng)場的上游。在(農(nóng)業(yè))下游,東西種出來之后得賣,賣到哪里去?期貨市場就是比較好的利用領(lǐng)域。通過對產(chǎn)量的預測,比如說對全美玉米的產(chǎn)量或大豆產(chǎn)量進行預測,可以很好地幫助期貨、基金來預判一些風險。同樣,對于大宗貿(mào)易商或飼料廠商等會從期貨市場購買很多農(nóng)產(chǎn)品的公司,通過產(chǎn)量預測或者是作物的種植面積,能幫助他們減少一些風險。
比如種植面積,這是我們的一個案例:
作物分類識別案例 通過底層技術(shù)結(jié)合一些業(yè)務邏輯,可以開發(fā)出比較有意思的模塊。其中一個底層技術(shù)是,針對地球上面每一個像素來判斷它上面種的是什么作物。這個技術(shù)沒有我現(xiàn)在說的這么成熟,但它是現(xiàn)在我們研發(fā)的方向。如果可以把所有的像素點全部加起來的話,就可以得到美國全國的玉米種植面積。這個種植面積如果可以比美國農(nóng)業(yè)部USDA(United States Department of Agriculture)提前發(fā)布的話,那就是對市場而言很有價值的信息。
那么,通過作物識別和作物分類模塊,是否也可以結(jié)合其它的模塊(拓展新的應用領(lǐng)域)?比如通過作物識別,結(jié)合衛(wèi)星來監(jiān)測洪水。
如果可以把水稻的種植分布和洪水結(jié)合起來的話,(這些價值數(shù)據(jù))可以提供給農(nóng)資企業(yè),讓他們知道這里水稻受災之后可能需要補種,是不是要往這些地方銷售一些產(chǎn)品;或者提供給保險公司,(讓他們)在這些方面進行比較精準的洪水定保。
這是我們想要做的方向和創(chuàng)新,通過底層技術(shù)和其它技術(shù)結(jié)合起來,然后結(jié)合業(yè)務邏輯,做有意思的事情。
關(guān)于算力方面,也有兩個比較簡單的案例。這是我們處理的10m分辨率的全國耕地分布圖:
耕地分布圖 在這上面可以在10m分辨率下清楚地看到鄉(xiāng)間的小路。中國有19億畝耕地,每個像素是100平方米,有興趣可以簡單算下需要對多少像素進行計算才可以得到這樣一張圖。
這是美國地區(qū)產(chǎn)量的預測:
做這張圖差不多需要處理60億個像素。即使在里面用到AI的模型,如果一秒鐘可以計算一個像素今年的產(chǎn)量是多少,那么對于20多億個像素,計算時間也會超過60年,這是算力的問題。很多時候,會忽略了算力對于整個空間大數(shù)據(jù)產(chǎn)業(yè)在應用時的重要性。
歸根結(jié)底都是技術(shù)的問題
回歸到時空大數(shù)據(jù)的應用,我們認為,和用戶業(yè)務場景、業(yè)務邏輯結(jié)合過程中,要深入的理解(用戶所在的)這個行業(yè)——(如何深入另一個行業(yè))這是很大的問題。同樣,算法和算力的創(chuàng)新,也是很大的問題。但歸根到底,在目前階段,用戶的需求其實是相對比較清晰的。往往很多時候是技術(shù)上的無法實現(xiàn)——要么是因為算法做不到,要么因為算力不行,無法做到大規(guī)模的實現(xiàn)。目前遇到的問題,歸根到底都是技術(shù)問題。經(jīng)常有朋友跟我說,在這個行業(yè)市場是需要被教育的,但我并不是這樣認為的。我覺得需要被教育的我們自己,我們需要更深入了解行業(yè),以更虔心的研發(fā)技術(shù)。比如用戶提出要95%的精度,我們不可能教育用戶說你其實需要90%就行了,(反而是)我們要力爭做到95%以上。要在這個行業(yè)建立認知,在技術(shù)上不停發(fā)展的話,我們是為整個行業(yè)提供基于時空大數(shù)據(jù)的基礎數(shù)據(jù),為其它行業(yè)進行賦能,而不是取代其它的行業(yè)去做(那些行業(yè))它們本身做的事情。要么幫助他們(其它行業(yè)的從業(yè)者)做市場的決策,要么增加一種新特性吸引更多的C端用戶,要么提供市場的洞察,獲取更多的leads。這是時空大數(shù)據(jù)產(chǎn)業(yè),去做的事情。