我們都知道一句話“巧婦難為無米之炊”,數據源就是讓數據產生價值中的那些大米。那大數據時代企業需要哪些數據呢?根據我個人理解我覺得可以大致分為以下幾類:
1、(內部)企業自身業務生產經營環節產生的內部數據,包括銷售、客服、倉儲、財務等;
2、(運營)可以理解為企業發展過程中掌握在第三方手中的數據,如企業的廣告供應商以及一些傳播與媒體數據,新媒體、H5、app等;
3、(外部)包括傳統調研數據和機器數據,搜索、電商、社交等。而對于外部數據的獲取上,企業往往會覺得有難度,這時候就可以借助API供應商的力量來補充自己的數據源。
先來科普個概念,開放應用程序的API(即Application Program Interface,應用程序接口)可以讓開發者在無需訪問源碼,或理解內部工作機制細節的情況下,調用他人共享的功能和資源。在數據源的獲取上API是個好伙伴。本文將介紹7款API供應平臺:百度APIStore、Apix、數說聚合、通聯數據、HaoService、聚合數據、datasift (排名不分先后)。
一、功能對比
二、詳細介紹
1、百度API Store
百度旗下的API Store,能夠滿足大部分個人應用開發者,特別是其最近推出的Android和IOS SDK。其接口分類較細,但是感覺有一些分類之間存在交集,沒有明顯的邊界區分。接口、數據更新速度也比較快,支持個人發布與定制化服務,上千的接口量基本可以滿足一般開發者的需求。提供移動開發SDK,移動開發者可調用API Store服務所開發的SDK包,加上API文檔清晰明了,上手簡單。
缺點就是由于接口雜亂繁多且來源不一,部分接口的質量、穩定性沒有保證。
2、Apix
Apix更多是面向小貸機構、互聯網金融、租賃保理等行業客戶,除了提供身份核驗、工商信息、失信名單、支付繳費等接口,還有包括電商、學歷信息、運營商記錄、信用卡賬單等分析服務。其數據分類包括征信風控、支付繳費和常用數據,而征信風投是其主打數據。由于這類數據具有專業性,因此收費相比其他API會稍微偏高。
接口大多數是Apix自主開發,質量有保證,部分核查接口的高級版還能聯網檢測,就是接口的數量確實有點少。
3、聚合數據
聚合數據跟百度的APIStore有點像,接口包括生活、旅游、金融、開發、咨詢等分類,還比較全面,更加適合對接口質量和穩定性有較高要求的公司或企業級應用的開發者。但是并不支持個人發布,因此接口的質量和穩定性會比較好,但也正因為這樣接口量大大減少。
聚合數據給我的感覺更像是致力于打造高質量API,不求廣而求精。不過申請使用接口需要實名認證和審核,算是雙刃劍吧,對于買賣雙方來說是一個保障,但是對于試用者來說是一個不太好的體驗。
4、HaoService
Haoservice近期更新后推出了源碼商城,用戶可在上面直接購買商城、管理系統、UDP通訊源、發布系統等源碼??傮w來說比較適合公司或企業級應用的開發者。其主打生活服務類接口,主推基站、定位、地址解析、坐標服務等API,目前僅支持企業用戶發布接口,因此接口的質量和穩定性有保障,但接口數量也是一個痛點。VIP級別以上用戶可進行個性化定制,且有專人24小時技術支持,服務到位。
5、通聯數據
通聯數據提供行情、滬深股市/期權、債券、基金、咨詢、研究報告等API,適合金融類應用和金融咨詢網站、平臺的開發者,以及從事金融行業的分析、業務人員。通聯數據主要做金融大數據,上千的數據接口可以滿足金融行業的大部分需求。
數據有API和研報兩種格式,接口來源于自主研發或恒生聚源、九次方大數據、華通人、朝陽永續、中誠信資訊、巨靈財經等企業。
6、數說聚合
數說聚合跟上面的數據API不同,面向的客戶不只是大數據應用開發者,對互聯網數據有強烈需求的各行業分析師、業務人員、運營人員同樣可以通過數說聚合拿到你們想要的數據。數據覆蓋范圍廣泛,包括國內社交、新聞、電商、互聯網垂直領域等多平臺多維度的數據。用戶可以通過接口調用、文件下載等方式獲取數據。接口完全自主研發,質量、穩定性十分有保障,且支持個性化定制。
不過目前只面向企業用戶,個人用戶想要使用可能還需要一段時間。
7、Datasift
Datasift的性質與數說聚合相似,其數據基本覆蓋國外主流網站,包括Facebook、Tumblr、Google+、YouTube、Instagram等,且提供數據分析服務。來源于國外站點的數據質量較好,不過可能是服務器在國外的原因,響應會有明顯的延遲;而國內站點數據的話,小編曾經在datasift購買微博數據(當時在國外無法通過國內公司購買微博的數據),數據質量只能說一般。
其業務目前暫未向國內市場開放,只能通過特殊途徑購買。
以上是國內外比較知名的數據API產品,基礎性的可能更多會選擇百度APIStore、聚合數據、Haoservice;而對于行業、專業有特別需求的用戶來說,通聯數據、Apix會使不錯的選擇;如果是需求國內社交、電商、資訊平臺的數據,可以考慮數說聚合;如果是要國外數據,小編則比較推薦Datasift。讀者可根據自身的需求,選擇最適合的API。