這就是Import.io的用武之地。這家位于加利福尼亞州Los Gatos的創業公司利用機器學習來自動提取和處理網絡數據,今天該公司宣布獲得了1550萬美元的B輪融資。總部位于倫敦的Talis Capital領投,現有投資者IP Group、OpenOcean、Oxford Capital和Wellington Partners也參與了此輪融資。該公司在2013年的種子輪融資中獲得了450萬美元的投資,在2016年的A輪融資中獲得了1300萬美元的投資,本輪融資使其融資總額達到了3300萬美元。
該公司的首席執行官Gary Read表示,這些資金將用于加速全球增長并擴大Import.io的產品供應。他表示,自從該公司于2012年在柏林注冊成立以來,已經吸引了800多家企業客戶,他們通過其專有平臺接收來自數百萬個網絡資源的數據。(僅在2015年,它就從超過55億個網頁中提取數據。)
Read 表示:“由于無法及時獲取高質量數據,全球各地的企業可謂損失慘重。事實上,據IBM估計,質量差的數據每年使美國企業付出的代價超過了3萬億美元。Import.io致力于提供及時、高質量的數據,幾乎沒有客戶資源要求。我們讓我們的800多家企業客戶能夠根據我們每天提供的數據制訂重要的業務決策,并通過積極的服務級別保證來支持這一點。”
Import.io的新穎機器學習解決方案不僅可以提取數據,還可以將其準備并集成到客戶的分析平臺和業務應用程序(如Tableau)中,從而有效地將網站轉換為API。例如,創業企業StoryFit使用它來獲取數十萬個網頁中的書籍、電影和電視數據相關的信息,以便為電影制片廠和圖書出版商生成預測分析。另一家客戶AudioLock利用它來掃描網絡上的未經許可的音樂內容。
Import.io的數據爬蟲套件還提供了更復雜的功能,例如從多個源合并信息并為其創建通用模式的功能。它還提供報告和可視化工具,包括顯示事物如何變化的比較審核。
Talis Capital的Matus Maar認為這種方法使其有別于Webhose.io、DeepCrawl等競爭對手。