36氪此前曾報道過大數(shù)據(jù)公司“Palantir”,這家估值200億美元的公司也引來國內(nèi)諸多初創(chuàng)企業(yè)對標(biāo), Image Q 正是其中之一。它是武漢烽火科技集團(tuán)內(nèi)部孵化的項目,定位做互聯(lián)網(wǎng)大數(shù)據(jù)語義分析應(yīng)用的平臺,可以實時抓取微信、微博等全渠道數(shù)據(jù),再結(jié)合政府、運營商等第三方數(shù)據(jù),根據(jù)知識圖譜,將其中的中文數(shù)據(jù)進(jìn)行智能語義分析,應(yīng)用于不同的行業(yè)中。
目前Image Q的業(yè)務(wù)主要應(yīng)用在4種場景下:1、輿情監(jiān)控;2、商情監(jiān)控;3、媒體熱點追蹤;4、人工智能報告。
輿情監(jiān)控服務(wù)主要是面向政府,Image Q 通過分析抓取數(shù)據(jù)并做出“正面、疑似正面、中立、負(fù)面、疑似負(fù)面”的數(shù)量反饋,來輔助政府、企業(yè)依據(jù)輿情做出相應(yīng)調(diào)整。目前Image Q分析識別的是文字信息,對于圖片則也是轉(zhuǎn)化成文字來處理,至于視頻識別之后也會提上日程。
商情監(jiān)控則是針對企業(yè),Image Q可以結(jié)合全網(wǎng)數(shù)據(jù)和工商數(shù)據(jù)幫企業(yè)分析競品及市場的動態(tài)。比如說,周黑鴨與絕味、久久鴨脖等等競品趨勢對比狀況如何?此外,還能夠根據(jù)一定算法計算出企業(yè)的品牌指數(shù)。
同時,Image Q的能力還可以輸出到媒體行業(yè),幫助其監(jiān)控預(yù)測可能成為‘爆點’的內(nèi)容,尤其是微信、微博等碎片化渠道。36氪此前報道過將傳媒內(nèi)容和大數(shù)據(jù)技術(shù)結(jié)合的“熱巢”,兩者業(yè)務(wù)有類似之處。
并且,Image Q還可以將上面的分析生成智能報告,用戶可以自定義搜索添加需要的輿情信息作為報告素材,并將數(shù)據(jù)以可視化圖表的方式呈現(xiàn),再輔以人工加觀點的形式,能在一定程度上簡化用戶進(jìn)行信息抓取、挖掘和可視化包裝的流程。
此外,平臺能幫助廣告主監(jiān)控直播傳播效果,以規(guī)避直播平臺的作弊行為。
但賽道上類似的公司已不在少數(shù),問及Image Q的優(yōu)勢,其CEO金俏強(qiáng)調(diào),首先,從數(shù)據(jù)來源的角度來說,Image Q背靠有央企屬性的武漢烽火科技集團(tuán),可以拿到政府、運營商的數(shù)據(jù)。
再者,在技術(shù)上Image Q擁有自主知識產(chǎn)權(quán)的NLP語義分析技術(shù),其大致流程是基于大數(shù)據(jù)詞庫輔以行業(yè)語料庫,通過關(guān)聯(lián)學(xué)習(xí)、知識圖譜以及相似度計算等方法實現(xiàn)智能語義分析,進(jìn)行情感判斷。她表示,在特定場景下的正負(fù)面情感分析準(zhǔn)確度達(dá)到80%-90%,經(jīng)過行業(yè)數(shù)據(jù)標(biāo)注學(xué)習(xí)后準(zhǔn)確率可達(dá)90%-95%。
此外,由于同一個詞語在不用行業(yè)的中表達(dá)的意思不一樣,所以需要建立行業(yè)知識圖譜來對機(jī)器進(jìn)行訓(xùn)練,可是完善這個圖譜不是易事,Google、IBM都鋪了大量人力、時間在做,那么創(chuàng)業(yè)公司怎樣去做?對此,金俏表示,首先他們瞄準(zhǔn)政府等幾個特定的行業(yè),這樣圖譜的范圍就可以縮小,另外他們采取人機(jī)結(jié)合的方式,可以通過政府的輿情專家、 人工打標(biāo)簽和一些學(xué)生采集員來進(jìn)行修正完成。
據(jù)了解,Image Q團(tuán)隊目前80多人,其中技術(shù)專家團(tuán)隊有70多人,平均學(xué)歷碩士以上。此外,公司正在進(jìn)行A融資,未來計劃5年內(nèi)獨立上市,迄今公司處于‘保本狀態(tài)’,金俏表示希望有更多資本介入以擴(kuò)充技術(shù)團(tuán)隊占領(lǐng)市場。