大數據時代的到來已經開啟了人類社會利用數據價值的另一個時代,每天人們的日常工作生活都會產生巨量的數據。對于一個企業來說,這一時代的來臨既是機會,也是挑戰,商機利潤無處不在,卻也瞬息萬變,決策力和效率一旦下降,很有可能被淘汰。移動互聯網、物聯網產生了海量的數據,大數據計算技術完美地解決了海量數據的收集、存儲、計算、分析的問題。然而大數據廠商如雨后新筍層出不窮,質量也參差不齊,對于企業來說如何挑選大數據分析提供商呢?下面本文為您梳理國內熱門大數據分析提供商及其主要產品。
一、IBM
產品類型:
1.基于Hadoop:
IBM BigInsights for Apache Hadoop——在企業平臺上提供符合大數據分析需求的分析功能,性能高、易用性強,支持大規模部署,可加速實現價值。
IBM BigInsights on Cloud——在IBM的全球云基礎架構上提供Hadoop即服務,提供與在本地部署InfoSphere BigInsights一樣的功能,且無需本地基礎架構即可利用大數據分析,隨需擴展,提供高級工具加速現實價值,安全性較高。
2.基于流計算:
IBM Info Sphere Streams——高級計算平臺,擴展企業現有系統價值,幫助應用程序快速攝取、分析和關聯來自數千個實時源的信息,數據高吞吐率美妙數百萬事件或消息。
IBM Anonymous Resolution——提供匿名地確定,使金融、政府、執法、醫療、工業協會等行業能夠進行匿名協作,且協作有高安全性。在提供身份識別的同時,加強個人隱私保護,審慎記錄是否重疊,并可以提供跨組織風險管理。
InfoSphere Global Name Management——利用特定文化的姓名數據和語言規則,幫助管理、搜索、分析和比較多文化的姓名數據集。對文化傳統、相關國家、性別和姓名解析進行識別與分類,從而支持可行的業務決策,處理多國語言音譯。
InfoSphere Identity Insight Solutions——可應對威脅和欺詐的實時身份解析和分析平臺。幫助組織和企業識別威脅、欺詐和風險并降低其發生率。功能點:身份解析、關系解析、復雜事件處理。
IBM對于Hadoop的研究5-6年前就已經開始,其研究成果涉及很多方面,InfoSphere是其2011年推出的產品,是專門針對大數據分析的平臺產品。平臺包括BigInsights和Streams,兩者互補,BigInsights對大規模的靜態數據進行分析,提供多節點的分布式計算。Streams采用內存計算方式分析實時數據。
BigInsights可與DB2、Netezza等集成,是更適合企業級的大數據平臺,并且IBM對其做出了很多改進,尤其是架構方面,使其分析能力更高,更能適應企業級需求。BigInsights對IBM推出的GPFS SNC平臺進行支持,以更好的利用其強大的災難恢復、高可靠性、高擴展性的優勢,沒有單點故障,讓整個分布式系統更加可靠。
IBM是經典老牌科技廠商,其信譽及產品性能和安全性都十分有保障,但價格在行業內也屬較高檔次,使用其產品的大多是大型公司及金融政府等領域的企業單位。其大數據分析解決方案比較全面,如果對信息質量、大數據處理效率及安全性各方面要求都比較高,IBM的產品比較適合。
經典案例:
1.IBM幫助騰訊網為中國球迷創造全新的觀賽體驗
2014年巴西世界杯,各大媒體爭相報道,市場競爭愈演愈烈,騰訊網若想脫穎而出,需要給球迷們全新的觀賽體驗。在過去,中國球迷看到的賽事報道,都是媒體主導的報道方式。而這次報道,騰訊網借助IBM SoftLayer云平臺,快速部署大數據分析所需的 IT 基礎架構,實時抓取了海量的中國球迷社交數據?;赪atson技術的社交大數據分析平臺,在抓取社交數據的同時,還融合了語義分析技術,能夠準確挖掘出億萬中國球迷的觀點與喜好,并融進騰訊網的世界杯報道中,開創了賽事報道的新模式。騰訊網在 2014年巴西世界杯期間,頁面訪問數量增長了54%,體育文章點擊率增長 134.5%;
2.意大利帕馬森雷佳諾干酪同業公會通過大數據分析來鑒別仿冒的干酪
意大利帕馬森雷佳諾干酪同業公會成立于 1934年,是一間防止造假或無證生產帕馬森雷佳諾干酪的質量監控聯營公會。過去,判斷干酪的真偽是一個極為耗時的復雜過程,需要手動抽查 600多家乳品店。而現在,IBM 的大數據分析解決方案提供的條碼標簽和傳感器功能,讓其能夠有效監控日常生產與產品,從而幫助他們準確判斷和追溯每批產品是否純正。據某調查分析,一家普通公司每年因為被欺詐就會損失5%的年收入,全球每年因為被欺詐損失了3.5萬億美元。
3.美國迪凡斯動物園使用大數據分析來預測游客行為
以前,迪凡斯動物園和水族館只能憑借以往的經驗猜測每一天的游客數量,并決定聘用多少員工以及準備多少物資?,F通過IBM大數據分析解決方案,他們可以將移動端驗票及天氣預報等多個不同來源的數據關聯在一起進行綜合分析,實現了對游客數量的精準預測。同時,從這些數據中獲取洞察,幫助他們能夠更好地預測游客需求,并且做出更加有效的業務決策,讓游客在每一次游覽中都能獲得滿意的服務。
二、Oracle
產品類型:
Oracle Endeca Information Discovery——提供日常決策的數據探索功能,幫助組織快速瀏覽所有相關數據,整合不同系統的結構化與非結構化數據,自動整理信息搜索、發現和分析。
Oracle Advanced Analytics——將Oracle數據庫擴展為高級分析平臺,將企業分析應用與BI環境無縫集成,支持啟用廣泛性預測分析,并可以導入第三方模型。分析打分速度快,部署靈活、成本較低。
Oracle Advanced Analytics通過兩個主要組件將Oracle數據庫擴展為全面的高級分析平臺:Oracle R Enterprise和Oracle Data Mining。它是全面的實時分析平臺,可洞察重要的業務事項,如客戶流失預測、產品建議和欺詐警示。客戶可將算法應用于數據所在的數據庫,從而隨著數據量的增加輕松擴展分析。使數據分析師能夠直接但受控地訪問Oracle數據庫中的數據,在保證數據安全性的同時提高數據分析師的效率。無需移動數據,且能夠在更短時間內將“原始數據”轉換為“可操作的信息”,從而降低數據分析的總體TCO。
Oracle Business Intelligence Foundation Suite——全面、市場領先的現代商務智能平臺,幫助企業快速掌握與業務相關的更多信息,推動創新和掌握競爭優勢,使組織從更多數據中獲得更多洞察,從而推動收入增長。它以采用集成架構的商務智能為基礎,為即席查詢和分析、儀表盤、企業報告、移動分析、記分卡、多維OLAP、預測分析等功能提供了業內最佳的平臺。這一針對定制和打包的商務應用而設計的支持技術可幫助組織推動創新、優化流程并提供極致性能。
Oracle實時決策——一個適應組織自身發展規劃的管理解決方案,是圖像、產品、服務一條線的業務完整流程。
OracleExalytics商務智能云服務器——商務智能軟件和內存中數據庫技術構建而成,該系統經過優化,可提供快速分析,提升智能、簡單性和可管理性。高級數據可視化和挖掘,可從大量數據中抽象出具有可行性的洞察。適用于發現、商務智能、建模和規劃應用的快速解決方案。
Oracle Big Data SQL——大數據SQL,是大數據管理系統重要的組成部分。它打通了數據孤島,并簡化信息訪問和發現過程,可以幫助客戶跨Hadoop、NoSQL和Oracle數據庫運行同一個SQL查詢,從而最大限度減少數據移動,同時提高性能。Oracle Big Data SQL在Oracle大數據機上運行,可與Oracle Exadata數據庫云服務器配合使用。將關系和非關系型技術整合到單一架構中,并引入業界標準數據訪問語言SQL,因此簡化了企業對大數據的訪問。
Oracle Spatial and Graph——提供3D和Web服務支持功能,用于管理所有地理空間數據(包括向量和光柵數據、拓撲和網絡模型)。Oracle Spatial可與Oracle Locator協同工作,后者是每個Oracle數據庫版本中都具備的一項特性,提供了定位眾多業務應用程序所需的映射功能。
Oracle R Enterprise——Oracle R Enterprise與R語言集成,可處理大型數據集,并可以與OBIEE集成。R語言主要用來進行數據探索、統計分析、作圖的解釋型語言,其運算方面的能力較強。集成可發揮數據庫的并行優勢,速度更快。
Oracle是目前國際排名第二大獨立軟件公司,是第一個跨整個產品線(數據庫、業務應用軟件和應用軟件開發與決策支持工具)開發和部署100%基于互聯網的企業軟件的公司。Oracle在數據庫方面有很強優勢,且它的產品線完整,產品關聯性較強,比較適合整套方案使用。Oracle解決方案在醫療方面也有很完整的體系,用戶眾多。其價格同類也相對比較高,用戶多是大企業機構。
經典案例:
1.Oracle助豐田應對召回危機
豐田是全球汽車制造商,為提升業務質量和效率,豐田必須降低保修成本和檢測正確時間,它渴望開發新的產品質量分析系統,以迅速應對源于2010一個龐大產品召回事件的危機。甲骨文為其提供了一套整體解決方案,為豐田公司產品質量內部系統的數據提供一個通用接口,為豐田質量工程師提供來自不同車輛配置系統、客戶呼叫中心、系統保養索賠、客戶調節小組和服務中心等的數據提供搜索功能和向下鉆取。提供搜索引擎界面、過濾器,允許用戶查看產品質量數據,這在以前是不可能實現的方式。此方案降低豐田汽車投產到市場的時間80%,每年撤銷數百、數千小時最終用戶的等待時間,在相關的系統中能使工程師快速導航到交易警報。
2.Oracle助UPMC打造個性化醫療
匹茲堡大學醫學中心(簡稱UPMC)是美國領先的非營利性醫療系統,也是全美最知名的學術研究醫學中心之一。 UPMC利用Oracle大數據平臺打造個性化醫療,使用Oracle Exadata、高級分析和特定用途的應用構成了高性能平臺,收集分析病人醫療數據等內容,幫助其實現了個性化治療,并大大改善UPMC的醫療衛生成果。Oracle在醫療行業有多套完整解決方案,包括健康檔案、醫療分析和研究分析等,其臨床數據挖掘等方面都很有優勢,并且合作客戶眾多。
三、Google
產品類型:
1.基于Percolator
Caffeine——增量處理索引系統,取代MapReduce批處理索引系統,搜索更快。
Colossus——專為BigTable設計的分布式存儲Colossus,也被稱為GFS2(二代Google文件系統),它專為建立Caffeine搜索索引系統而用。
2.基于Dremel系統
BigQuery——Google推出其強大的數據分析軟件和服務 — BigQuery,它也是Google自己使用的互聯網檢索服務的一部分。Google已經開始銷售在線數據分析服務,試圖與市場上類似亞馬遜網絡服務(Amazon Web Services)這樣的企業云計算服務競爭。這個服務,能幫助企業用戶在數秒內完成萬億字節的掃描。
3. 基于搜索統計算法——Google推出搜索引擎的輸寫糾錯、統計型機器翻譯等服務。
Brand Lift in Adwords、Active GRP——Google的趨勢圖應用,通過用戶對于搜索詞的關注度,很快的理解社會上的熱點是什么。對廣告主來說,它的商業價值就是很快的知道現在用戶在關心什么,他們應該在什么地方投入一個廣告。以幫助廣告客戶分析和評估其廣告活動的效率。
Dremel被設計用來管理非常大量的大數據集(指數據集的數量和每數據集的規模都大),而PowerDrill則設計用來分析少量的大數據集(指數據集的規模大,但數據集的數量不多)時提供更強大的分析性能。
4.PowerDrill
Dremel可以在3秒鐘內查詢一個P的數據。PowerDrill雖不能處理這么多數據,可能應對的量也不小了,而且它的處理速度更快。PowerDrill可以在30到40秒內處理7820億個單元的數據。Google說,這比Dremel的方式“高好幾個數量級”。
PowerDrill設計用來分析少量的核心數據集。其數據存于內存,PowerDrill做了組合范圍分區,分析時可以跳過很多不需要的分區(真實應用統計可以跳過92.41%的分區)。PowerDrill用普通關系模型。PowerDrill數據要load,增加數據不太方便。
Google身為世界幾大搜索引擎之一,一直致力于互聯網搜索、云計算等領域,其衍生的大數據服務在搜索方面十分有優勢,尤其在廣告服務、統計等領域。其搜索引擎、大數據處理相關方面的技術很成熟,但大數據方面的產品及解決方案覆蓋領域沒有十分完整,適合有特定需求用戶使用。
經典案例:
2009年,Google通過分析5000萬條美國人最頻繁檢索的詞匯,將之和美國疾病中心在2003年到2008年間季節性流感傳播時期的數據進行比較,并建立一個特定的數學模型。最終google成功預測了2009冬季流感的傳播甚至可以具體到特定的地區和州。
四、Amazon
產品種類:
1.基于Amazon Web Services(AWS)
Big Data Analytics Options on AWS——利用AWS可輕松預配置所需的存儲、計算和數據庫服務,以便將這些數據轉換成您的企業需要的信息。同時,AWS 的數據傳輸服務可以快速地將大數據移入和移出云,例如 AWS Direct Connect 和 Import/Export 服務。而且,進入 AWS 的所有入站數據流量都是免費的。
2.基于流計算:
Amazon Kinesis——一項托管服務,可實時處理流媒體大數據。Amazon Kinesis支持的每秒數據吞吐量為數兆字節數據到數吉字節數據,并且可以通過無縫擴展處理來自成千上萬個不同源的流。Amazon Kinesis旨在以經濟節約的方式提供高可用性和耐久性,使用戶專注于利用數據,以更快的速度、更低的成本做出決策。
3.基于Hadoop
Amazon Elastic MapReduce (EMR)——EMR在 Amazon EC2 上提供Apache Hadoop框架作為易于使用的托管服務。利用 Amazon EMR,用戶可減少查詢,利用廣泛的Hadoop工具生態系統,同時部署到高度擴展、安全的基礎設施平臺。在云中執行大數據分析作業,讓 Amazon EMR 來完成Hadoop集群的管理工作。
經典案例:
1.NASA/JPL的沙漠研究和訓練研究
NASA Jet Propulsion Laboratory(美國宇航局噴氣推進實驗室)已開發出全地形六足地外探測器(ATHLETE)機器人。作為沙漠研究和訓練研究的一部分,NASA/JPL結合其他NASA中心的機器人對ATHLETE機器人進行年度實地測試。在驅動機器人的同時,操作員可以依賴高分辨率的衛星圖像,獲取指導、定位和態勢感知。為了簡化衛星圖像的處理,NASA/JP的工程師們開發了一個利用工作流并行特性的應用程序。NASA/JPL依賴Amazon Web Services (AWS) 完成此項工作。
該應用程序構建在Polyphony之上,通過在本地機器上存儲過剩容量并在超級計算中心存儲備用資源,Polyphony與AWS云完美結合。Polyphony能夠將各種資源融合在一起以實現共同目標。通過使用Amazon Simple Queue Service (Amazon SQS),NASA/JPL開發人員甚至只需編寫一個類,即可在Amazon EC2上部署大量計算。
2.助NOKIA打造數據處理平臺
電信巨頭諾基亞公司用其Xpress互聯網服務平臺,在印度、亞太、非洲和南美等新興市場提供移動互聯網服務。它的平臺上運行著2200臺服務器,每日日志及日常收集數據量能達到800 GB。對于傳統數據庫來說這些數據量太過龐大,以至于諾基亞無法將其迅速分析生成所需報告。諾基亞通過將數據轉移到亞馬遜的AWS和Redshift平臺,使用亞馬遜的大數據解決方案,可以全面管理數據倉庫,數據運算查詢的速度是以前的一倍,使用商業智能工具挖掘分析大數據也使成本節省了50%。
3.助Philips公司打造醫療服務平臺
飛利浦是荷蘭公司,專注于醫療保健領域,產品包括消費者的生活方式、照明產品及其他服務。其公司的醫療信息解決方案和服務部門希望可以為全世界十幾億人的醫療健康服務,并且建立飛利浦自己的醫療解決方案:HealthSuite數字平臺,而這些都是通過亞馬遜提供的AWS網絡服務來實現的。HealthSuite數字平臺分析和存儲病人的數據信息,并且收集研究了3.9億圖像和醫療記錄,成功的為醫療服務提供了可操作的數據,這些數據會直接影響病人的護理。運行在亞馬遜的AWS平臺會大大提升其數字平臺系統的可靠性、性能、和可擴展性,這使飛利浦能更好的適應其平臺內容的增長速率,并且做出正確決策。
五、HP
產品類型:
Haven大數據平臺——提供處理全部企業大數據的功能,利用非結構化和結構化數據通知每個決定,提供可行的智能信息。
Haven既可在內部部署,也可在云中部署,提供大數據分析和下一代應用。HAVEn里面包含了很多組件,這些組件之間可以基于業務要求和應用場景進行組合,用戶可以選取適合的組件來滿足業務需要。惠普支持主流的Hadoop商業應用,還可以把Vertica和Hadoop進行集成,進行大數據分析。它是將大數據軟件方案等系統集成在一起而成的大數據生態環境,可以給用戶提供完整的大數據解決方案。
Information Management——提供智能備份和恢復,幫助用戶應對當前以及未來的備份與恢復挑戰。該解決方案利用與應用、基礎設施和運維分析的高級集成,可優化備份,提高業務連續性和恢復能力,并增加IT環境持續正常運行的時間?;萜招畔⒐芾斫鉀Q方案提供基于智能政策的保護,提供訪問和組織數據優化的可恢復性保留,減少損失和濫用數據的風險。具有聯合的重復數據刪除功能,可最大程度地提高存儲效率和性能。
INFORMATION GOVERNANCE——降低未來數據風險和控制成本,它可以協助企業獲取更多商業價值?;萜仗峁┝艘粋€投資組合的模塊化解決方案,幫助企業獲得計算機生成的信息后進行分析,組織和控制集中的數據,智能管理與業務。
BIG DATA INDUSTRY SOLUTIONS——大數據行業解決方案,幫助企業分析行業大數據,使企業面臨更大的機遇,提升企業利潤及解決問題方式。
惠普作為一家全球性資訊科技公司,主要行業在打印機、數碼影像、計算機和資訊服務等領域,其在硬件方面相對有優勢,其大數據解決方案較完善。并且惠普全球大數據基地位于中國青島,相對于其他外國企業來說本土優勢較強,價格對于中型企業來說大多能接受。其用戶多是金融領域及政府機構等。
經典案例:
1.迪拜警方提高執法的速度和效率
迪拜是阿聯酋的七個酋長國之一,要維持一個擁有一萬五千多名員工并且配有高水平的專業培訓的警察局,這對管理者來說十分復雜。在2009年,迪拜警方利用惠普平臺,部署了一個心形的掃描儀安裝在巡邏車上,可迅速“讀取”車牌號,快速計算識別出哪些車主有犯罪行為或是被通緝,這對警察的執法十分有利,效率提升很大。以前沒有這個系統的時候,只能夠靠人工來大面積觀察車牌樣式和信息,但十分費力且效果不佳。二這套系統已經幫助迪拜警方逮捕了本地和國際的兩千七百多名犯人。
2.備份醫療健康數據
惠普系統曾幫助某組織備份醫療健康數據,降低其備份管理難度,從每周需要四小時到現在每周只需要二十分鐘。不再使用以前的n多個服務器備份,使備份變得很簡單便捷。在備份大量數據時,安全性也有提升。
六、SAP
產品類型:
1.數據庫及數據倉庫
SAP HANA——具備強大的分析能力,提供多用途的內存應用設備,企業可以利用它即時掌握業務運營情況,從而對所有可用的數據進行分析,并對快速變化的業務環境做出迅速響應?;赟AP HANA的SAP Business Suite(包含ERP、CRM、SCM、SRM、PLM)可推動整個企業實現實時運營?;贖ANA平臺的SAP ERP可更快速響應企業需求,通過精準分析海量數據帶來更深層次的數據交換。
SAP Sybase IQ——面向大數據的高級分析,它打破數據分析的壁壘,并將其集成到企業級分析流程中。SAP Sybase IQ采用三層架構:1)基本層數據庫管理系統(DBMS),這是一個全共享MPP分析DBMS引擎;2)分析應用程序服務層,其提供C++和Java數據庫內API,并可實現與外部數據源的集成和聯邦,包括四種與Hadoop的集成方法,3)頂層Sybase IQ生態系統,由四個不同的合作伙伴和認證ISV應用程序組成。
Sybase Adaptive Server Enterprise——能夠處理超大數據集的關系型數據庫管理系統(RDBMS)。它是基于客戶/服務器體系結構的數據庫,也多線索化高性能的、事件驅動的、可編程的數據庫,同時提供自我管理、自動故障切換支持功能,以及大量性能優化調整特性,可以節約運行成本。
SAP NetWeaver Business Warehouse——利用組織架構和在物流,財務,人力資源領域的業務流程整合的見解,協助用戶進行企業集中管理,深化企業應用管理。
2.企業信息管理
SAP Data Services——軟件可在企業層面集成、轉換和改善數據,讓企業能夠以較低的成本為所有關鍵業務職能部門提供可靠的信息。為IT團隊提供了數據剖析和文本分析工具,能夠優化運營,提高數據質量,并獲取對分散數據源和應用的關鍵訪問。
SAP Informance Governance——信息治理,提升企業的信息一致性和準確性,以更好的信息管理方法來提高業務有效性并降低風險。
SAP NetWeaver——信息生命周期管理解決方案,幫助企業解決制定明確的生命周期內信息存檔和銷毀策略。
SAP大數據解決方案主要集中在數據庫及數據倉庫層面和企業信息管理層面,其方案包括范圍不是很廣泛,但是很深入,適合管理、數據庫等方面需求強的企業。
經典案例:
1.三全食品公司
是中國生產速凍食品最早、規模最大、市場網絡最廣的企業之一。SAP為其構建營銷管理體系信息化平臺,助其提高效率、拓展市場。并且結合其業務需求,深化系統應用,利用大數據分析協助其改進采購戰略,縮短采購周期,壓縮成本、降低單位價格。并且融合外部數據,提供決策支持的依據。其解決方案收效十分明顯,三全公司應到賬款到期收款率由63%提升到97%,物料庫存準確率由52%提高至99%,各產品線車間生產余料平均減少85%。
2. 助邯鄲鋼鐵信息化
邯鄲鋼鐵屬特大型鋼鐵生產企業,進入90年代后期,鋼鐵行業市場已由單純產量、速度競爭轉變為包括資源爭奪、產業鏈調整和產品科技含量等方面在內的企業綜合實力競爭這一形式。企業急需有效管理的現代企業制度,以進一步提高企業的競爭能力。邯鄲鋼鐵使用SAP的NetWeaver平臺,完成整體的業務流程設計,實現廠際間物料優化和板材生產優化,完善工序計量設施,建立基本數據庫,為科學決策和分析提供具有較強參考價值的綜合性依據。在人力資源管理、項目管理等模塊,深化供應鏈管理模式,實現設備產能優化和生產線排產的一體化。
七、Intel
產品類型:
Intel Hadoop Manager——提供專業咨詢服務,幫助用戶構建高可擴展性的分布式系統,結合Intel的硬件部門,提供全面你的軟硬件解決方案。其功能包括數據挖掘、數據流處理語言、數據倉庫等。Intel對Hadoop進行了優化,它囊括Intel針對現有客戶在實際使用中出現問題的解決方法,為數據處理平臺提供更高性能。
Intel至強E7v3產品家族——E7v3產品家族的四路、八路和更大型的服務器可提供卓越的性能和可擴展性,支持對數TB乃至數PB規模的數據集執行實時分析。
Intel不光是一個軟件公司,也是一個硬件公司,其產品多與開源軟件相結合。Intel在Hadoop技術這方面有它的領先優勢,對于Hadoop進行了很好的改進,軟件活躍度較高。其客戶多集中在金融、醫療、電信等領域。
經典案例:
1. 銀行業欺詐管理
防欺詐是金融服務行業面臨的一場高風險的戰爭。在多個渠道、業務部門和服務領域的共同作用下,銀行正面臨著不斷變化的威脅矩陣。確保交易安全極為復雜,但是卻是保護企業及其客戶必不可少的一環。Computacenter Germany與Concepts and Solutions(CAS)聯合為在英特爾至強處理器E7產品家族平臺上運行的內存分析應用開發了多種強大、實時的欺詐檢測解決方案。借助這些處理器的大容量內存、多個核心以及高級 RAS 特性,金融機構能夠獲得前所未有的欺詐響應速度和可靠性。
2.助中芯縮短芯片制造周期
中芯國際光罩廠為其代工客戶和其它芯片加工廠及機構提供光掩模制造服務,擁有中國最大及最先進的光掩模制造設施。面臨芯片制造工藝的革新和不斷增加的客戶以及越來越復雜的客戶需求,中芯利用基于英特爾架構的高性能計算中心應對計算性能挑戰,不斷提高光掩模制造工藝,縮短芯片制造周期,持續為客戶提供優質服務。中芯成功實現28納米制造工藝,提高了光掩模制造服務能力,顯著降低總體擁有成本。
八、Teradata
產品類型:
Teradata QueryGrid大數據解決方案——集成不同的分析工具和引擎,提供無縫的自助式服務,靈活性較強。用戶只需在單一Teradata 數據庫或者Teradata Aster數據庫查詢,就能訪問和分析各個系統的數據。通過在數據的原有存儲位置進行處理,最大限度避免數據移動和復制。
Teradata Database 15數據庫——實現了Teradata統一數據架構,讓用戶在訪問所有數據的同時獲得嶄新洞察力,從而實現邏輯數據倉庫的真正使命。用戶可以在多元系統中實現分析查詢、整合與使用JOSN數據、編寫并運行數據庫內非SQL語言,以及運用新型分析。
Teradata Active EDW 6750動態企業級數據倉庫平臺——滿足規模最大、最苛刻的實時負載,擁有數以千計的應用程序,能夠滿足無限數量的并發用戶在61 PB的數據中進行查詢,為決策者提供最重要的數據。
Teradata天睿公司是全球最大的專注于大數據分析、數據倉庫和整合營銷管理解決方案的供應商。其在大中華區有超過十多個行業的客戶,包含政府與公共服務、通信行業、銀行、保險、證券、航空、地鐵、交通運輸、物流、快遞行業、制造行業、汽車、零售、電子商務、互聯網、電力能源等等。Teradata大數據平臺不改變業務的使用習慣,避免冗長的開發過程,對于磁盤故障、網絡故障、服務器故障等都有應對機制,其安全性也比較高。
經典案例:
1.促進傳統挖掘模型升級,終端潛在客戶挖掘
當前我們處在智能終端快速普及階段,智能終端占有率超過60%,換機市場是一個非常大的市場,據可信數據,當前各省每月終端換機已達到百萬部,甚至千萬部。那么對于終端廠商、運營商,以及終端渠道商來說,這么大的市場,如何去發現潛在換機客戶?Teradata大數據提供了傳統潛在換機模型,主要是基于用戶移動業務的使用情況,采用決策樹的挖掘算法進行數據挖掘,其中選取的典型業務指標包括用戶的基礎情況、當前機型、機齡(機齡指當前用戶當前終端使用時間)、月消費額,參與終端營銷活動情況(如捆綁時間),以及客戶使用業務情況,如通話、流量等。提高命中率,獲取真實用戶需求??蛻羲阉鲾祿牒?,傳統挖掘模型的命中率及覆蓋率大為提高,現在的模型效率是過去模型效率的3倍。
九、Microsoft
產品類型:
Windows Azure HDInsight——通過與Microsoft BI工具(如PowerPivot、Power View)進行深度集成,HDInsight使企業可以利用Hadoop輕松找到洞察數據信息。HDInsight具有企業級的安全性和可管理性。通過PowerShell腳本的擴展支持簡化了Hadoop群集的管理。
Modern data warehouse——現代數據倉庫,傳統的結構化關系數據倉庫在設計上無法應對爆炸式數據增長、半結構化和非結構化數據類型,以及更快的數據處理速度?,F代數據倉庫解決方案將傳統數據倉庫與非關系數據進行集成,從而可以處理各種規模和類型的數據,并提供實時性能。
Business intelligence——通過Office和SQL Server在組織內提供商業智能,發現、分析和可視化數據,深入挖掘并將獲得的洞察力通過SharePoint和Office 365進行共享。通過SQL Server,IT專業人士可使用強大的工具構建現代化數據解決方案,該解決方案不僅可以跨組織擴展,數據的可靠性和安全性也很有保證。
微軟能夠低成本儲存所有類型和規模的數據,使用Hadoop數分鐘內在HDInsight上快速部署群集。其大數據產品在系統信息處理及商業智能方面十分有優勢。由于windows系統在全球使用很廣泛,使微軟大數據產品的易用性和靈活性很強。
經典案例:
1. 中山醫院借助SQL Server 2014利用大數據推動醫療信息化發展
為加強院內的醫療水平,復旦大學附屬中山醫院開啟了多個臨床病歷分析的課題,通過從歷史的病員病理分析,找出一些疾病的病性特性。但當前臨床病歷分析無法直接滿足現階段醫生對數據訪問的性能需求。中山醫院使用SQL Server 2014,不僅顯著提升了醫療數據管理的性能,還提供了全新的特性幫助中山醫院整合結構化與非結構化數據,為醫療數據的深度挖掘和臨床的學術研究提供了最新的技術手段。其為醫護人員提供了更便捷的報表體驗,提升臨床工作中對數據的查詢與分析性能,借助海量數據的力量為患者提供了更加優質的醫療服務。
十、阿里巴巴
產品類型:
阿里經濟云圖——阿里推出的國內首個面向政府開放的大數據產品,各級政府可自助查詢當地多維度的電子商務經濟數據,為政府實現互聯網經濟分析與決策提供支持。
分析數據庫服務ADS——分析數據庫服務(Analytic Database Service,簡稱ADS),是阿里巴巴自主研發的海量數據實時高并發在線分析云計算服務,使您可以在毫秒級針對千億級數據進行即時的多維分析透視和業務探索。ADS對海量數據的自由計算和極速響應能力,能讓用戶在瞬息之間進行靈活的數據探索,快速發現數據價值,并可直接嵌入業務系統為終端客戶提供分析服務。其產品正在公測中。
采云間DPC——基于開放數據處理服務的DW/BI的工具解決方案。可以大大降低用戶在數據倉庫和商業智能上的實施成本,加快實施進度。天弘基金、高德地圖的數據團隊基于DPC完成他們的大數據處理需求。其產品正在公測中。
分析數據庫服務ADS——阿里巴巴自主研發的海量數據實時高并發在線分析云計算服務,使得您可以在毫秒級針對千億級數據進行即時的多維分析透視和業務探索。目前也在公測中。
阿里巴巴作為互聯網巨頭,其在大數據產品方面算是新企業,它的很多大數據產品仍然在公測中。但阿里巴巴作為國內企業,對于國內企業的大數據需求很有優勢,對于市場環境和企業情況的了解更多,產品更適合國內中小型企業。并且淘寶網在雙十一高并發數據處理方面創造了紀錄,技術方面很有保證。但阿里巴巴的數據大多來自其內部,支付寶、聚劃算、一淘等平臺,這些數據包括交易數據、用戶瀏覽和點擊網頁數據、購物數據等等。對于全部滿足平臺商家的數據需求,并不是十分完善。