这里面创业公司太多了,包含BI工具,数据存储和挖掘,应用等,我就简单说一些我感兴趣的,它们大多在硅谷,其他的可以参考。更新是到2015年6月。 Palantir:融资:9。5亿美元。150亿美金估值,已经是超级独角兽单独列出来。PeterThiel创办大数据公司。数据集成、信息管理和定量的分析。连接到商业、专有和公共数据集,并发现趋势、关系和异常,包括预测分析。 Database MemSQL:号称最快的内存数据库。 GraphSQL:高效、大容量的图形数据库和分析平台,创始人是国人。 MongoDB:融资:3。11亿美元。细分行业:面向文档数据库采集。它灵活的存储方式非常受青睐。 DataStax:融资:1。9亿美元。细分行业:基于ApacheCassandra的数据库支持平台。客户包括eBay、Adobe、Netflix等 RethinkDB:opensource,scalabledatabasethatmakesbuildingrealtimeappsdramaticallyeasier。 Hadoop Hadoop三剑客其中Hortonworks已经上市 Cloudrea,融资量:10。4亿美元。细分行业:大数据分析软件、服务与培训。今年,这家大数据巨头企业即将进入中国市场。 MapR:融资量:1。74亿美元。细分行业:大数据分析软件、服务与培训。它的创始团队来自Facebook、Google和Yahoo等公司 Altiscale:提供的Hadoop作为一种服务(HAAS) Qubole:Hadoop服务提供商,一些创业公司如Pinterest也是它的客户 SpliceMachine:基于Hadoop的实时大数据技术公司,支持SQL事务处理,并针对OLAP和OLAP应用进行实时优化处理 Continuuity:aHadoopbasedbigdataapplicationhostingplatform。 Platfora:ProvideabigdataanalyticssolutionthattransformsrawdatainHadoopintointeractive,inmemorybusinessintelligence。 Xplenty:ProvideHaaS。 Nuevora:ProvideBigDataanalyticsapplications。 机器学习 Everstring:通过不断地主动挖掘和分析全网在线企业信息,结合每家企业内部的客户关系管理系统,利用机器学习自动建立量化客户模型预测谁是下一个客户。 Luminoso:自然语言处理和机器学习技术,帮助企业分析消费者在各种通讯渠道中讨论的话题 Dato:GraphLab提供了一个完整的平台,从别的应用程序或者服务中抓取数据,让机器学习这个模型,并将学到的知识作为基础,自动地进行准确的预测和决策制定。 Paxata:应用机器学习技术处理大数据难题 0xdata:H2O的算法是面向业务流程欺诈或趋势预测 Numenta:developedacohesivetheory,coresoftwaretechnology,andnumerousapplicationsallbasedonprinciplesoftheneocortex PredictionIO:开源的机器学习服务器 AlpineDataLabs:大数据预测分析 Zementis:预测分析决策管理平台 Trifacta:人机交互数据分析平台 Metamind:提供相当完美的人工智能解决方案,这种解决方案主要由“深度学习(DL)”支持 RapidMiner:数据挖掘工具 BI工具和其他 Looker:一个基于Web的BI平台,目前已以与AmazonRedshift、TeradataAster、HPVertica、Greenplum、Impala、BigQuery以及Spark等数据源进行集成;定制和复用数据可视化体验。 Confluent:Kafka初创公司。 Databricks:主要开发Spark。 Elasticsearch:分布式搜索引擎,基于Lucene开发 TachyonNexus:主要开发Tachyon。 SnowplowAnalytics:开放代码的分析平台,特别是基于AWS的分析。 Datameer:开源的数据处理系统,用于构建强大的超级计算机廉价服务器集群。 DataSift:社交数据分析公司 Datadog:数据监控 Sumologic:日志管理过滤 Ginger。io:为研究人员、物理学家和医疗保健人员提供相应的行为分析能力 B:从事商业智能和数据分析,利用云计算来颠覆传统的IT服务模式 Interana:自助分析数据平台 Lucidworks:Solr企业版 DataT:可以将数据处理速度从实时提高至“现在时” WibiData:专业大数据软件包 Dataguise:大数据安全公司 Aerospike:开源NoSQL数据库,支持近实时数据分析 Accumulo:可靠的、可伸缩的、高性能的排序分布式的KeyValue存储解决方案,基于单元访问控制以及可定制的服务器端处理 Pentaho:以工作流为核心的、强调面向解决方案而非工具组件的BI Metamarkets:可视化分析,帮助在线媒体公司分析高流量的流媒体数据 Pivotal:一个以数据为核心的企业级PaaS平台 Pachyderm:DockerizedMapReduce Premise:走众包数据采集途径向金融机构提供数据 Domo:融资量:2。5亿美元。细分行业:云商务智能。它的主要服务客户是企业用户,其数据库可以帮助企业维持日常的运转。 SumAll:socialmediaanalyticsandbusinessdashboard Tintri:“智能混合闪存”,混合了闪存和计算机硬盘驱动器 Datarella:BigDataSProductDevelopment Snowflake:云数据仓库 GoodData:融资:1。01亿美元。细分行业:云商务智能。GoodData向SaaS供应商提供技术集成服务,在平台内获得分析数据。 Amplitude:BI分析软件 MuSigma:融资量:1。95亿美元。细分行业:大数据科学服务。这是一家向企业客户提供数据分析和决策支持服务的研究公司。 Mixpanel:有web和移动分析平台,其提供的服务可以分析监测用户活动 DataHero:打着“你的数据你做主”的口号,试图弥合大数据同普通用户之间的鸿沟,即帮你分析跟你密切相关的数据 OperaSolutions融资量:1。22亿美元。细分行业:大数据科学服务。其提供的大数据服务可以一次性采集数十亿条数据。 G融资量:1。07亿美元。细分行业:智能解决方案平台。它的主要投资方是英特尔。 DataGravity:softwarebasedcompanyenGAgedintheITindustryandisfocusedonprovidingdatamanagementservices。 ZipfianAcademy:DataScienceBootcamp CivisAnalytics:bigdataanalyticsfirmthathelpscompanies,nonprofits,andcampAIGnsleveragetheirdatatodevelopsmarterstrategy。 Quid:BusinessAnalyticsSoftware inPowered:discoverthemostengagingcontentwrittenaboutthemandturnthemintonativeadsthatarepromotedacrosstheweb,mobileapps Cask。co:helpsdevelopersandorganizationsdeliverHadoopsolutionsmorequicklyandeffectivelywiththeopensource Tamr:quickly,efficientlyandcosteffectivelyconnectsandenrichesallofyourinternalorexternaldatasources ScalingDataRocana:buildingsoftwareforlargescalemachinedata(logs,metrics,etc。)andeventmanagement,specificallyinthedomain。 Kissmetrics:分析服务公司 参考链接 10HotBigDataStartupstoWatchin2015fromAtoZ 10HotHadoopStartupstoWatch ,