- 相關(guān)推薦
Java程序員使用大數據工具匯總
在許多情況下,使用SQL數據庫用于存儲/檢索數據就足夠了。但在另一些情況下,要么SQL數據庫規模不夠,要么還有更好的工具。這一切都取決于使用情況。
現在讓我們來(lái)討論一下存儲/處理數據用的不同的非SQL工具——NoSQL數據庫,內存緩存,全文搜索引擎,實(shí)時(shí)流,圖形數據庫,等等。
MongoDB
一種流行的,跨平臺的面向文檔的數據庫。
Elasticsearch
專(zhuān)為云而構建的分布式REST風(fēng)格搜索引擎。
Cassandra
一個(gè)開(kāi)源的分布式數據庫管理系統,最初由臉譜網(wǎng)開(kāi)發(fā),被設計用來(lái)處理橫跨多個(gè)商用服務(wù)器的大量數據,提供了無(wú)單點(diǎn)故障的高度可用性。
Redis
一個(gè)開(kāi)源的(BSD許可),內存數據結構存儲,作為數據庫、緩存和消息代理使用。
Hazelcast
基于Java的開(kāi)源內存數據網(wǎng)格。
EHCache
一種被廣泛使用的開(kāi)源Java分布式緩存,用于通用緩存、Java EE和輕量級容器。
Hadoop
用Java編寫(xiě)的一個(gè)開(kāi)源軟件框架,用于分布式存儲和對在計算機集群上的超大型數據集的分布式處理。
Solr
一個(gè)開(kāi)源的企業(yè)搜索平臺,用Java編寫(xiě)的,來(lái)自于A(yíng)pache Lucene項目。
Spark
Apache Software Foundation中最活躍的項目,一個(gè)開(kāi)源的集群計算框架。
Memcached
一個(gè)通用的分布式內存緩存系統。
Apache Hive
提供了Hadoop之上類(lèi)似于SQL的層。
Apache Kafka
一個(gè)高通量、分布式的發(fā)布-訂閱式消息系統,最初開(kāi)發(fā)在LinkedIn上。Windows上脫離Cygwin運行Apache Kafka。
Akka
一個(gè)工具包和運行時(shí),用于在JVM上構建高度并行的、分布式的、有彈性的消息驅動(dòng)的應用程序。
HBase
一個(gè)開(kāi)源的,非關(guān)系型的,分布式數據庫,在谷歌的BigTable后建模,用Java編寫(xiě),并運行在HDFS上。
Neo4j
用Java實(shí)現的開(kāi)源圖形數據庫。
CouchBase
一個(gè)開(kāi)源的、面向文檔的分布式NoSQL數據庫,特別為了交互式應用而優(yōu)化。
Apache Storm
開(kāi)源的分布式實(shí)時(shí)計算系統。
CouchDB
使用JSON來(lái)存儲數據的面向文檔的開(kāi)源NoSQL數據庫。
Oracle Coherence
一個(gè)內存的數據網(wǎng)格解決方案,通過(guò)提供快速訪(fǎng)問(wèn)常用數據的渠道,使得企業(yè)可預測地擴展關(guān)鍵任務(wù)應用程序。
Titan
一個(gè)可擴展的圖形數據庫,優(yōu)化的目的在于存儲和查詢(xún)包含數千億頂點(diǎn)和邊的圖形,分布在多機集群。
Amazon DynamoDB
一個(gè)快速、靈活、完全管理的NoSQL數據庫服務(wù),用于在任何規模需要一致的、個(gè)位數毫秒延遲的所有應用程序。
Amazon Kinesis
用于在A(yíng)WS上的流數據的實(shí)時(shí)平臺。
Datomic
一個(gè)用Clojure寫(xiě)的完全事務(wù)式的,支持云的,分布式數據庫。
【Java程序員使用大數據工具】相關(guān)文章:
繪制工具的介紹及使用技巧08-06
硬盤(pán)數據恢復的工具有哪些10-23
illustrator縮放工具使用教程12-27
美甲工具的使用方法05-05
word畫(huà)圖工具使用教程案例07-24
用Java如何處理XML數據10-22