大數據時代的3V
- 海量Volume
- 多樣Variety
- 實時Velocity
互聯網需求的3高
- 高并發
- 高可擴
- 高性能
BSON
BSON()是一種類json的一種二進制形式的存儲格式,簡稱Binary JSON,
它和JSON一樣,支持內嵌的文檔對象和數組對象
BSON數據
{
"customer":{
"id":1136,
"name":"Z3",
"billingAddress":[{"city":"beijing"}],
"orders":[
{
"id":17,
"customerId":1136,
"orderItems":[{"productId":27,"price":77.5,"productName":"thinking in java"}],
"shippingAddress":[{"city":"beijing"}]
"orderPayment":[{"ccinfo":"111-222-333","txnid":"asdfadcd334","billingAddress":{"city":"beijing"}}],
}
]
}
}
- 高并發的操作是不太建議有關聯查詢的,互聯網公司用冗余數據來避免關聯查詢
- 分布式事務是支持不了太多的并發的
聚合模型
- KV鍵值
- BSON
- 列族
顧名思義,是按列存儲數據的。最大的特點是方便存儲結構化和半結構化數據,方便做數據壓縮,
對針對某一列或者某幾列的查詢有非常大的IO優勢。
Paste_Image.png
- 圖形
Paste_Image.png