mongodb 深入學(xué)習(xí)筆記
mongodb基本知識
mongodb是介于關(guān)系型數(shù)據(jù)庫與非關(guān)系型數(shù)據(jù)庫之間的NoSQL,是最像關(guān)系型數(shù)據(jù)庫的產(chǎn)品。
- mongodb支持的查詢語言非常強(qiáng)大,幾乎可實(shí)現(xiàn)類似關(guān)系型數(shù)據(jù)庫單表的大部分功能查詢,且還可創(chuàng)建索引。
- mongodb是面向集合的(collection oriented),模式自由(schema free)的文檔型數(shù)據(jù)庫。
- 文件存儲格式BSON: Binary Serialized dOcument Notation.
- mongodb服務(wù)端默認(rèn)端口是27107
- mongodb是一個(gè)可移植的數(shù)據(jù)庫,是一系列與磁盤有關(guān)系的物理文件所組成的。
- mongodb默認(rèn)的數(shù)據(jù)目錄是/data/db,它負(fù)責(zé)存儲所有的MongoDB的數(shù)據(jù)文件。
mondodb的每個(gè)數(shù)據(jù)庫都包含一個(gè).sn文件和一些數(shù)據(jù)文件,且這些數(shù)據(jù)文件會隨著數(shù)據(jù)量的增加越來越多,如有個(gè)foo數(shù)據(jù)庫,那么在這個(gè)數(shù)據(jù)庫中就會有 foo.sn, foo.1,foo.2等這些文件存在。
- 可以通過“show dbs” 命令顯出所有數(shù)據(jù)庫的列表,“db”命令顯示當(dāng)前數(shù)據(jù)庫對象或集合;“use XXXX”表示連接到一個(gè)指定的數(shù)據(jù)庫(XXXX)。
mongodb的邏輯結(jié)構(gòu)
mongodb是一種層次結(jié)構(gòu),由文檔(document),集合(collection),數(shù)據(jù)庫(database)組成。
- mongodb的文檔相當(dāng)于關(guān)系型數(shù)據(jù)庫里的一行記錄;
- 多個(gè)文檔組合成一個(gè)集合相當(dāng)于關(guān)系型數(shù)據(jù)庫里的表;
- 多個(gè)集合邏輯上組織在一起,就是數(shù)據(jù)庫。
- 一個(gè)mongodb實(shí)例可支持多個(gè)數(shù)據(jù)庫database。
mongodb與關(guān)系型數(shù)據(jù)庫對比:
MongoDB | 關(guān)系型數(shù)據(jù)庫 |
---|---|
文檔(document) | 行(row) |
集合(collection) | 表(table) |
數(shù)據(jù)庫(database) | 數(shù)據(jù)庫(database) |
mongodb內(nèi)部有預(yù)分配空間的機(jī)制,保證在數(shù)據(jù)量激增的情況下磁盤壓力過大的問題。
mongodb文檔里的_id
- 存儲在集合中的每個(gè)文檔里都會有一默認(rèn)生成的主鍵_id值,默認(rèn)是ObjectID數(shù)據(jù)類型,我們也可以根據(jù)實(shí)際情況對其進(jìn)行設(shè)置的,但在同個(gè)集合中_id值是必須保持唯一的
mongodb命令&操作
- 創(chuàng)建數(shù)據(jù)庫:use DATABASE_NAME,如果數(shù)據(jù)庫不存在, 剛創(chuàng)建數(shù)據(jù)庫, 否則切換到指定數(shù)據(jù)庫。
- 刪除數(shù)據(jù)庫, db.dropDatabase(),刪除當(dāng)前數(shù)據(jù)庫。
- 查看所有集合,show collections,顯示當(dāng)前數(shù)據(jù)庫中的集合。
- 刪除集合, db.collection.drop(), 刪除集合。
- 插入文檔,insert()方法向集合中插入文檔,db.COLLECTION_NAME.insert(document),。插入文檔也可以用db.collect_name.save(document)命令,如果不指定_id字段,save()方法類似于insert()方法;如果有指定_id字段,則會更新該_id的數(shù)據(jù)。
- 更新文檔,用update()與save(),
db.collection.update(<query>, <update>, {upsert: <boolean>, multi:<boolean>, writeConcern: <document>})
參數(shù)說明:
query : update的查詢條件,類似sql update查詢內(nèi)where后面的。
update : update的對象和一些更新的操作符(如$,$inc...)等,也可以理解為sql update查詢內(nèi)set后面的
upsert : 可選,這個(gè)參數(shù)的意思是,如果不存在update的記錄,是否插入objNew,true為插入,默認(rèn)是false,不插入。
multi : 可選,mongodb 默認(rèn)是false,只更新找到的第一條記錄,如果這個(gè)參數(shù)為true,就把按條件查出來多條記錄全部更新。
writeConcern :可選,拋出異常的級別。
db.collection.save(<document>, {writeConcern:<document>})
參數(shù)說明
document: 文檔數(shù)據(jù)
writeConcern:可選,拋出異常的級別
- 刪除文檔,db.collection.remove(<query>, {justOne: <boolean>, writeConcern:<document>})
參數(shù)說明
query:可選,刪除的文檔的條件
justOne : (可選)如果設(shè)為 true 或1,則只刪除一個(gè)文檔。
writeConcern :(可選)拋出異常的級別。
- 文檔查詢, db.collection.find(), 可以通過pretty()使得查詢出來的結(jié)果排版好看點(diǎn);db.collection.findOne()只返回一條記錄。
MongoDB與關(guān)系型數(shù)據(jù)庫where語句對比
操作 | 格式 | 范例 | RDBMS句型 |
---|---|---|---|
等于 | {<key>:<value>} | db.col.find({"id":"wills"}).pretty() | where id="wills" |
不等于 | {<key>: {$ne:<value>}} | db.col.find({"id":{$ne:"wills"}}).pretty() | where id!="wills" |
大于 | {<key>:{$gt:<value>}} | db.col.find({"id":{$gt:"wills"}}) | where id > "wills" |
大于等于 | {<key>:{$gte:<value>}} | db.col.find({"id":{$gte:"wills"}}).pretty() | where id>="wills" |
小于 | {<key>: {$lt:<value>}} | db.col.find({"id":{$lt:"wills"}}).pretty() | where id<"wills" |
小等于 | {<key>:{$lte:<value>}} | db.col.find({"id":{$lte:"wills"}}) | where id <= "wills" |
大于且小于 | {<key>:{$lt:<value>,$gt:<value>}} | db.col.find({"id":{$lt:100,$gt:50}}) | where id>50 and id<100 |
MongoDB里的一些條件查詢
- AND
db.col.find({key1:value1, key2:value2}).pretty()
- OR
db.col.find({$or: [{key1: value1}, {key2:value2} ] } ).pretty()
- AND與OR一起用
db.col.find({key1: {$gt:value}, $or: [{key2: value},{key3:value}]}).pretty()
- limit(n)
db.col.find().pretty().limit(n) 返回n條查詢到的數(shù)據(jù)
- skip(n)
db.col.find().skip(n),跳過n條數(shù)據(jù)開始查詢返回
- sort();
db.col.find().sort({key1:1,key2:-1}) ,1表示升序,-1表示降序
- ensureIndex() 索引,索引是特殊的數(shù)據(jù)結(jié)構(gòu),索引存儲在一個(gè)易于遍歷讀取的數(shù)據(jù)集合中,索引是對數(shù)據(jù)庫表中一列或多列的值進(jìn)行排序的一種結(jié)構(gòu)。
db.col.ensureIndex({KEY:1}) Key 值為你要創(chuàng)建的索引字段,1為指定按升序創(chuàng)建索引,如果你想按降序來創(chuàng)建索引指定為-1即可。
參數(shù) | 類型 | 描述 |
---|---|---|
backgrounp | boolean | 建索引過程會阻塞其它數(shù)據(jù)庫操作,默認(rèn)值false |
unique | boolean | 建立的索引是否唯一,默認(rèn)false |
name | string | 索引名字 |
dropDups | boolean | 建立唯一索引時(shí)是否刪除重復(fù)記錄,指定 true 創(chuàng)建唯一索引。默認(rèn)值為 false |
sparse | boolean | 對文檔中不存在的字段數(shù)據(jù)不啟用索引;這個(gè)參數(shù)需要特別注意,如果設(shè)置為true的話,在索引字段中不會查詢出不包含對應(yīng)字段的文檔.。默認(rèn)值為 false. |
expireAfterSeconds | integer | 指定一個(gè)以秒為單位的數(shù)值,完成 TTL設(shè)定,設(shè)定集合的生存時(shí)間 |
v | index version | 索引版本號 |
weight | document | 索引權(quán)重值,數(shù)值在 1 到 99,999 之間,表示該索引相對于其他索引字段的得分權(quán)重 |
default_language | string | 對于文本索引,該參數(shù)決定了停用詞及詞干和詞器的規(guī)則的列表。 默認(rèn)為英語 |
language_override | string | 對于文本索引,該參數(shù)指定了包含在文檔中的字段名,語言覆蓋默認(rèn)的language,默認(rèn)值為 language |
MongoDB 聚合
MongoDB中聚合(aggregate)主要用于處理數(shù)據(jù)(統(tǒng)計(jì)平均值,求和等),并返回計(jì)算后的數(shù)據(jù)結(jié)果,類似sql語句中的count(*)。
db.col.aggregate(options)
參數(shù) | 描述 | 實(shí)例 |
---|---|---|
$sum | 求和 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) |
$avg | 平均值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}]) |
$min | 獲取集合中所有文檔對應(yīng)值得最小值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}]) |
$max | 獲取集合中所有文檔對應(yīng)值得最大值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}]) |
$push | 在結(jié)果文檔中插入值到一個(gè)數(shù)組中 | db.col.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}]) |
$addToSet | 在結(jié)果文檔中插入值到一個(gè)數(shù)組中,但不創(chuàng)建副本 | db.col.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}]) |
$first | 根據(jù)資源文檔的排序獲取第一個(gè)文檔數(shù)據(jù) | db.col.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}]) |
$$last | 根據(jù)資源文檔的排序獲取最后一個(gè)文檔數(shù)據(jù) | db.col.aggregate([{$group : {_id : "$by_user", first_url : {$last : "$url"}}}]) |
管道的概念
管道在Unix和Linux中一般用于將當(dāng)前命令的輸出結(jié)果作為下一個(gè)命令的參數(shù)。
MongoDB的聚合管道將MongoDB文檔在一個(gè)管道處理完畢后將結(jié)果傳遞給下一個(gè)管道處理。管道操作是可以重復(fù)的。
表達(dá)式:處理輸入文檔并輸出。表達(dá)式是無狀態(tài)的,只能用于計(jì)算當(dāng)前聚合管道的文檔,不能處理其它的文檔。
這里我們介紹一下聚合框架中常用的幾個(gè)操作:
- $project:修改輸入文檔的結(jié)構(gòu)。可以用來重命名、增加或刪除域,也可以用于創(chuàng)建計(jì)算結(jié)果以及嵌套文檔。
- $match:用于過濾數(shù)據(jù),只輸出符合條件的文檔。$match使用MongoDB的標(biāo)準(zhǔn)查詢操作。
- $limit:用來限制MongoDB聚合管道返回的文檔數(shù)。
- $skip:在聚合管道中跳過指定數(shù)量的文檔,并返回余下的文檔。
- $unwind:將文檔中的某一個(gè)數(shù)組類型字段拆分成多條,每條包含數(shù)組中的一個(gè)值。
- $group:將集合中的文檔分組,可用于統(tǒng)計(jì)結(jié)果。
- $sort:將輸入文檔排序后輸出。
- $geoNear:輸出接近某一地理位置的有序文檔。
db.articles.aggregate( [ { $match : { score : { $gt : 70, $lte : 90 } } },{ $group: { _id: null, count: { $sum: 1 } } }] ); $match用于獲取分?jǐn)?shù)大于70小于或等于90記錄,然后將符合條件的記錄送到下一階段$group管道操作符進(jìn)行處理