Media Data之多媒體數(shù)據(jù)庫(一)數(shù)據(jù)庫結(jié)構(gòu)分析

Android MediaProvider 使用 SQLite 數(shù)據(jù)庫存儲圖片、視頻、音頻等多媒體文件的信息,供視頻播放器、音樂播放器、圖庫使用。Media數(shù)據(jù)庫分為internal 和external ,對應(yīng)的是內(nèi)部存儲和外部存儲數(shù)據(jù)庫,兩個數(shù)據(jù)庫內(nèi)容相似,我們分析的是外部存儲設(shè)備的數(shù)據(jù)庫。 外部存儲數(shù)據(jù)庫都是以類似 external-ffffffff.db 的形式命名的, 后面的 8 個 16 進制字符是該 SD 卡 FAT 分區(qū)的 Volume ID。該 ID 是分區(qū)時決定的,只有重新分區(qū)或者手動改變才會更改,可以防止插入不同 SD 卡時數(shù)據(jù)庫沖突。接下來分析Media數(shù)據(jù)庫的結(jié)構(gòu)和詳細(xì)信息。

1. 提取數(shù)據(jù)庫

首先確保手機已經(jīng)獲得root權(quán)限,然后輸入命令:
adbpull/data/data/com.android.providers.media/databases/external.db將數(shù)據(jù)庫從手機中提取到本地。然后打開相應(yīng)的分析工具,分析此數(shù)據(jù)庫。

2. 數(shù)據(jù)庫結(jié)構(gòu)分析

Android 的多媒體數(shù)據(jù)庫主要由表、視圖、索引以及觸發(fā)器組成。如下圖所示:
這里寫圖片描述
這里寫圖片描述
這里寫圖片描述
這里寫圖片描述

2.1 創(chuàng)建語句

下面的sql語句是創(chuàng)建此數(shù)據(jù)庫的語句,也就是數(shù)據(jù)庫模式:

CREATE TABLE android_metadata (locale TEXT);
CREATE TABLE thumbnails (_id INTEGER PRIMARY KEY,_data TEXT,image_id INTEGER,kind INTEGER,width INTEGER,height INTEGER);CREATE INDEX image_id_index on thumbnails(image_id);
CREATE TABLE artists (artist_id INTEGER PRIMARY KEY,artist_key TEXT NOT NULL UNIQUE,artist TEXT NOT NULL);
CREATE TABLE albums (album_id INTEGER PRIMARY KEY,album_key TEXT NOT NULL UNIQUE,album TEXT NOT NULL);
CREATE TABLE album_art (album_id INTEGER PRIMARY KEY,_data TEXT);
CREATE VIEW album_info AS SELECT audio.album_id AS _id, album, album_key, MIN(year) AS minyear, MAX(year) AS maxyear, artist, artist_id, artist_key, count(*) AS numsongs,album_art._data AS album_art FROM audio LEFT OUTER JOIN album_art ON audio.album_id=album_art.album_id WHERE is_music=1 GROUP BY audio.album_id;
CREATE VIEW artists_albums_map AS SELECT DISTINCT artist_id, album_id FROM audio_meta;
CREATE TABLE audio_genres (_id INTEGER PRIMARY KEY,name TEXT NOT NULL);
CREATE TRIGGER audio_genres_cleanup DELETE ON audio_genres BEGIN DELETE FROM audio_genres_map WHERE genre_id = old._id;END;
CREATE TABLE audio_playlists_map (_id INTEGER PRIMARY KEY,audio_id INTEGER NOT NULL,playlist_id INTEGER NOT NULL,play_order INTEGER NOT NULL);
CREATE TRIGGER albumart_cleanup1 DELETE ON albums BEGIN DELETE FROM album_art WHERE album_id = old.album_id;END;
CREATE TRIGGER albumart_cleanup2 DELETE ON album_art BEGIN SELECT _DELETE_FILE(old._data);END;
CREATE INDEX albumkey_index on albums(album_key);CREATE INDEX artistkey_index on artists(artist_key);
CREATE VIEW searchhelpertitle AS SELECT * FROM audio ORDER BY title_key;CREATE VIEW search AS SELECT _id,'artist' AS mime_type,artist,NULL AS album,NULL AS title,artist AS text1,NULL AS text2,number_of_albums AS data1,number_of_tracks AS data2,artist_key AS match,'content://media/external/audio/artists/'||_id AS suggest_intent_data,1 AS grouporder FROM artist_info WHERE (artist!='<unknown>') UNION ALL SELECT _id,'album' AS mime_type,artist,album,NULL AS title,album AS text1,artist AS text2,NULL AS data1,NULL AS data2,artist_key||' '||album_key AS match,'content://media/external/audio/albums/'||_id AS suggest_intent_data,2 AS grouporder FROM album_info WHERE (album!='<unknown>') UNION ALL SELECT searchhelpertitle._id AS _id,mime_type,artist,album,title,title AS text1,artist AS text2,NULL AS data1,NULL AS data2,artist_key||' '||album_key||' '||title_key AS match,'content://media/external/audio/media/'||searchhelpertitle._id AS suggest_intent_data,3 AS grouporder FROM searchhelpertitle WHERE (title != '');
CREATE TABLE videothumbnails (_id INTEGER PRIMARY KEY,_data TEXT,video_id INTEGER,kind INTEGER,width INTEGER,height INTEGER);
CREATE INDEX video_id_index on videothumbnails(video_id);
CREATE VIEW artist_info AS SELECT artist_id AS _id, artist, artist_key, COUNT(DISTINCT album_key) AS number_of_albums, COUNT(*) AS number_of_tracks FROM audio WHERE is_music=1 GROUP BY artist_key;
CREATE INDEX artist_idx on artists(artist);
CREATE INDEX album_idx on albums(album);
CREATE VIEW audio_playlists AS SELECT _id,_data,name,date_added,date_modified FROM files WHERE media_type=4;
CREATE VIEW audio_genres_map_noid AS SELECT audio_id,genre_id from audio_genres_map;
CREATE VIEW audio_meta AS SELECT _id,_data,_display_name,_size,mime_type,date_added,is_drm,date_modified,title,title_key,duration,artist_id,composer,album_id,track,year,is_ringtone,is_music,is_alarm,is_notification,is_podcast,bookmark,album_artist FROM files WHERE media_type=2;
CREATE VIEW audio as SELECT * FROM audio_meta LEFT OUTER JOIN artists ON audio_meta.artist_id=artists.artist_id LEFT OUTER JOIN albums ON audio_meta.album_id=albums.album_id;
CREATE VIEW images AS SELECT _id,_data,_size,_display_name,mime_type,title,date_added,date_modified,description,picasa_id,isprivate,latitude,longitude,datetaken,orientation,mini_thumb_magic,bucket_id,bucket_display_name,width,height FROM files WHERE media_type=1;
CREATE VIEW video AS SELECT _id,_data,_display_name,_size,mime_type,date_added,date_modified,title,duration,artist,album,resolution,description,isprivate,tags,category,language,mini_thumb_data,latitude,longitude,datetaken,mini_thumb_magic,bucket_id,bucket_display_name,bookmark,width,height FROM files WHERE media_type=3;CREATE TABLE "audio_genres_map" (_id INTEGER PRIMARY KEY,audio_id INTEGER NOT NULL,genre_id INTEGER NOT NULL,UNIQUE (audio_id,genre_id) ON CONFLICT IGNORE);CREATE TABLE "files" (_id INTEGER PRIMARY KEY AUTOINCREMENT,_data TEXT UNIQUE COLLATE NOCASE,_size INTEGER,format INTEGER,parent INTEGER,date_added INTEGER,date_modified INTEGER,mime_type TEXT,title TEXT,description TEXT,_display_name TEXT,picasa_id TEXT,orientation INTEGER,latitude DOUBLE,longitude DOUBLE,datetaken INTEGER,mini_thumb_magic INTEGER,bucket_id TEXT,bucket_display_name TEXT,isprivate INTEGER,title_key TEXT,artist_id INTEGER,album_id INTEGER,composer TEXT,track INTEGER,year INTEGER CHECK(year!=0),is_ringtone INTEGER,is_music INTEGER,is_alarm INTEGER,is_notification INTEGER,is_podcast INTEGER,album_artist TEXT,duration INTEGER,bookmark INTEGER,artist TEXT,album TEXT,resolution TEXT,tags TEXT,category TEXT,language TEXT,mini_thumb_data TEXT,name TEXT,media_type INTEGER,old_id INTEGER,storage_id INTEGER,is_drm INTEGER,width INTEGER, height INTEGER);
CREATE INDEX album_id_idx ON files(album_id);
CREATE INDEX artist_id_idx ON files(artist_id);
CREATE INDEX bucket_index on files(bucket_id,media_type,datetaken, _id);
CREATE INDEX bucket_name on files(bucket_id,media_type,bucket_display_name);
CREATE INDEX format_index ON files(format);
CREATE INDEX media_type_index ON files(media_type);
CREATE INDEX parent_index ON files(parent);
CREATE INDEX path_index ON files(_data);
CREATE INDEX sort_index ON files(datetaken ASC, _id ASC);CREATE INDEX title_idx ON files(title);
CREATE INDEX titlekey_index ON files(title_key);
CREATE TRIGGER audio_playlists_cleanup DELETE ON files WHEN old.media_type=4 BEGIN DELETE FROM audio_playlists_map WHERE playlist_id = old._id;SELECT _DELETE_FILE(old._data);END;CREATE TRIGGER files_cleanup DELETE ON files BEGIN SELECT _OBJECT_REMOVED(old._id);END;
CREATE TABLE "log" (time DATETIME, message TEXT);
CREATE TABLE bookmarks ( _id INTEGER PRIMARY KEY, _data TEXT, _display_name TEXT, position INTEGER, date_added INTEGER, mime_type TEXT, media_type TEXT);

2.2 視圖

即虛擬表,它的內(nèi)容都是派生自其他表的查詢結(jié)果,雖然看起來像基本表,但不是基本表,因為視圖的內(nèi)容是動態(tài)生成的。視圖的用處是將頻繁使用的復(fù)雜的查詢放進一個虛擬表,方便查詢。在上面的創(chuàng)建語句中,類似CREATE VIEW既是。??
SQLite 當(dāng)中視圖都是只讀的,也就是說不能對視圖進行插入、更新、刪除等操作。

2.3 索引

索引是一種用來在某種條件下加速查詢的結(jié)構(gòu)。SQLite使用B-樹做索引。索引會增加數(shù)據(jù)庫的大小,索引使用使用首先要考慮什么時候使用索引,要不要使用索引。在 Android 數(shù)據(jù)庫當(dāng)中基本上使用自增 id 值作為主鍵,并建立了索引。索引可以加快數(shù)據(jù)查找速度,但由于需要維護索引所以插入/刪除等寫入操作速度會變慢。在上面的創(chuàng)建語句中,類似CREATE INDEX既是。

2.4 觸發(fā)器

當(dāng)具體的表發(fā)生特定的數(shù)據(jù)庫事件時,觸發(fā)器執(zhí)行對應(yīng)的SQL指令。觸發(fā)器可以用來創(chuàng)建自定義完整性約束、日志改變、更新表和其他操作。觸發(fā)器是為了維護數(shù)據(jù)庫刪除操作而建立的,因為所刪除的表可能與另外的表有關(guān)系,需要同時刪除另外一個表的字段??梢钥匆韵乱粋€例子:

CREATE TRIGGER audio_meta_cleanupDELETE ON audio_metaBEGIN DELETE FROM audio_genres_map WHERE audio_id = old._id; DELETE FROM audio_playlists_map WHERE audio_id = old._id;END;CREATE TRIGGER audio_meta_cleanupDELETE ON audio_metaBEGIN DELETE FROM audio_genres_map WHERE audio_id = old._id; DELETE FROM audio_playlists_map WHERE audio_id = old._id;END;```
??這是關(guān)于audio_meta 表的觸發(fā)器,意思是當(dāng)刪除此表上的記錄時,同時刪除 audio_genres_map 表上 audio_id 與此表 id 相同的記錄,刪除 audio_playlists_map 表上 audio_id 與此表 id 相同的記錄。這樣當(dāng)刪除 audio_meta 表的記錄時,另外兩個表的相應(yīng)記錄也會自動刪除,不會由于漏刪除而殘留多余數(shù)據(jù)。
#3. 數(shù)據(jù)庫表分析??
下面就對音頻,圖片和視頻表進行分析和總結(jié)。
##3.1 音頻??
利用PowerDesigner工具逆向工程生成物理數(shù)據(jù)模式,如下圖所示,其中pk指的是主鍵。![這里寫圖片描述](http://upload-images.jianshu.io/upload_images/1819426-6c9c078652120308?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)??
下面是對上面主要的表的字段解析:
**album_art:專輯封面**
|字段|解析|
| ------------- |:-----|
|album_id|主鍵。專輯 id|
|_data|專輯封面緩存的路徑|

**albums:專輯信息**
|字段|解析|
| ------------- |:-----|
|album_id|  主鍵。專輯 id|
|album_key|全大寫字母,用于字母索引|
|album| 專輯名|

**android_metadata:當(dāng)前字符編碼**|字段|解析|| ------------- |:-----||locale   |默認(rèn)字符編碼,例如 zh_CN|**artists:藝術(shù)家**|字段|解析|| ------------- |:-----||artist_id|  主鍵。藝術(shù)家 id||artist_key|  全大寫字母,用于字母索引||artist    |藝術(shù)家|**audio_genres:流派**|字段|解析|| ------------- |:-----||_id |主鍵。流派 id||name |流派名稱|**audio_genres_map:音頻流派映射**|字段|解析|| ------------- |:-----||字段 |解析||_id    |主鍵。映射 id||audio_id|    音頻 id||genre_id|流派 id|**audio_meta:音頻信息**|字段|解析|| ------------- |:-----||_id    |主鍵。音頻 id||_data    |文件絕對路徑||_display_name  |文件名||_size |文件大小,單位 byte||mime_type    |類似于 audio/mpeg 的 MIME 類型||date_added   |添加到數(shù)據(jù)庫的時間,單位秒||date_modified   |文件最后修改時間,單位秒||title    |來自 ID3 信息的標(biāo)題,無則為不帶擴展名的文件名||title_key|  全大寫字母的標(biāo)題||duration  |時長||artist_id  |藝術(shù)家 id||composer   |來自 ID3 信息,作曲家||album_id    |專輯 id||track   |來自 ID3 信息,音軌||year |來自 ID3 信息,年代||is_ringtone  |是否鈴聲,0 或 1||is_music   |是否音樂,1 才會在音樂播放器顯示||is_alarm    |是否鬧鐘鈴聲||is_notification    |是否通知鈴聲||is_podcast |是否 podcast||bookmark   |字典標(biāo)志位|**audio_playlists:播放列表**|字段|解析|| ------------- |:-----||_id  |主鍵。播放列表 id||_data  |文件路徑||name |播放列表名||date_added  |加入的時間||date_modified   |最近修改的時間|**audio_playlists_map:音頻播放列表映射**|字段|解析|| ------------- |:-----||_id    |主鍵。映射 id||audio_id |音頻 id||playlist_id |播放列表 id||play_order    |播放順序|??為了消除數(shù)據(jù)冗余,建議了進行映射的表。假如有大量音頻屬于同一流派,如果沒有映射表則需要每個音頻都需要記錄同樣的流派數(shù)據(jù),有了映射表之后則只有一條記錄就夠了。##3.2 圖片??圖片的表主要有兩個,images和thumbnails,對應(yīng)的是圖片信息和略縮圖信息。其物理模型如下圖所示:![這里寫圖片描述](http://upload-images.jianshu.io/upload_images/1819426-67967e0e6a3b941b?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)**images:圖片信息**|字段|解析|| ------------- |:-----||_id   |主鍵。圖片 id,從 1 開始自增||_data   |圖片絕對路徑||_size  |文件大小,單位為 byte||_display_name   |文件名||mime_type |類似于 image/jpeg 的 MIME 類型||title    |不帶擴展名的文件名||date_added  |添加到數(shù)據(jù)庫的時間,單位秒||date_modified   |文件最后修改時間,單位秒||description  |文件的描述||picasa_id   |用于 picasa 網(wǎng)絡(luò)相冊||isprivate  |是否是私有的||latitude   |緯度,需要照片有 GPS 信息||longitude |經(jīng)度,需要照片有 GPS 信息||datetaken |取自 EXIF 照片拍攝時間,若為空則等于文件修改時間,單位毫秒||orientation  |取自 EXIF 旋轉(zhuǎn)角度,在圖庫旋轉(zhuǎn)圖片也會改變此值||mini_thumb_magic   |取小縮略圖時生成的一個隨機數(shù),見 MediaThumbRequest||bucket_id  |等于 path.toLowerCase.hashCode(),見 MediaProvider.computeBucketValues()||bucket_display_name  |直接包含圖片的文件夾就是該圖片的 bucket,就是文件夾名|**thumbnails:縮略圖**|字段|解析|| ------------- |:-----||_id   |主鍵??s略圖 id,從 1 開始自增||_data  |圖片絕對路徑||image_id   |縮略圖所對應(yīng)圖片的 id,依賴于 images 表 _id 字段,可建立外鍵||kind   |縮略圖類型,1 是大縮略圖,2 基本不用,3 是微型縮略圖但其信息不保存在數(shù)據(jù)庫||width    |縮略圖寬度||height  |縮略圖高度|##3.3 視頻??視頻的表主要有兩個,video和videothumbnails,對應(yīng)的是視頻信息和略縮圖信息。其物理模型如下圖所示:![這里寫圖片描述](http://upload-images.jianshu.io/upload_images/1819426-e912814a78ef6628?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)**video:視頻信息**|字段|解析|| ------------- |:-----||_id   |主鍵。視頻 id||_data    |視頻絕對路徑||_display_name| 文件名||_size  |文件大小,單位為 byte||mime_type   |類似于 video/avi 的 MIME 類型||date_added    |添加到數(shù)據(jù)庫的時間,單位秒||date_modified   |文件最后修改時間,單位秒||title    |不帶擴展名的文件名||duration    |視頻時長,單位毫秒||artist  |藝術(shù)家||album |專輯名,一般為文件夾名||resolution    |分辨率||description   |描述||isprivate  |是否是私有的||tags   |標(biāo)簽||category   |類別||language   |語言||mini_thumb_data    |最小的略縮圖數(shù)據(jù)||latitude |經(jīng)度||longitude  |維度||datetaken  |數(shù)據(jù)的標(biāo)識||mini_thumb_magic    |取小縮略圖時生成的一個隨機數(shù),見 MediaThumbRequest||bucket_id  |等于 path.toLowerCase.hashCode(),見 MediaProvider.computeBucketValues()||bucket_display_name| 直接包含視頻的文件夾就是該圖片的 bucket,就是文件夾名||bookmark    |字典的標(biāo)識|**videothumbnails:視頻縮略圖**|字段|解析|| ------------- |:-----||_id |主鍵??s略圖 id||_data   |縮略圖絕對路徑||video_id  |縮略圖所對應(yīng)視頻的 id,依賴于 video 表 _id 字段||kind  |縮略圖類型,1 是大圖,視頻只能取類型 1||width   |縮略圖寬度||height  |縮略圖高度|
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

推薦閱讀更多精彩內(nèi)容