談數據刪除設計-以記賬憑證為例

1 常見刪除策略

凡是做業務邏輯系統, 總是離不開對刪除邏輯的處理.
本文論述重點是偽刪除, 即字段標示狀態, 這是在一些中小型系統開發中的單據等較重要數據的主流做法.
但在此之前, 不妨先將常見刪除策略列舉一下:

  1. 數據庫設置級聯
    這個我沒太懂是怎么回事, 不過網上也說缺點較多, 很少用到, 在此就不考慮了

  2. 觸發器控制

CREATE TRIGGER `tg_bf_insert_t_product_only` BEFORE INSERT ON `t_product` FOR EACH ROW begin
insert into t_product_only (p_id,only_code) values (new.p_id,concat(new.group_code,',',new.p_code)) ;
end;
CREATE TRIGGER `tg_af_delete_product_only` AFTER DELETE ON `t_product` FOR EACH ROW begin
insert into t_product_deleted  (p_id,group_code,p_code) values (old.p_id,old.group_code,old.p_code);
delete from t_product_only where p_id=old.p_id;

優點是代碼業務邏輯簡單化, 且可以使用unique index,
缺點是對于一些級聯數據的恢復不好控制, 如主表單和明細表單, 另在表結構變更的時候, 對于觸發器的維護也是一件需要注意的事情.
3. 字段標示狀態/偽刪除(下文中將統稱為偽刪除)
即用狀態表示已刪除,如status=-1或者is_del=1,
之所以說是中小型系統開發的主流做法, 是因為對于重要數據, 為了控制風險, 不會直接將數據刪除, 而使用觸發器前面的缺點也說了, 維護十分不易.
中小型系統本來就有邏輯變更頻繁, 以及數據量不會太高(單據數量幾百萬上千萬, 但很少上億)的特點, 權衡之下, 偽刪除往往成為首選.

2 偽刪除不同設計的優劣點

即使是偽刪除, 也有幾種不同的設計方式, 以下以財務系統中常常使用到的記賬憑證為例, 介紹下幾種偽刪除的設計方案, 及實際中應當如何選擇.

以下是現實生活當中的一張記賬憑證圖片.


image

由圖片可以看出, 傳統的記賬憑證, 在數據庫設計中, 至少需要兩種表: 憑證主表和憑證明細表.
憑證主表記錄憑證日期, 憑證字(如記), 憑證數(如圖片右上角的1號)等信息,
憑證明細需要記錄摘要, 會計科目, 借貸方向/借方金額/貸方金額(這三個內容在數據庫表中至少需要保存2個).
實際憑證設計中, 可能還需要考慮輔助核算等信息, 本文簡化處理不考慮這些.

由于憑證比較重要, 多數情況都是原始信息源(即不是可從其他數據中推導出的冗余), 故選擇偽刪除是較常見的.

2.1 狀態設計字段的選擇

如前文所述, 對于偽刪除字段的選擇, 一般有兩種:

  1. 將憑證的常見狀態全都放在一個字段中, 包含已保存status=0, 已審核status=1, 已刪除status=-1;

  2. 將已刪除單獨設為一個字段, 如is_del, 刪除狀態時為0, 偽刪除狀態時為1.

第一種選擇, 好處是狀態字段只有一個, 且恰好憑證在已審核狀態下是不允許被刪除的, where約束起來比較簡單.

update fnc_voucher
set status=-1
where company_id=1001
and voucher_month='2019-01'
and voucher_mark='記-1'
and status=0

第二種選擇, 好處是將刪除狀態與正常的審批流程狀態區分開, 使得兩種邏輯得以解耦, 還有一種好處, 下文中會有提及.

-- is_audited是是否已審核的意思
update fnc_voucher
set is_del=1
where company_id=1001
and voucher_month='2019-01'
and voucher_mark='記-1'
and is_audited=0
and is_del=0

雖然第一種選擇的sql看起來更簡短, 但個人還是建議第二種選擇.

2.2 唯一索引的設計協同

設計數據庫表格時, 一般建議是每一張數據庫表格至少需設置一個唯一索引, 個別情況還需要設計多個唯一索引. 偽刪除帶來的狀態標識字段增加, 可能會給唯一索引的設計帶來一些影響.

當憑證不考慮偽刪除的時候, 其唯一索引的設計方式如下:

alter table fnc_voucher
add unique key uk_voucher_cmm (company_id,voucher_month,voucher_mark);

當用戶允許憑證斷號時, 如在'記-7'和'記-9'之間允許存在一個空的憑證號時,以上的唯一索引仍能正常發揮作用.
但當用戶不允許憑證斷號(至少不允許自動斷號,可以增加手動憑證彌補斷號)時, 上面的唯一索引就不再符合邏輯. 當'記-8'憑證已偽刪除時, 如果再增加一張同月的'記-8'憑證, 無疑會報duplicate key錯誤.

為了消除這種問題, 就需要將刪除信息體現在唯一索引中.
這就是我建議將刪除狀態單獨設置為一個字段的另一個原因: 當憑證被刪除時, 不將is_del設為1, 而改為id值:

update fnc_voucher
set is_del=id
where company_id=1001
and voucher_month='2019-01'
and voucher_mark='記-8'
and is_audited=0
and is_del=0

這樣, 唯一索引就可設計為:

alter table fnc_voucher
add unique key uk_voucher_cmmd (company_id,voucher_month,voucher_mark,is_del);

對于均放在一個字段中的設計, 當然也可考慮將刪除后的狀態值設置為id的負值:

update fnc_voucher
set status=-id
where company_id=1001
and voucher_month='2019-01'
and voucher_mark='記-8'
and status=0

只是這樣做, 又會更進一步增加刪除與正常流程的耦合性, 給以后的設計帶來較大的困擾, 是不很建議這樣做的. 只有當已經將刪除設計為單字段混合狀態時, 才考慮使用這種方法.

2.3 對憑證明細的影響

前文所述的重點, 都是在對憑證主表上, 而一旦考慮到憑證明細, 就又回出現新的問題.
查詢憑證明細表的時候, 有兩種選擇:

  1. 根據主表的id查詢;
select summary,subject_code,debit_amount,credit_amount
from fnc_voucher_detail
where company_id=1001
and voucher_id=12345
-- 此sql理論上可以不在約束條件中加company_id限制,加只是為了格式統一
  1. 根據主表的憑證標識來查詢;
select summary,subject_code,debit_amount,credit_amount
from fnc_voucher_detail
where company_id=1001
and voucher_month='2019-01'
and voucher_mark='記-8'

每種都有各自的優勢, 就筆者個人而言, 習慣使用第二種: 根據主表的憑證表示查詢憑證明細, 但這就產生衍生了一個新的問題:
當一個憑證偽刪除時, 且又生成了一個與已刪除憑證標識相同的新憑證, 則新憑證就會共享已刪除憑證的明細, 導致明細邏輯的錯誤!

解決這個問題, 就必須要在憑證明細上也增加刪除狀態標識, 當偽刪除憑證時, 同時也對憑證明細進行偽刪除處理.

update fnc_voucher_detail
set is_del=id
where company_id=1001
and voucher_month='2019-01'
and voucher_mark='記-8'
and is_del=0;
select summary,subject_code,debit_amount,credit_amount
from fnc_voucher_detail
where company_id=1001
and voucher_month='2019-01'
and voucher_mark='記-8'
and is_del=0;

如果使用根據id關聯查詢, 當然可以規避這種情況, 只是用id需要關聯查詢, 一般會帶來一些效率上的差異.

具體使用哪種明細關聯方式, 見仁見智吧.

end

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容

  • 數據庫的基本是概念名詞解釋: 數據庫名詞解釋 元組:可以理解為表的每一行就是一個元組 候選碼:若關系中的某一屬性組...
    杰倫哎呦哎呦閱讀 1,136評論 0 6
  • 索引 數據庫中的查詢操作非常普遍,索引就是提升查找速度的一種手段 索引的類型 從數據結構角度分 1.B+索引:傳統...
    一凡呀閱讀 3,009評論 0 8
  • 文/Bruce.Liu1 1.建模簡介 范式:英文名稱是 Normal Form,它是英國人 E.F.Codd(埃...
    BruceLiu1閱讀 5,645評論 0 9
  • 數據庫優化 sql語句優化 索引優化 加緩存 讀寫分離 分區 分布式數據庫(垂直切分) 水平切分 MyISAM和I...
    半瓶陽光o_o閱讀 593評論 0 2
  • 時間復雜度分析:壓棧和彈棧的時間復雜度均為O(1)級別,因為只需更改單個節點的索引即可。空間復雜度分析:在入棧和出...
    胡子先生丶閱讀 605評論 0 1