目前在國內醫學領域,包括各大三甲醫院、科研機構和院校,SCI論文的發表正在逐漸成為一個硬性的要求。
首先是醫院臨床醫師職稱的晉升,文章是最重要的評價體系,畢竟一直處于住院醫或主治的狀態確實不好受,臨床工作和夜班的雙重壓力加持對于大家身心健康是個巨大的影響因素。對于臨床一線工作者來說,時間是最大的成本。
圖片.png
而對于還在醫學院校讀研和讀博的同學,能否順利發表sci首先是直接關乎到我們能否畢業,這個其實也是我們醫學生最為焦慮甚至導致失眠的事情,尤其是后面有導師和師兄師姐瘋狂的push你的時候,這個是我們醫學生焦慮的根源。
而對于升學,985,211的醫學院校碩博面試的時候導師可能非常看重是否有SCI論文的發表,尤其是對于現在正在推行的博士申請考核制來說。
圖片.png
我本人研究生畢業已經2年,在讀期間以第一作者發表sci 2篇,共同第一作者發表sci 3篇,現階段為醫學科研技術交流的自由職業者。總結一下我們可能發文的途徑和現狀:
- META:剛入學校可能有師姐師兄推薦你發meta文章,因為在大多數醫學生眼中meta文章很耗費。但是這個地方大家要注意難的不是分析方法(什么森林圖的繪制,統計軟件R或stata的使用,這些不是難點),而是選題很難,因為分析方法都是固定的,但你想到的很多選題都已經被發表過。況且很多醫學院校不認可meta文章來作文畢業文章。
- 基礎實驗:對于臨床醫師和臨床型研究生幾乎不可能有時間去實驗學習做實驗,這個工作是一個非常“肝”的工作,會耗費巨大的時間和精力,而且不一定能做出結果,所有這個對于非專業科研的我是極力不推薦的
- 生物信息學:這個要分倆種情況,一是課題組有自己的經費去做測序并得到自己的測序數據,這一類生信文章還可以結合公共數據庫和部分基礎實驗,這一類文章比較好發表。二是純公共數據庫生信文章,現在的情況確實也可以發表,但是大家要明白就是這個是投稿的門檻越來越高,簡單的來說就是很難投,中稿的是少數人,因為目前生信發文的趨勢是生信分析結合基礎實驗。
- 臨床文章:這個才是醫生和醫學生真正能夠拿到數據源并且進行快速撰寫的一類。一般臨床數據源分倆種:一是你所在科室的數據,自己搜集,可能0.5-1H一例樣本,主要是搜集速度較慢,二是公共數庫:SEER,MIMIC。MIMIC是重癥醫學數據,且注冊相比SEER麻煩的不止一星半點,而且最反人類的就是居然要用SQL進行數據查詢,也就是說讓醫學研究者用數據庫編程語言去搜索數據庫。而SEER是唯一最全最友好的回顧性研究臨床腫瘤和死亡率統計數據庫,且數據源可以快速獲取。結合自己的數據和SEER數據庫數據進行選題、分析,這個也是我目前最為推薦也是最為靠譜的快速發表SCI方式,對于節約我們的時間成本是最為有效的途徑。大家看到的有些同學一年發2-3篇,很多就是臨床文章花式變化選題之后進行的論文發表。
圖片.png
但是對于初學者,使用SEER數據庫進行臨床模型文章發表SCI下面幾個最大的難題:
- SEER數據庫賬號注冊及數據下載、數據篩選和字段編碼注釋:**SEER數據庫在數據下載及編碼注釋上的查詢流程寫的非常模糊,初學者很多時候是完全懵的。
- 臨床數據分析和臨床模型建立的方法學探索困難:如COX回歸的亞組分析森林圖、GIVITI曲線、決策分析曲線,PSM,競爭風險模型以及機器學習等代碼和實戰流程的資料很少。在方法學的學習,我們提倡就是完整性,以及發表臨床數據分析論文的方法學你盡量都要掌握
- 統計分析工具的學習:這里如果是剛開始做科研的的同學,我強烈建議你直接從R起步,跳過SPSS,STAT等統計軟件,R是未來數據統計的趨勢,可以替代SPSS和STAT的任何分析和功能
- 論文投稿決策:大家很多人可能還未意識到,論文的發表是一個系統性的工程。而我們很多人只過分關注于學習臨床數據分析的方法學,而忽略了這至關重要的一步。很多時候我們發現論文寫完時候卻投不出去,屢次拒稿,浪費了大量的時間和精力,最后導致導師對我們的研究失去信心或者耐心,這個其實也是很多碩士和博士所最為困擾的一點,也是碩博研究生焦慮的根源。然而為什么會被聯系拒稿?這個地方大家要意識到一個問題就是論文的評定是編輯和審稿人決策,既然是人的行為,那就必然有偏好,如果我們在選擇雜志時不去考慮這個潛在的偏好因素,我們做的一切工作都只能變成我們的自嗨。所以當我們屢次被拒稿的時候我們必須冷靜下來去分析不同的雜志,去搜集信息去決策,去分析雜志編輯接收論文的偏好,但是怎么去做,這個非常關鍵。**同樣在同期眾多1000~2000的稿件中,如何去獲得雜志編輯的關注,這個也是大家必須要思考的問題。
圖片.png
在這里我以個人經驗說幾點:
- 任何數據庫的數據下載及轉換都需要探索,對于SEER數據庫來說,要尤其在官網頁面的SEERdata頁面進行仔細查找和搜索
- 臨床數據分析方法大家要學習一些更新的臨床數據模型和方法,nomogram這個雖然目前還能發文,但創新性已大打折扣
- R語言學習,大家要先學習R語言最核心的內容,就是數據類型和數據結構,包括python,golang也是如此。對于R的學習來說,我個人認為數據類型和數據結構占R學習70%,剩下30%就是照搬代碼。
- 文章寫完投哪個雜志,這里我建議大家要對臨床數據論文和雜志做系統性的信息分享,找出近倆年SEER相關文章的投稿趨勢,對雜志進行層級的歸類。
想要獲取進一步的問題解決方案,騰訊課堂搜索 : SEER數據庫論文體系。讓我們一起成長,共同進步