資源整理。
1 Coding:
1.USGS StreamStats客戶端應(yīng)用,基于typescript。
2.與ngraph.louvain類似,此模塊使用Louvain方法檢測(cè)圖形中的聚類。
3.R語言包fastlmm,分形光譜變換線性混合模型。
4.R語言包bigFastlm,重新實(shí)現(xiàn)RcppEigen的fastLm函數(shù)用于big.matrix對(duì)象的快速內(nèi)存線性模型擬合。
5.浙江大學(xué)課程攻略共享計(jì)劃。
6.開源的自然語言處理研究庫,基于Pytorch構(gòu)建。
7.R語言包ordinal,序數(shù)數(shù)據(jù)的回歸模型。
8.西部山區(qū)湖泊數(shù)據(jù)庫。
9.用于跟蹤自然語言處理(NLP)進(jìn)度的存儲(chǔ)庫,包括數(shù)據(jù)集和最常見的NLP任務(wù)的當(dāng)前最新技術(shù)。
10.Python庫sklearn bayes,使用scikit-learn API進(jìn)行貝葉斯機(jī)器學(xué)習(xí)。
11.用于R中可重復(fù)研究的可靠資源列表包括不同工具的比較表。
12.R語言包nomnoml,為nomnoml提供了一個(gè)R接口,這是一個(gè)基于語法和可定制樣式繪制時(shí)髦UML圖的工具。
13.Pardiso.jl包提供了使用Julia語言的PARDISO 5.0和Intel MKL PARDISO的界面。 如果沒有PARDISO的有效許可證或安裝了MKL庫,則無法使用Pardiso.jl。 此軟件包是免費(fèi)提供的,絕不會(huì)替換或更改鏈接庫的任何功能。
14.用于基因組預(yù)測(cè)的分布式AI-REML最佳線性無偏預(yù)測(cè)框架,包括逐環(huán)境交互。該軟件已在手稿針對(duì)中進(jìn)行了描述和驗(yàn)證:通過逐個(gè)環(huán)境的相互作用進(jìn)行大規(guī)模基因組預(yù)測(cè)。
15.任意模糊核的深度即插即用超分辨率重建,CVPR2019論文。
16.發(fā)現(xiàn)并安裝有用的RStudio插件。
17.Hugo的whisper主題。
18.R語言的torch,深度學(xué)習(xí)的庫。
19.R語言包textfeatures,用于從字符對(duì)象中提取有用功能的簡(jiǎn)單包。
20.Kaggle 項(xiàng)目實(shí)戰(zhàn)(教程) = 文檔 + 代碼 + 視頻(歡迎參與)。
21.結(jié)構(gòu)化算法刷題訓(xùn)練指南。
22.Machine Learning Mastery 博客文章翻譯
23.AiLearning:機(jī)器學(xué)習(xí) - 機(jī)器學(xué)習(xí) - ML,深度學(xué)習(xí) - DeepLearning - DL,自然語言處理NLP。
24.Docker配置,圖像以及Dockerfiles for Oracle產(chǎn)品和項(xiàng)目示例的官方來源。
25.深入學(xué)習(xí),Berkeley STAT 157(2019年春季)教科書。 使用代碼,數(shù)學(xué)和討論。
26.Open Long-Tailed Recognition(OLTR)是作者重新實(shí)現(xiàn)的長(zhǎng)尾識(shí)別器,“"Large-Scale Long-Tailed Recognition in an Open World”
作者:Ziwei Liu, Zhongqi Miao, Xiaohang Zhan, Jiayun Wang, Boqing Gong, Stella X. Yu (CUHK & UC Berkeley / ICSI)。
參加IEEE計(jì)算機(jī)視覺與模式識(shí)別會(huì)議(CVPR)2019,口頭報(bào)告。
27.“具有缺失值的Logistic回歸的隨機(jī)逼近EM”的代碼和實(shí)現(xiàn)。
28.隱式重啟Arnoldi方法,原生Julia實(shí)現(xiàn)。
29.R語言包StanSensitivity,用于在Stan中自動(dòng)生成局部靈敏度測(cè)量的工具。
30.R語言包rtemis,高級(jí)機(jī)器學(xué)習(xí)研究和應(yīng)用的平臺(tái)。rtemis的目標(biāo)是使數(shù)據(jù)科學(xué)無障礙且高效,同時(shí)不影響靈活性。
31.R語言包zipcodes,提供美國(guó)40569個(gè)郵政編碼的城市,縣,州,縣FIPS代碼和州FIPS代碼。
32.pytrec eval是Python的信息檢索評(píng)估工具
33.R中學(xué)習(xí)和使用GAM的資源。
34.R語言包printr,這是knitr的配套包。
35.使用hadoop,flume,hive和R(igraph)的twitter數(shù)據(jù)的社會(huì)網(wǎng)絡(luò)分析。
36.R語言包vitae,使用簡(jiǎn)單的R Markdown創(chuàng)建和維護(hù)簡(jiǎn)歷或簡(jiǎn)歷。 它提供了一系列LaTeX模板,以及向文檔添加內(nèi)容的有用功能。
37.PlusCal中的算法示例,Lamport的TLA +的算法語言。
38.關(guān)于貝葉斯建模的因果推斷的論文。
39.該存儲(chǔ)庫是ASPRS LAS工作組(LWG)的官方協(xié)作編輯環(huán)境。 我們負(fù)責(zé)維護(hù)ASPRS LAS規(guī)范,這是遙感行業(yè)最廣泛使用的點(diǎn)云數(shù)據(jù)文件格式。
40.Python中天文時(shí)間序列的通用工具。
41.關(guān)于R的本科課程的幻燈片。
42.Python庫imcmc,用于將2d圖像轉(zhuǎn)換為概率分布,然后從中進(jìn)行采樣以創(chuàng)建圖像和GIF。 現(xiàn)在,它最適用于徽標(biāo)和基于形狀的圖像。
2 Paper:
遙感技術(shù)可以準(zhǔn)確地捕捉環(huán)境特征,并與環(huán)境建模方法一起幫助預(yù)測(cè)氣候敏感的傳染病爆發(fā)。布魯氏菌病在馴養(yǎng)動(dòng)物和人類中仍然在世界范圍內(nèi)猖獗。本研究使用人類布魯氏菌病(HB)作為測(cè)試案例,以確定疾病的重要環(huán)境決定因素并預(yù)測(cè)其爆發(fā)。利用年度縣級(jí)HB病例數(shù)據(jù)和37個(gè)環(huán)境變量數(shù)據(jù)開發(fā)了一種新的人工神經(jīng)網(wǎng)絡(luò)(ANN)模型,可能與中國(guó)內(nèi)蒙古的HB相關(guān)。 2006年至2008年的數(shù)據(jù)用于培訓(xùn),驗(yàn)證和測(cè)試模型,而2009-2010的數(shù)據(jù)用于評(píng)估模型的性能。增強(qiáng)植被指數(shù)被確定為HB發(fā)生率的最重要預(yù)測(cè)因子,其次是地表溫度和其他與溫度和降水相關(guān)的變量。基于這些預(yù)測(cè)因子對(duì)HB的合適生態(tài)位進(jìn)行建模。在模型開發(fā)和評(píng)估階段,模型估計(jì)與HB報(bào)告的報(bào)告數(shù)量一致。該研究表明,可以使用人工神經(jīng)網(wǎng)絡(luò)模型和從衛(wèi)星數(shù)據(jù)獲得的環(huán)境變量,以合理的準(zhǔn)確度預(yù)測(cè)HB爆發(fā)。該研究加深了對(duì)HB環(huán)境決定因素的理解,并推進(jìn)了預(yù)測(cè)氣候敏感性傳染病爆發(fā)的方法。基于遙感與傳染病爆發(fā)的研究。首先考慮到了疾病的基本病理,接著考慮了比較容易影響疾病的幾個(gè)以及容易從衛(wèi)星影像獲取的環(huán)境變量,基于神經(jīng)網(wǎng)絡(luò)方法預(yù)測(cè)疾病爆發(fā),很不錯(cuò)的健康地理研究。
千年發(fā)展目標(biāo)(MDGs)促使人們擴(kuò)大了獲得健康指標(biāo)的方法,以衡量實(shí)現(xiàn)這些目標(biāo)的進(jìn)展情況。 準(zhǔn)確的測(cè)量應(yīng)考慮到各國(guó)健康風(fēng)險(xiǎn)的高度空間異質(zhì)性,促使開發(fā)復(fù)雜的制圖技術(shù)以繪制風(fēng)險(xiǎn)并對(duì)其進(jìn)行建模。 將這些風(fēng)險(xiǎn)轉(zhuǎn)換為相關(guān)的基于人口的指標(biāo)需要有關(guān)人口空間分布和屬性的同樣詳細(xì)信息。 然而,缺乏關(guān)于年齡和性別構(gòu)成的空間信息,促使許多健康指標(biāo)研究忽視了國(guó)家以外存在的實(shí)質(zhì)性人口變化,僅僅應(yīng)用了國(guó)家層面的調(diào)整。柳葉刀上的一篇文章,提出了高空間分辨率人口數(shù)據(jù)對(duì)健康研究的重要性。
由于樹木可以對(duì)城市生態(tài)系統(tǒng)中的局部環(huán)境產(chǎn)生積極影響,因此測(cè)量其形態(tài)特征非常重要,例如胸徑(DBH)的高度和直徑。但是,為每棵樹測(cè)量這些數(shù)據(jù)是一個(gè)耗時(shí)的過程,需要大量的人力。在這項(xiàng)研究中,我們研究了使用移動(dòng)LiDAR估算城市街道和城市公園的樹高和胸徑的可行性。我們將移動(dòng)LiDAR裝置的測(cè)量結(jié)果與城市公園和街道中樹高和胸徑的現(xiàn)場(chǎng)測(cè)量結(jié)果進(jìn)行了比較。應(yīng)用高度 - 地面和Pratt圓擬合方法分別計(jì)算樹高和DBH。 LiDAR估計(jì)的樹高度雖然略有低估,但非常準(zhǔn)確,街道樹的均方根誤差為0.359 m,公園樹的均方根誤差為0.462 m。另一方面,估計(jì)的DBH是中等準(zhǔn)確和高估的,街道樹的均方根誤差為3.77厘米,公園樹的均方根誤差為8.95厘米。公園內(nèi)密集種植的樹木和城市地區(qū)的障礙物會(huì)導(dǎo)致“陰影”(沒有數(shù)據(jù)的區(qū)域),從而降低準(zhǔn)確性。不規(guī)則的干線形狀和不包括每個(gè)干線的完整數(shù)據(jù)點(diǎn)覆蓋的掃描數(shù)據(jù)是導(dǎo)致錯(cuò)誤的原因。盡管存在這些錯(cuò)誤,但本研究強(qiáng)調(diào)了使用移動(dòng)地面激光雷達(dá)平臺(tái)獲得的樹木測(cè)量的潛力,可以從基于點(diǎn)的位置擴(kuò)展到鄰域規(guī)模和城市規(guī)模的清單。利用移動(dòng)地面激光雷達(dá)測(cè)量城市森林的胸徑高度和直徑,樹木胸徑本身就是生物量(碳儲(chǔ)量)的一個(gè)重要變量。這樣有利于評(píng)估城市森林在碳循環(huán)中的作用。
為了改善亞洲空氣質(zhì)量差并提供有效的減排戰(zhàn)略,了解不同污染源的貢獻(xiàn)及其相關(guān)的人類健康負(fù)擔(dān)至關(guān)重要。在這項(xiàng)研究中,我們使用WRF-Chem區(qū)域大氣模型來探索空氣質(zhì)量和人類健康益處,以消除七個(gè)不同的人為部門(運(yùn)輸,工業(yè),航運(yùn),農(nóng)業(yè),能源生產(chǎn),住宅燃燒和開放生物質(zhì)燃燒)的排放2014年南亞和東亞。我們根據(jù)該地區(qū)空氣質(zhì)量監(jiān)測(cè)站的測(cè)量結(jié)果評(píng)估WRF-Chem,并發(fā)現(xiàn)該模型記錄了PM2.5的空間分布和大小(該地區(qū)顆粒物質(zhì)濃度為2.5)。最大的人類健康益處通過消除住宅或工業(yè)排放來實(shí)現(xiàn),分別在印度,中國(guó)和東南亞避免467 000(409 000-542 000)或283 000(95UI:226 000-358 000)年度過早死亡;避免防火28 000(95UI:24 000-32 000)該地區(qū)的年度過早死亡率。我們將我們的結(jié)果與之前的行業(yè)特定排放研究進(jìn)行比較。根據(jù)這些研究,住宅排放是印度顆粒污染的主要原因,多模型對(duì)人口加權(quán)年平均PM2.5的平均貢獻(xiàn)為42%。住宅和工業(yè)排放在中國(guó)占主導(dǎo)地位,兩個(gè)部門的多模型平均貢獻(xiàn)率為人口加權(quán)年平均PM2.5。未來的工作應(yīng)側(cè)重于確定住宅,工業(yè)和開放式生物質(zhì)燃燒排放部門中最有效的選擇,以改善整個(gè)南亞和東亞的空氣質(zhì)量。基于WRFF-Chem做的PM2.5分布,接著與不同部門的排放清單進(jìn)行分析,結(jié)合人口暴露,分析了健康效應(yīng)以及減排的重點(diǎn)部門。
5.Local-scale landslide susceptibility mapping using the B-GeoSVC model/使用B-GeoSVC模型進(jìn)行局部尺度滑坡敏感性繪圖
局部尺度的滑坡敏感性繪圖(LSM)為決策和規(guī)劃提供了詳細(xì)信息。由于忽略了空間異質(zhì)性,大多數(shù)已發(fā)布的滑坡敏感性圖缺乏局部尺度的可靠信息。為了豐富LSM的局部尺度信息,需要針對(duì)局部空間異質(zhì)性的多種信息融合方法和控制因子的區(qū)域趨勢(shì)。然而,還沒有為L(zhǎng)SM提出信息融合方法。在本文中,我們?cè)贚SM的分層貝葉斯框架下開發(fā)了一種新的集成統(tǒng)計(jì)方法,名為B-GeoSVC。具體而言,該模型應(yīng)用GeoDetector方法擬合控制因子的區(qū)域趨勢(shì),并采用空間變異系數(shù)(SVC)模型來擬合每個(gè)控制因子的局部空間異質(zhì)性。然后,區(qū)域趨勢(shì)和局部空間異質(zhì)性信息融合在分層貝葉斯框架內(nèi)。 B-GeoSVC模型使用來自中國(guó)杜文盆地的數(shù)據(jù)進(jìn)行驗(yàn)證,該盆地位于受2008年5月12日MS 4.0汶川地震影響的中部地區(qū)。在交叉驗(yàn)證實(shí)驗(yàn)中,預(yù)測(cè)準(zhǔn)確率為B-GeoSVC模型為86.09%,曲線下面積為0.93,這表明B-GeoSVC模型能夠?qū)崿F(xiàn)相對(duì)準(zhǔn)確的局部尺度LSM,并提供比傳統(tǒng)區(qū)域尺度LSM更豐富的局部信息。更重要的是,不僅可以將B-GeoSVC模型用作融合滑坡測(cè)繪的區(qū)域和地方尺度信息的一般解決方案,而且還可以為更廣泛的地球科學(xué)和空間統(tǒng)計(jì)提供新的見解。基于Geodtector加上分層貝葉斯框架,開發(fā)了一個(gè)B-GeoSVC模型,對(duì)滑坡進(jìn)行預(yù)測(cè),實(shí)現(xiàn)滑坡制圖。考慮了空間異質(zhì)性的該模型,精度更高,融合了多源信息,這種思想也可以借鑒到其他方面研究中。
各種水文研究都強(qiáng)調(diào)了準(zhǔn)確表示降雨空間結(jié)構(gòu)的重要性。人們還普遍承認(rèn),需要考慮降雨量輸入的不確定性。常見方法側(cè)重于計(jì)算降雨量估算中的點(diǎn)測(cè)量或采樣不確定性。我們提出了一種方法,共同考慮影響降雨時(shí)空制圖的三個(gè)不確定性來源:點(diǎn)測(cè)量,采樣和鄰域不確定性。據(jù)我們所知,任何先前的降雨不確定性分析都沒有包括鄰域不確定性。我們?cè)诘溛鞑浚?055平方公里)的一個(gè)集水區(qū)以2公里x 2公里的空間分辨率生成了400個(gè)日降雨量場(chǎng)的集合。我們方法的核心是順序高斯模擬(SGS)技術(shù)。結(jié)果表明我們的方法能夠重現(xiàn)降雨分布的關(guān)鍵統(tǒng)計(jì)特征。我們研究了不同空間(網(wǎng)格和流域)和時(shí)間支持(一天,一個(gè)月,五年)對(duì)總體不確定性的影響。我們還量化了每個(gè)不確定性來源對(duì)降雨場(chǎng)不確定性的影響。最后,我們將模擬結(jié)果與專家啟發(fā)研究的結(jié)果進(jìn)行了比較。我們發(fā)現(xiàn),5年內(nèi)平均流域降雨量的專家引發(fā)不確定性遠(yuǎn)大于我們研究中的量化(CV為1.1%對(duì)5%)。測(cè)量雨量的5年平均值發(fā)現(xiàn)了更大的差異,其中專家引發(fā)導(dǎo)致的值高出一個(gè)數(shù)量級(jí)(CV為0.2%對(duì)2%)。討論了這種差距的可能原因。降雨制圖的不確定性分析,非常有意思的一個(gè)研究,首先是分析了三個(gè)不確定性源,接著模擬一個(gè)數(shù)據(jù)并分析不確定性同時(shí)與專家啟發(fā)研究的結(jié)果進(jìn)行不確定性對(duì)比。空間數(shù)據(jù)不確定性分析的一個(gè)很好的樣例研究。
了解城市化與空氣污染之間的權(quán)衡可以為城市可持續(xù)發(fā)展提供重要的見解。由于PM2.5記錄的可用性,PM2.5在中國(guó)的這種情況非常罕見。因此,我們根據(jù)PM2.5是PM10的主要成分,PM2.5與深圳氣象能見度具有顯著關(guān)系來估算1973-2017年深圳長(zhǎng)時(shí)間PM2.5濃度。我們發(fā)現(xiàn)深圳的PM2.5濃度經(jīng)歷了倒U型變化,緩慢增加,快速增加,保持高水平,緩慢減少和快速減少的五個(gè)不同階段。深圳的PM2.5濃度動(dòng)態(tài)并未完全遵循EKC的倒U形而是M形。這項(xiàng)研究的結(jié)果不僅為中國(guó)其他城市提供了一個(gè)實(shí)例,而且還建議中低收入國(guó)家的其他城市通過更好地關(guān)注發(fā)展與污染之間的權(quán)衡來發(fā)展。 分析了深圳PM2.5的變化,尤其是改革開放前后,這次的EKC終于不再是喜聞樂見的倒U形而是M形,也是一個(gè)比較有意思的點(diǎn)。
為減少人類活動(dòng)中廣泛存在的二氧化碳(CO2)排放,以往的研究非常重視城市社會(huì)經(jīng)濟(jì)發(fā)展,城市形態(tài)和二氧化碳排放之間的關(guān)系,并通過有效的城市空間規(guī)劃提供相關(guān)的減排政策。然而,是否以及如何影響二氧化碳排放水平的城市形態(tài)的不同特征(如緊湊性)仍然存在爭(zhēng)議,特別是考慮到城市的不同發(fā)展水平。因此,本研究旨在綜合探討社會(huì)經(jīng)濟(jì)因素和城市形態(tài)如何共同影響二氧化碳排放,同時(shí)考慮到中國(guó)五個(gè)城市層級(jí)發(fā)展水平的差異。首先,每個(gè)城市的二氧化碳排放來自省級(jí)能源統(tǒng)計(jì),輻射校準(zhǔn)的夜間燈光遙感影像和基于分解模型的人口分布數(shù)據(jù)。然后,分別從城市統(tǒng)計(jì)和土地利用數(shù)據(jù)中獲取一組代表社會(huì)經(jīng)濟(jì)因素和城市形態(tài)的變量。在從1995年到2015年獲得這五個(gè)城市層級(jí)的平衡數(shù)據(jù)集之后,最終應(yīng)用面板數(shù)據(jù)分析來評(píng)估社會(huì)經(jīng)濟(jì)因素和城市形態(tài)在不同發(fā)展階段對(duì)二氧化碳排放的影響。估算結(jié)果表明,經(jīng)濟(jì)發(fā)展,人口增長(zhǎng)和城市土地?cái)U(kuò)張是加速城市二氧化碳排放的重要因素。此外,由于所有城市層級(jí)的潛在運(yùn)輸需求增加,城市土地使用的不規(guī)則或分散結(jié)構(gòu)可能導(dǎo)致更多的二氧化碳排放。值得注意的是,城市核心區(qū)域日益集中的模式被發(fā)現(xiàn)會(huì)增加一線城市的二氧化碳排放量,但會(huì)促進(jìn)其他四個(gè)城市層級(jí)的二氧化碳排放量的減少。具有緊湊和多核模式的城市空間發(fā)展被認(rèn)為與較低水平的二氧化碳排放密切相關(guān)。這些結(jié)果突出了城市發(fā)展水平對(duì)于減緩二氧化碳排放的決策的重要性,并從社會(huì)經(jīng)濟(jì)發(fā)展和城市空間規(guī)劃的角度為建設(shè)低碳城市提供科學(xué)支持。利用面板數(shù)據(jù)分析二氧化碳排放的影響。基于統(tǒng)計(jì)年鑒數(shù)據(jù)、夜間燈光遙感以及人口數(shù)據(jù)得到的。給出了一些宏觀意義的減排政策。