Pandas的數(shù)據(jù)結(jié)構(gòu):
Series:一維數(shù)組,與Numpy中的一位Array類似。二者與Python基本的數(shù)據(jù)結(jié)構(gòu)List也很相近,區(qū)別是List可以放不同的數(shù)據(jù)類型,而Array和Series只能放相同的數(shù)據(jù)類型。
Time-Series:以時(shí)間為索引的Series。
DataFrame:二維表格型的數(shù)據(jù)結(jié)構(gòu)。可以將DataFrame理解為Series的容器。
Panel:三維數(shù)組,可以理解為DataFrame的容器。Panel很少使用,但確是很重要的三維數(shù)組。
Panel4D:Panel4D是像Panel一樣的4維容器,作為N維容器的一個(gè)測試。
PanelND:PanelND是一個(gè)擁有factory集合,可以創(chuàng)建像Panel4D一樣N維命名容器的模塊。
Series:
Series是一個(gè)類似一維的數(shù)組對象,包含一個(gè)數(shù)組的數(shù)據(jù)(任何Numpy類型)和一個(gè)與數(shù)組關(guān)聯(lián)的數(shù)據(jù)標(biāo)簽,被叫做索引。Series對象主要有兩個(gè)屬性:index和values,如果傳給構(gòu)造器的是一個(gè)列表,則index的值是從0遞增的整數(shù),如果傳遞的是一個(gè)類字典的鍵值對結(jié)構(gòu),就會生成index-value對應(yīng)的Series。比如:
DataFrame
一個(gè)DataFrame類似一個(gè)表格,類似電子表格的數(shù)據(jù)結(jié)構(gòu),包含一個(gè)經(jīng)過排序的列表集,他們每一個(gè)都可以有不同的類型值(數(shù)字、字符串、布爾),DataFrame有行和列的索引;他可以看作一個(gè)Series的字典
和Series一樣,他的索引也是自動分配,并且對列進(jìn)行了排序,也可以給列一個(gè)順序,讓它按照傳遞的順序排列
如果傳遞了一個(gè)行,但不在data中,他的結(jié)果將為NA值
在DataFrame中的一列可以通過字典記法或?qū)傩詠頇z索