本書的程序主要參考了python-data-analytics
1.首先打開一個IPython NoteBook文件,在命令行中輸入ipython notebook
PS:如果顯示不是內部或者外部的命令,也不是可以運行的程序或者批處理文件。這可能是由于你沒有安裝ipython notebook.
2.導入需要用的庫文件
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
from urllib2 import urlopen
3.使用pd.read_csv導入數據
pop2014 = pd.read_csv(urlopen('http://mcdc.missouri.edu/data/popests/CO-EST2014-alldata.csv'),
encoding = 'latin-1',
dtype = {'STATE': 'str', 'COUNTRY': 'str'}
)
數據的結果如下圖:
4.選取感興趣的部分
pop2014_by_state =? pop2014[pop2014.SUMLEV == 40]
數據的結果如下圖:
5.對結果進行排序
states.sort_values(['POPESTIMATE2014'], ascending = False)[:5]
PS:參考書上面的代碼有錯誤,可能是作者用的pandas的庫的版本比較老導致的。原作者的排序函數是sort,在我這里總是會顯示沒有該函數。
6.引入D3
%%javascript
require.config({
paths:{
d3: '//cdnjs.cloudflare.com/ajax/libs/d3/3.4.8/d3.min'
}
})
7.CSS樣式
from IPython.core.display import display, Javascript,HTMLdisplay(HTML(""".bar {
fill: steelblue;
}
.bar:hover {
fill: brown;
}
.axis {
font: 10px sans-serif;
}
.axis path,
.axis line {
fill: none;
stroke: #000;
}
.x.axis path {
display: none;
}
"""))
8.編寫JavaScript的代碼
import jinja2
myTemolate =? jinja2.Template("""
require(["d3"], function(d3) {
var data = []
{% for row in data %}
data.push({ 'state': '{{ row[1] }}', 'population': {{ row[5] }} });
{% endfor %}
d3.select("#chart_d3 svg").remove()
var margin = {top: 20, right: 20, bottom: 30, left: 40},
width = 800 - margin.left - margin.right,
height = 400 - margin.top - margin.bottom;
var x = d3.scale.ordinal()
.rangeRoundBands([0, width], .25);
var y = d3.scale.linear()
.range([height, 0]);
var xAxis = d3.svg.axis()
.scale(x)
.orient("bottom");
var yAxis = d3.svg.axis()
.scale(y)
.orient("left")
.ticks(10)
.tickFormat(d3.format('.1s'));
var svg = d3.select("#chart_d3").append("svg")
.attr("width", width + margin.left + margin.right)
.attr("height", height + margin.top + margin.bottom)
.append("g")
.attr("transform", "translate(" + margin.left + "," + margin.top + ")");
x.domain(data.map(function(d) { return d.state; }));
y.domain([0, d3.max(data, function(d) { return d.population; })]);
svg.append("g")
.attr("class", "x axis")
.attr("transform", "translate(0," + height + ")")
.call(xAxis);
svg.append("g")
.attr("class", "y axis")
.call(yAxis)
.append("text")
.attr("transform", "rotate(-90)")
.attr("y", 6)
.attr("dy", ".71em")
.style("text-anchor", "end")
.text("Population");
svg.selectAll(".bar")
.data(data)
.enter().append("rect")
.attr("class", "bar")
.attr("x", function(d) { return x(d.state); })
.attr("width", x.rangeBand())
.attr("y", function(d) { return y(d.population); })
.attr("height", function(d) { return height - y(d.population); });
});
""");
display(Javascript(myTemolate.render(
data=states.sort_values(['POPESTIMATE2014'], ascending=False)[:10].itertuples()))
)
最后顯示的效果,如下圖:
PS:如果你用的是谷歌瀏覽器,可能看不到這個結果,這是由于把彈出的窗口給屏蔽了。解決的方法是在
瀏覽器的嘆號位置,
把彈出窗口改為允許就可以了。