算法練習(14):直方圖(1.1.32)

本系列博客習題來自《算法(第四版)》,算是本人的讀書筆記,如果有人在讀這本書的,歡迎大家多多交流。為了方便討論,本人新建了一個微信群(算法交流),想要加入的,請添加我的微信號:zhujinhui207407 謝謝。另外,本人的個人博客 http://www.kyson.cn 也在不停的更新中,歡迎一起討論

算法(第4版)

知識點

  • 直方圖概念

題目

1.1.32 直方圖。假設標準輸入流中含有一系列 double 值。編寫一段程序,從命令行接受一個整數 N 和 兩個 doubl 值 l 和 r。將 (l,r) 分為 N 段并使用 StdDraw 畫出輸入流中的值落入每段的數量的直方圖。


1.1.32 Histogram. Suppose that the standard input stream is a sequence of double values. Write a program that takes an integer N and two double values l and r from the command line and uses StdDraw to plot a histogram of the count of the numbers in the standard input stream that fall in each of the N intervals defined by dividing (l , r) into N equal-sized intervals.

分析

在習題算法練習(3) :遞歸(1.1.15-1.1.21)中,我們已經接觸了直方圖,下面我們再詳細的講一下直方圖。

直方圖(Histogram)又稱質量分布圖。是一種統計報告圖,由一系列高度不等的縱向條紋或線段表示數據分布的情況。 一般用橫軸表示數據類型,縱軸表示分布情況。
應用步驟
(1)收集數據。作直方圖的數據一般應大于50個。
  (2)確定數據的極差(R)。用數據的最大值減去最小值 求得。
  (3)確定組距(h)。先確定直方圖的組數,然后以此組數去除極差,可得直方圖每組的寬度,即組距。組數的確定要適當。組數太少,會引起較大計算誤差;組數太多,會影響數據分組規律的明顯性,且計算工作量加大。
  (4)確定各組的界限值。為避免出現數據值與組界限值重合而造成頻數據計算困難,組的界限值單位應取最小測量單位的1/2。分組時應把數據表中最大值和最小值包括在內。
  第一組下限值為:最小值-0.5;
  第一組上限值為:第一組下限值加組距;
  第二組下限值就是第一組的上限值;
  第二組上限值就是第二組的下限值加組距;
  第三組以后,依此類推定出各組的組界。
  (5)編制頻數分布表。把多個組上下界限值分別填入頻數分布表內,并把數據表中的各個數據列入相應的組,統計各組頻數據(f )。
  (6)按數據值比例畫出橫坐標。
  (7)按頻數值比例畫縱坐標。以觀測值數目或百分數表示。
  (8)畫直方圖。按縱坐標畫出每個長方形的高度,它代表取落在此長方形中的數據數。(注意:每個長方形的寬度都是相等的。)在直方圖上應標注出公差范圍(T)、樣本容量(n)、樣本平均值(x)、樣本標準偏差值(s)和x的位置等。

StdDraw庫
在書中,有一個展示繪制矩形的代碼,截圖如下:

/*
* demo :用于展示StdDraw.filledRectangle 的用法
*/
int N = 50;
double[] a = new double[N];
for (int i = 0; i < N; i++)
    a[i] = StdRandom.random();

for (int i = 0; i < N; i++) {
    double x = 1.0 * i / N;
    double y = a[i] / 2.0;
    double rw = 0.5 / N;
    double rh = a[i] / 2.0;
    StdDraw.filledRectangle(x, y, rw, rh);
}

我們來分析一下這個代碼,主要是方法filledRectangle
他的API文檔在書中是這么寫的
static void filledRectangle(double x, double y, double rw, double rh)
四個參數分別為
x: 這個矩形的起始x坐標
y:這個矩形的起始x坐標
rw:寬度
rh:高度
關于StdDraw庫后面還有相應的文章會提到,大家后面會對它越來越有深入的了解

視頻講解

點此觀看分析視頻:直方圖介紹
點此觀看分析視頻:習題答案

答案

public class Histogram {

    public static void main(String[] args) {

        double[] a = { 1.12, 1.22, 5.666, 9.0908, 8.902, 3.892, 10.782, 10.9,
                10.19, 10.29, 20.1 };
        int N = 10;
        double l = 1.09;
        double r = 20.29;

        // 組距
        double classInterval = (r - l) / N;
        // 對應到直方圖中的組距
        double intervalReact = 1 * 1.0 / N;

        for (int i = 0; i < N; i++) {
            // 每組數據的左值和右值
            double tempLeft = l + classInterval * i;
            double tempRight = l + classInterval * (i + 1);
            // 每組數據的左值對應到直方圖中的左值
            double tempLeftReact = intervalReact * i;

            /**
             * 以下代碼塊是用于輸入流在計算該組數下的頻數
             */
            int tempNum = 0;
            for (int j = 0; j < a.length; j++) {
                if (a[j] > tempLeft && a[j] < tempRight) {
                    tempNum++;
                }
            }
            // 將頻數轉換為頻率
            double height = tempNum * 1.0 / (N * 2);
            // 畫圖
            StdDraw.filledRectangle(tempLeftReact, height, intervalReact,
                    height);
        }

    }

}       

代碼索引

Histogram.java

廣告

我的首款個人開發的APP壁紙寶貝上線了,歡迎大家下載。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。