出現最多的字符串

這是用String本身的方法實現(es6的新增方法不太熟悉,基本上es5的);

  1. 使用String的match方法
  • 用正則匹配返回是的匹配到的字符串的數組
  • 用string匹配,則返回一個類似 ["a", index: 2, input: "dfas"]
  • 沒有匹配,則返回null
function getMostChar(str) {
  //出現的字符
  var most_char = '';
  var char = '';
  var char_arr = [];

  //出現的次數
  var most_count = 0;
  var count = 0;
  var count_arr = [];

  var len = str.length;
  if (len > 1) {
    (function() {
      for (var i = 0; i < len; i++) {

        char = str[i];

        var flag = char_arr.some(function(item, index) {
          return item == char;
        })

        if (!flag) {
          char_arr.push(char);

          var pattern = new RegExp(char, 'g');
          var result = str.match(pattern);
          if (result) {
            count = result.length;
          }
          
          count_arr.push(count);
        }

        if (most_count < count) {
          most_count = count;
          most_char = char;
        }
      }
    })()
  } else {
    char_arr.push(str);
    most_count = len;
    most_char = str;
  }
  console.log('擁有的字符的種類:' + char_arr, ';出現最多次數的字符:' + most_char, ';出現的次數的數組:' + count_arr, ';出現最多次數:' + most_count);
}
  1. indexOf 和 do{}while()
  • indexOf() 返回字符出現的第一次的位置,沒有匹配則返回-1
  • idnexOf(str,startpos) 的有兩個參數
    • str 匹配的字符
    • startpos {type number} 設置從字符串的開始匹配位置(包含這個startpos)
  • do{}while() 錯誤的也得執行一次
function getMostChar(str) {
  //出現的字符
  var most_char = '';
  var char = '';
  var char_arr = [];

  //出現的次數
  var most_count = 0;
  var count = 0;
  var count_arr = [];

  //字符串出現的位置
  var pos = -1;

  var len = str.length;
  if (len > 1) {
    (function() {
      for (var i = 0; i < len; i++) {
        char = str[i];
        var flag = char_arr.some(function(item, index) {
          return item == char;
        })

        if (!flag) {
          char_arr.push(char);

          do {
              count++;
              pos = str.indexOf(char, pos+1);
          } while(pos>-1)
          if(i===0){
            count = count-1;
          }
          
          count_arr.push(count);
        }

        if(most_count < count){
          most_count = count;
          most_char = char;
        }

        //重置為下次遍歷做準備
        count = 0;
        // 已經檢測過不在檢測,對pos設置為當前位置
        pos = i+1;
      }
    })()
  } else {
    char_arr.push(str);
    most_count = len;
    most_char = str;
  }
  console.log('pos: ' + pos, ';擁有的字符的種類:' + char_arr, ';出現最多次數的字符:' + most_char, ';出現的次數的數組:' + count_arr, ';出現最多次數:' + most_count);
}

while 類似

function getMostChar(str) {
  //出現的字符
  var most_char = '';
  var char = '';
  var char_arr = [];

  //出現的次數
  var most_count = 0;
  var count = 0;
  var count_arr = [];

  //字符串出現的位置
  var pos = 0;

  var len = str.length;
  if (len > 1) {
    (function() {
      for (var i = 0; i < len; i++) {
        char = str[i];
        var flag = char_arr.some(function(item, index) {
          return item == char;
        })

        if (!flag) {
          char_arr.push(char);

          while(pos>-1) {
              count++;
              pos = str.indexOf(char, pos+1);
          } 

          count_arr.push(count);
        }

        if(most_count < count){
          most_count = count;
          most_char = char;
        }

        //重置為下次遍歷做準備
        count = 0;
        pos = i+1;
      }
    })()
  } else {
    char_arr.push(str);
    most_count = len;
    most_char = str;
  }
  console.log('pos: ' + pos, ';擁有的字符的種類:' + char_arr, ';出現最多次數的字符:' + most_char, ';出現的次數的數組:' + count_arr, ';出現最多次數:' + most_count);
}
  1. 用search 方法實現,其實邏輯同indexOf是一樣的。只不過要利用字符串的截取方法。
function getMostChar(str) {
  //出現的字符
  var most_char = '';
  var char = '';
  var char_arr = [];

  //出現的次數
  var most_count = 0;
  var count = 0;
  var count_arr = [];

  //字符串出現的位置
  var pos = 0;
  var sub_str = '';
  var sub_str_pos = 0;

  var len = str.length;
  if (len > 1) {
    (function() {
      for (var i = 0; i < len; i++) {
        char = str[i];
        var flag = char_arr.some(function(item, index) {
          return item == char;
        })

        if (!flag) {
          char_arr.push(char);

          var pattern = new RegExp(char, 'g');

          while (sub_str_pos > -1) {
            count++;
            sub_str = str.slice(pos+1);
            sub_str_pos = sub_str.search(pattern);
            pos = (pos + 1) + sub_str_pos;
          }

          count_arr.push(count);
        }

        if (most_count < count) {
          most_count = count;
          most_char = char;
        }

        //重置為下次遍歷做準備
        pos = i + 1;
        count = 0;
        sub_str = '';
        sub_str_pos = 0;
      }
    })()
  } else {
    char_arr.push(str);
    most_count = len;
    most_char = str;
  }
  console.log('pos: ' + pos, ';擁有的字符的種類:' + char_arr, ';出現最多次數的字符:' + most_char, ';出現的次數的數組:' + count_arr, ';出現最多次數:' + most_count);
}
  1. replace ,這是最最簡單的,最好理解。
function getMostChar(str) {
  //出現的字符
  var most_char = '';
  var char_arr = [];

  //出現的次數
  var most_count = 0;
  var count = 0;
  var count_arr = [];

  var new_char = str[0];
  var len = str.length;

  while (str) { // 實際上是這樣子的 while(str !== '')
    char_arr.push(new_char);

    var pattern = new RegExp(new_char, 'g');
    str = str.replace(pattern, '');

    count = len - str.length;
    count_arr.push(count);
    if (most_count < count) {
      most_count = count;
      most_char = new_char;
    }
    // 重置
    len = str.length;
    new_char = str[0];
  }

  console.log('擁有的字符的種類:' + char_arr, ';出現最多次數的字符:' + most_char, ';出現的次數的數組:' + count_arr, ';出現最多次數:' + most_count);
}
  1. split 這個方法使用起來實際上是把字符串變成數組,那就不是String方法。所以沒做下去。

這個有什么好玩性了,可以檢測作者是怎么用詞,檢測他用詞。

例如,我找汪曾祺的《異秉》,測試:

var str = '小說的內容';

getMostCharSort(str);

function getMostCharSort(str) {
  var kv_arr = [];

  //出現的字符
  var char = str[0];
  var most_char = '';
  var char_arr = [];

  //出現的次數
  var most_count = 0;
  var count = 0;
  var count_arr = [];

  var len = str.length;

  while (str) { 

    var pattern = new RegExp(char, 'g');
    str = str.replace(pattern, '');

    if (!(/\,|\。|\:|\“|\”|\?|\!|\s|\、|\—|\(|\)/ig.test(char))) {

      char_arr.push(char);
      count = len - str.length;

      kv_arr.push({
        count: count,
        char: char
      });

      count_arr.push(count);
      if (most_count < count) {
        most_count = count;
        most_char = char;
      }
    }
    // 重置
    len = str.length;
    char = str[0];
  }

  console.log('擁有的字符的種類:' + char_arr);
  console.log('出現最多次數的字符:' + most_char);
  console.log('出現的次數的數組:' + count_arr, );
  console.log('出現最多次數:' + most_count);

  des(kv_arr)

  show(kv_arr);
}

function show(arr) {
  var table = document.createElement('table');
  var table_html = '<tr><td>字符</td><td>次數</td></tr>' 
    + '<tr><td>'+ '字的種類:' +'</td><td>' + arr.length + '</td></tr>';

  arr.forEach(function(item, index) {
    table_html = table_html + ('<tr ><td>' + item.char + '</td><td> ' + item.count + '</td></tr>');
  })

  table.innerHTML = table_html;
  document.body.appendChild(table);
}

function des(arr){
  for(var i = 0; i < arr.length; i++){
    for(var j = arr.length-1; j > i; j--) {
      if(arr[i].count <= arr[j].count) {

        var des_count = arr[j].count;
        var des_char = arr[j].char;

        arr[j].count = arr[i].count;
        arr[j].char = arr[i].char;

        arr[i].count = des_count;
        arr[i].char = des_char;
      }
    }
  }
}

我們將算法改進,不在用冒泡。

function getMostCharSort(str) {
  var kv_arr = [];

  //出現的字符
  var char = str[0];

  //出現的次數
  var most_count = 0;
  var less_count = 0;
  var center_count = 0;
  var center_index = 0;
  var count = 0;

  var len = str.length;

  while (str) { // 實際上是這樣子的 while(str !== '')

    var pattern = new RegExp(char, 'g');
    str = str.replace(pattern, '');
    // 去掉一些特殊的符號
    if (!(/\,|\。|\:|\“|\”|\?|\!|\s|\、|\—|\(|\)/ig.test(char))) {
      count = len - str.length;

      if (count >= most_count) {
        kv_arr.unshift({
          count: count,
          char: char
        });

        center_index ++;
        center_count = kv_arr[center_index];

        most_count = count;
        if(kv_arr.length == 1){
          less_count = count;
        }
      } else {
        if (count > center_count) {
          for (var j = center_index - 1; j > 0; j--) {
            if (count < kv_arr[j]) {
              kv_arr.splice(j, 0, {
                count: count,
                char: char
              })
            }
            center_count++
            center_count = kv_arr[center_index];
          }
        } else {
          if (count <= less_count) {
            kv_arr.push({
              count: count,
              char: char
            })
            less_count = count;
          } else if(count > less_count) {
            var less_index = kv_arr.length;
            for (var i = center_index + 1; i < less_index; i++) {
              if (count > kv_arr[i]) {
                kv_arr.splice(i-1,0,{
                  count: count,
                  char: char
                })
              }
            }
          }
        }
      }
    }
    len = str.length;
    char = str[0];
  }

  show(kv_arr);
}

function show(arr) {
  var table = document.createElement('table');
  var table_html = '<tr><td>字符</td><td>次數</td></tr>' +
    '<tr><td>' + '字的種類:' + '</td><td>' + arr.length + '</td></tr>';

  arr.forEach(function(item, index) {
    table_html = table_html + ('<tr ><td>' + item.char + '</td><td> ' + item.count + '</td></tr>');
  })

  table.innerHTML = table_html;
  document.body.appendChild(table);
}
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。

推薦閱讀更多精彩內容