leetcode刷题记录-2047. 句子中的有效单词数

202 阅读2分钟

「这是我参与2022首次更文挑战的第5天,活动详情查看:2022首次更文挑战

前言

今天虽然是一道简单题,但是题目的复杂程度不亚于中等题,或许题目能用最基本的语法判断写出来,但是要耗费的时间也是十分久的,非常能锻炼做题时对于细节的把握程度

每日一题

今天的每日一题为 2047. 句子中的有效单词数,难度为简单

  • 句子仅由小写字母('a' 到 'z')、数字('0' 到 '9')、连字符('-')、标点符号('!'、'.' 和 ',')以及空格(' ')组成。每个句子可以根据空格分解成 一个或者多个 token ,这些 token 之间由一个或者多个空格 ' ' 分隔。

  • 如果一个 token 同时满足下述条件,则认为这个 token 是一个有效单词:

  • 仅由小写字母、连字符和/或标点(不含数字)。

  • 至多一个 连字符 '-' 。如果存在,连字符两侧应当都存在小写字母("a-b" 是一个有效单词,但 "-ab" 和 "ab-" 不是有效单词)。

  • 至多一个 标点符号。如果存在,标点符号应当位于 token 的 末尾 。

  • 这里给出几个有效单词的例子:"a-b."、"afad"、"ba-c"、"a!" 和 "!" 。

  • 给你一个字符串 sentence ,请你找出并返回 sentence 中 有效单词的数目 。

示例 1:

输入:sentence = "cat and  dog"
输出:3
解释:句子中的有效单词是 "cat""and""dog"

示例 2:

输入:sentence = "!this  1-s b8d!"
输出:0
解释:句子中没有有效单词
"!this" 不是有效单词,因为它以一个标点开头
"1-s""b8d" 也不是有效单词,因为它们都包含数字

示例 3:

输入:sentence = "alice and  bob are playing stone-game10"
输出:5
解释:句子中的有效单词是 "alice""and""bob""are""playing"
"stone-game10" 不是有效单词,因为它含有数字

示例 4:

输入:sentence = "he bought 2 pencils, 3 erasers, and 1  pencil-sharpener."
输出:6
解释:句子中的有效单词是 "he""bought""pencils,""erasers,""and""pencil-sharpener."

提示:

  • 1 <= sentence.length <= 1000
  • sentence 由小写英文字母、数字(0-9)、以及字符(' '、'-'、'!'、'.' 和 ',')组成
  • 句子中至少有 1 个 token

题解

暴力解法

这道题最暴力的解法就是一步步去判断,一有不满足的条件就退出,满足就加一,虽然说判断都不难,但是这个工作量对于算法比较弱的来说有点大。然后我们来一个个分析题目的要求:

  1. 字符串中含有多个单词token,我们可以先用空格作为分隔符分隔出一个个小字符串,然后可以在写一个验证方法,将一个个字符串传入并且拆成一个个字符循环,这样比较方便之后的不符合条件直接退出函数。
  2. 首先每次循环第一先判断是否为数字,是的话直接退出
  3. 然后题目要求每个单词只能有一个标点符号,并且有的话一定要在最后面,那么就先去判断是否为标点符号,因为题目的标点符号只有三个,所以我们可以写一个数组作为保存,判断是否为标点符号就只需要用indexOf即可,是标点符号再去判断当前的位数是否是最后一位
  4. 最后就是连字符的情况,连字符最多出现一次,就需要一个标记来纪录连字符出现的次数,超过一次就退出,然后连字符前面和后面一定都要是小写字母,并且还要注意数组溢出的问题,要判断连字符是否是第一个或者最后一个字符

结合上面所以的判断条件,我们只要去循环拆分后的单词,就能够得出满足条件的单词个数,这里我用了一点小正则:

var countValidWords = function (sentence) {
  const wordArr = sentence.trim().split(/\s+/g);
  let ans = 0;
  for (const word of wordArr) {
    if (isValid(word)) {
      ans++
    }
  }
  return ans;
};
function isValid(word) {
  const symbol = ["!", ".", ","];
  // 记录标点符号
  let symbolNum = 0;
  // 连字符
  let linkWord = 0;

  for (let i = 0, len = word.length; i < len; i++) {
    // 含有数字,直接退出
    if (regular.num.test(word[i])) {
      return false;
    }

    // 至多一个标点符号
    if (symbol.indexOf(word[i]) != -1) {
      ++symbolNum;
      if (i != len - 1 || symbolNum > 1) {
        // 不是最后一个,标点符号大于1,则退出
        return false;
      }
    }

    // 连字符 旁边需要存在小写字母
    if (word[i] == "-") {
      // 前后不存在
      if (word[i - 1] == undefined || word[i + 1] == undefined) {
        return false;
      }
      // a: 97   z: 122
      if (!regular.small.test(word[i - 1])) {
        return false;
      }
      if (!regular.small.test(word[i + 1])) {
        return false;
      }
      linkWord++;
      if (linkWord > 1) {
        // 至多一个连字符
        return false;
      }
    }
  }
  return true;
}
const regular = {
  small: /[a-z]/,
  num: /[0-9]/,
};

image.png

膜拜大佬纯正则一行写法

这段代码只是膜拜一下,对于我这种完全不会正则的渣渣来说,完全不理解这种正则一行解法:

var countValidWords = function (sentence) {
    return sentence.split(' ').filter(w => /^([,.!]|[a-z]+(-[a-z]+)?[,.!]?)$/.test(w)).length;
};

作者:jie-ma
链接:leetcode-cn.com/problems/nu…