[路飞]_leetcode 2047. 句子中的有效单词数

191 阅读2分钟

「这是我参与2022首次更文挑战的第14,活动详情查看:2022首次更文挑战

2047. 句子中的有效单词数

句子仅由小写字母('a' 到 'z')、数字('0' 到 '9')、连字符('-')、标点符号('!'、'.' 和 ',')以及空格(' ')组成。每个句子可以根据空格分解成 一个或者多个 token ,这些 token 之间由一个或者多个空格 ' ' 分隔。

如果一个 token 同时满足下述条件,则认为这个 token 是一个有效单词:
仅由小写字母、连字符和/或标点(不含数字)。
至多一个 连字符 '-' 。如果存在,连字符两侧应当都存在小写字母("a-b" 是一个有效单词,但 "-ab" 和 "ab-" 不是有效单词)。
至多一个 标点符号。如果存在,标点符号应当位于 token 的 末尾 。

这里给出几个有效单词的例子:"a-b."、"afad"、"ba-c"、"a!" 和 "!" 。

给你一个字符串 sentence ,请你找出并返回 sentence 中 有效单词的数目 。

 

示例 1:

输入:sentence = "cat and dog" 输出:3 解释:句子中的有效单词是 "cat"、"and" 和 "dog"

示例 2:

输入:sentence = "!this 1-s b8d!" 输出:0 解释:句子中没有有效单词 "!this" 不是有效单词,因为它以一个标点开头 "1-s" 和 "b8d" 也不是有效单词,因为它们都包含数字

示例 3:

输入:sentence = "alice and bob are playing stone-game10" 输出:5 解释:句子中的有效单词是 "alice"、"and"、"bob"、"are" 和 "playing" "stone-game10" 不是有效单词,因为它含有数字

示例 4:

输入:sentence = "he bought 2 pencils, 3 erasers, and 1 pencil-sharpener." 输出:6 解释:句子中的有效单词是 "he"、"bought"、"pencils,"、"erasers,"、"and" 和 "pencil-sharpener."  

提示:

1 <= sentence.length <= 1000 sentence 由小写英文字母、数字(0-9)、以及字符(' '、'-'、'!'、'.' 和 ',')组成 句子中至少有 1 个 token

分析

通过题意中的 "a-b."、"afad"、"ba-c"、"a!" 和 "!",我们可以归纳出以下三种种情况:

  • 只有一个标点符号('!'、'.' 和 ',')

  • 字母+最多一个标点符号('!'、'.' 和 ',')

  • 字母+'-'+字母+最多一个标点符号('!'、'.' 和 ',')

我们将上述三种情况转换成正则表达式:

  • 只有一个标点符号('!'、'.' 和 ',')
^[,.!]$
  • 字母+最多一个标点符号('!'、'.' 和 ',')
^[a-z]{1,}[,.!]{0,1}$
  • 字母+'-'+字母+最多一个标点符号('!'、'.' 和 ',')
^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/

当然目前的正则表达式比较臃肿可以对齐进行优化的,此处我们就用最简单的形式吧。

我们可以通过 | 将三种情况并成一条正则表达式

/^[,.!]$|^[a-z]{1,}[,.!]{0,1}$|^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/

我们将字符串sentence通过split(' ')转换成数组,然后再使用filter筛选出符合规则的元素。

逐步实现

首先将字符串使用split方法以' '为条件进行分割转换成数组

let arr = sentence.split(' ')

结合分析实现正则表达式


/^[,.!]$|^[a-z]{1,}[,.!]{0,1}$|^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/

使用filter方法将符合正则表达式的数据筛选出来

arr.filter(word => {
       return /^[,.!]$|^[a-z]{1,}[,.!]{0,1}$|^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/.test(word)
)}

完整代码实现


/**
 * @param {string} sentence
 * @return {number}
 */
var countValidWords = function(sentence) {
    let arr = sentence.split(' ')
    return arr.filter(word => {
       // ^[,.!]$ 仅有一个标点符号 !
       // ^[a-z]{1,}[,.!]{0,1}$ 字母+有无标点符号 aaa!
       // ^[a-z]{1,}-{0,1}[a-z]{1,}[,.!] 字母-字母+有无标点符号  aaa-bbb!
       return /^[,.!]$|^[a-z]{1,}[,.!]{0,1}$|^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/.test(word)
    }).length;
};