「这是我参与2022首次更文挑战的第14,活动详情查看:2022首次更文挑战」
2047. 句子中的有效单词数
句子仅由小写字母('a' 到 'z')、数字('0' 到 '9')、连字符('-')、标点符号('!'、'.' 和 ',')以及空格(' ')组成。每个句子可以根据空格分解成 一个或者多个 token ,这些 token 之间由一个或者多个空格 ' ' 分隔。
如果一个 token 同时满足下述条件,则认为这个 token 是一个有效单词:
仅由小写字母、连字符和/或标点(不含数字)。
至多一个 连字符 '-' 。如果存在,连字符两侧应当都存在小写字母("a-b" 是一个有效单词,但 "-ab" 和 "ab-" 不是有效单词)。
至多一个 标点符号。如果存在,标点符号应当位于 token 的 末尾 。
这里给出几个有效单词的例子:"a-b."、"afad"、"ba-c"、"a!" 和 "!" 。
给你一个字符串 sentence ,请你找出并返回 sentence 中 有效单词的数目 。
示例 1:
输入:sentence = "cat and dog" 输出:3 解释:句子中的有效单词是 "cat"、"and" 和 "dog"
示例 2:
输入:sentence = "!this 1-s b8d!" 输出:0 解释:句子中没有有效单词 "!this" 不是有效单词,因为它以一个标点开头 "1-s" 和 "b8d" 也不是有效单词,因为它们都包含数字
示例 3:
输入:sentence = "alice and bob are playing stone-game10" 输出:5 解释:句子中的有效单词是 "alice"、"and"、"bob"、"are" 和 "playing" "stone-game10" 不是有效单词,因为它含有数字
示例 4:
输入:sentence = "he bought 2 pencils, 3 erasers, and 1 pencil-sharpener." 输出:6 解释:句子中的有效单词是 "he"、"bought"、"pencils,"、"erasers,"、"and" 和 "pencil-sharpener."
提示:
1 <= sentence.length <= 1000 sentence 由小写英文字母、数字(0-9)、以及字符(' '、'-'、'!'、'.' 和 ',')组成 句子中至少有 1 个 token
分析
通过题意中的 "a-b."、"afad"、"ba-c"、"a!" 和 "!",我们可以归纳出以下三种种情况:
-
只有一个标点符号('!'、'.' 和 ',')
-
字母+最多一个标点符号('!'、'.' 和 ',')
-
字母+'-'+字母+最多一个标点符号('!'、'.' 和 ',')
我们将上述三种情况转换成正则表达式:
- 只有一个标点符号('!'、'.' 和 ',')
^[,.!]$
- 字母+最多一个标点符号('!'、'.' 和 ',')
^[a-z]{1,}[,.!]{0,1}$
- 字母+'-'+字母+最多一个标点符号('!'、'.' 和 ',')
^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/
当然目前的正则表达式比较臃肿可以对齐进行优化的,此处我们就用最简单的形式吧。
我们可以通过 | 将三种情况并成一条正则表达式
/^[,.!]$|^[a-z]{1,}[,.!]{0,1}$|^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/
我们将字符串sentence通过split(' ')转换成数组,然后再使用filter筛选出符合规则的元素。
逐步实现
首先将字符串使用split方法以' '为条件进行分割转换成数组
let arr = sentence.split(' ')
结合分析实现正则表达式
/^[,.!]$|^[a-z]{1,}[,.!]{0,1}$|^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/
使用filter方法将符合正则表达式的数据筛选出来
arr.filter(word => {
return /^[,.!]$|^[a-z]{1,}[,.!]{0,1}$|^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/.test(word)
)}
完整代码实现
/**
* @param {string} sentence
* @return {number}
*/
var countValidWords = function(sentence) {
let arr = sentence.split(' ')
return arr.filter(word => {
// ^[,.!]$ 仅有一个标点符号 !
// ^[a-z]{1,}[,.!]{0,1}$ 字母+有无标点符号 aaa!
// ^[a-z]{1,}-{0,1}[a-z]{1,}[,.!] 字母-字母+有无标点符号 aaa-bbb!
return /^[,.!]$|^[a-z]{1,}[,.!]{0,1}$|^[a-z]{1,}-{0,1}[a-z]{1,}[,.!]{0,1}$/.test(word)
}).length;
};