「这是我参与2022首次更文挑战的第5天,活动详情查看:2022首次更文挑战」
前言
今天虽然是一道简单题,但是题目的复杂程度不亚于中等题,或许题目能用最基本的语法判断写出来,但是要耗费的时间也是十分久的,非常能锻炼做题时对于细节的把握程度
每日一题
今天的每日一题为 2047. 句子中的有效单词数,难度为简单
-
句子仅由小写字母('a' 到 'z')、数字('0' 到 '9')、连字符('-')、标点符号('!'、'.' 和 ',')以及空格(' ')组成。每个句子可以根据空格分解成 一个或者多个 token ,这些 token 之间由一个或者多个空格 ' ' 分隔。
-
如果一个 token 同时满足下述条件,则认为这个 token 是一个有效单词:
-
仅由小写字母、连字符和/或标点(不含数字)。
-
至多一个 连字符 '-' 。如果存在,连字符两侧应当都存在小写字母("a-b" 是一个有效单词,但 "-ab" 和 "ab-" 不是有效单词)。
-
至多一个 标点符号。如果存在,标点符号应当位于 token 的 末尾 。
-
这里给出几个有效单词的例子:"a-b."、"afad"、"ba-c"、"a!" 和 "!" 。
-
给你一个字符串 sentence ,请你找出并返回 sentence 中 有效单词的数目 。
示例 1:
输入:sentence = "cat and dog"
输出:3
解释:句子中的有效单词是 "cat"、"and" 和 "dog"
示例 2:
输入:sentence = "!this 1-s b8d!"
输出:0
解释:句子中没有有效单词
"!this" 不是有效单词,因为它以一个标点开头
"1-s" 和 "b8d" 也不是有效单词,因为它们都包含数字
示例 3:
输入:sentence = "alice and bob are playing stone-game10"
输出:5
解释:句子中的有效单词是 "alice"、"and"、"bob"、"are" 和 "playing"
"stone-game10" 不是有效单词,因为它含有数字
示例 4:
输入:sentence = "he bought 2 pencils, 3 erasers, and 1 pencil-sharpener."
输出:6
解释:句子中的有效单词是 "he"、"bought"、"pencils,"、"erasers,"、"and" 和 "pencil-sharpener."
提示:
- 1 <= sentence.length <= 1000
- sentence 由小写英文字母、数字(0-9)、以及字符(' '、'-'、'!'、'.' 和 ',')组成
- 句子中至少有 1 个 token
题解
暴力解法
这道题最暴力的解法就是一步步去判断,一有不满足的条件就退出,满足就加一,虽然说判断都不难,但是这个工作量对于算法比较弱的来说有点大。然后我们来一个个分析题目的要求:
- 字符串中含有多个单词token,我们可以先用空格作为分隔符分隔出一个个小字符串,然后可以在写一个验证方法,将一个个字符串传入并且拆成一个个字符循环,这样比较方便之后的不符合条件直接退出函数。
- 首先每次循环第一先判断是否为数字,是的话直接退出
- 然后题目要求每个单词只能有一个标点符号,并且有的话一定要在最后面,那么就先去判断是否为标点符号,因为题目的标点符号只有三个,所以我们可以写一个数组作为保存,判断是否为标点符号就只需要用indexOf即可,是标点符号再去判断当前的位数是否是最后一位
- 最后就是连字符的情况,连字符最多出现一次,就需要一个标记来纪录连字符出现的次数,超过一次就退出,然后连字符前面和后面一定都要是小写字母,并且还要注意数组溢出的问题,要判断连字符是否是第一个或者最后一个字符
结合上面所以的判断条件,我们只要去循环拆分后的单词,就能够得出满足条件的单词个数,这里我用了一点小正则:
var countValidWords = function (sentence) {
const wordArr = sentence.trim().split(/\s+/g);
let ans = 0;
for (const word of wordArr) {
if (isValid(word)) {
ans++
}
}
return ans;
};
function isValid(word) {
const symbol = ["!", ".", ","];
// 记录标点符号
let symbolNum = 0;
// 连字符
let linkWord = 0;
for (let i = 0, len = word.length; i < len; i++) {
// 含有数字,直接退出
if (regular.num.test(word[i])) {
return false;
}
// 至多一个标点符号
if (symbol.indexOf(word[i]) != -1) {
++symbolNum;
if (i != len - 1 || symbolNum > 1) {
// 不是最后一个,标点符号大于1,则退出
return false;
}
}
// 连字符 旁边需要存在小写字母
if (word[i] == "-") {
// 前后不存在
if (word[i - 1] == undefined || word[i + 1] == undefined) {
return false;
}
// a: 97 z: 122
if (!regular.small.test(word[i - 1])) {
return false;
}
if (!regular.small.test(word[i + 1])) {
return false;
}
linkWord++;
if (linkWord > 1) {
// 至多一个连字符
return false;
}
}
}
return true;
}
const regular = {
small: /[a-z]/,
num: /[0-9]/,
};
膜拜大佬纯正则一行写法
这段代码只是膜拜一下,对于我这种完全不会正则的渣渣来说,完全不理解这种正则一行解法:
var countValidWords = function (sentence) {
return sentence.split(' ').filter(w => /^([,.!]|[a-z]+(-[a-z]+)?[,.!]?)$/.test(w)).length;
};
作者:jie-ma
链接:leetcode-cn.com/problems/nu…