接着拿出第二个正则面试题: 有一个str = """/\sd中@国%¥测试……&*结哈、‘、‘’’哈国际SJGKLJGJ化可脚后跟""" 只保留里面的(汉字和字母还有数字),其他的字符都去掉.这个应该怎么弄? 函数体def format_content(content): 返回处理后的字符串
解答: import re
def format_content(str): list1 = []
for i in str: if re.match("[a-zA-Z0-9]", i): list1.append(i) res = ''.join(list1) print(res)
format_content('][.,ha12ahaha[]/.,') |
|