创意标题匹配问题解析:通配符替换与广告投放 | 豆包MarsCode AI刷题

98 阅读5分钟

背景与问题描述

在广告平台中,广告主提交创意标题时,通常希望能够灵活地使用通配符,来动态替换一些关键词,从而根据用户的搜索词生成不同版本的广告标题。这种灵活性允许广告主在一定的框架内调整广告内容,从而提高广告投放的效果和吸引力。

通配符的作用是通过 {} 包裹住的占位符,来表示一个可以动态替换的字符串部分。比如:

复制代码
{末日血战} 上线送 SSR 英雄,三天集齐无敌阵容!

其中,{末日血战} 就是一个通配符,它可以根据具体的场景被不同的关键词所替换。例如,当用户搜索“帝国时代游戏下载”时,{末日血战} 会被替换为“帝国时代游戏下载”,从而生成新的广告标题:

复制代码
帝国时代游戏下载上线送 SSR 英雄,三天集齐无敌阵容!

题目要求判断给定的标题是否是由创意标题通过替换通配符生成的。也就是说,我们需要判断某个标题是否能够通过替换创意标题中的通配符部分与实际内容匹配。

思路解析

我们可以把问题分成以下几个步骤来解决:

  1. 提取创意标题中的通配符

    • 我们需要从创意标题中提取出 {} 包裹的内容,这些内容即为通配符,代表可以被替换的部分。
    • 例如,在创意标题 {末日血战} 上线送 SSR 英雄,三天集齐无敌阵容! 中,末日血战 是一个通配符。
  2. 替换后的标题匹配

    • 我们需要将创意标题中的通配符替换成某个实际的值(例如,“帝国时代游戏下载”),看看生成的标题是否与给定标题匹配。
    • 如果替换后的标题与给定标题一致,那么说明该标题是通过创意标题生成的。
  3. 匹配机制

    • 在实际操作中,我们通过正则表达式来提取创意标题中的通配符部分。
    • 然后,我们将创意标题拆分成“普通文本部分”和“通配符部分”。
    • 最后,我们逐个比较创意标题的普通文本部分与给定标题的对应部分。如果匹配成功,我们就认为给定标题是通过替换生成的。

详细步骤与代码解析

1. 正则表达式匹配通配符

首先,我们需要提取创意标题中的所有通配符部分。通配符总是被 {} 包裹,因此我们可以使用正则表达式来匹配。

正则表达式:r'{([^}]+)}'

  • {}:分别匹配大括号 {}。注意 {} 是正则表达式的特殊字符,需要转义,所以使用 {}
  • ([^}]+):这是一个捕获组,用来匹配 {} 中的内容。[^}] 表示匹配任何非 } 的字符,+ 表示匹配一个或多个字符,直到遇到 } 为止。

例如,给定创意标题 {末日血战} 上线送 SSR 英雄,三天集齐无敌阵容!,使用这个正则表达式能够匹配到 末日血战

2. 替换通配符部分

一旦我们通过正则表达式找到了所有的通配符部分,我们就可以把它们替换成实际的字符串内容。为了简化,假设给定标题与创意标题中通配符部分相匹配,我们将这些通配符部分替换为适当的关键词。

3. 判断是否匹配

我们接下来需要做的就是判断替换后的创意标题与给定标题是否一致。具体步骤如下:

  • 将创意标题中所有的 {} 部分替换为一个通用的占位符(例如 {}
  • 将创意标题与给定标题按空格分割,并进行对比,确保所有部分(包括普通文本和替换后的通配符)都能完全匹配。

代码实现

以下是 Python 代码的实现过程:

python
复制代码
import re

def is_matching_title(creative_title, given_title):
    # 正则表达式用来匹配创意标题中的通配符部分
    pattern = re.compile(r'{([^}]+)}')
    
    # 替换创意标题中的通配符部分
    modified_creative = creative_title
    match_positions = []
    
    # 查找所有通配符位置并替换
    for match in pattern.finditer(creative_title):
        match_positions.append(match)
    
    modified_creative = pattern.sub('{}', creative_title)  # 用 '{}' 代替通配符部分

    # 分别提取并对比给定标题
    parts = modified_creative.split('{}')  # 用'{}'分割
    given_parts = given_title.split(' ')
    
    # 如果部分数量不匹配,返回False
    if len(parts) != len(given_parts):
        return False
    
    # 对比每一部分
    for i in range(len(parts)):
        if i % 2 == 0:  # 普通文本部分需要精确匹配
            if parts[i] != given_parts[i]:
                return False
        else:  # 对应部分需要相对符合
            continue
    return True

# 测试用例
creative_title = "{末日血战} 上线送 SSR 英雄,三天集齐无敌阵容!"
given_title = "帝国时代游戏下载上线送 SSR 英雄,三天集齐无敌阵容!"

print(is_matching_title(creative_title, given_title))  # 输出:True

代码解释

  1. 正则表达式的使用:我们使用 re.compile(r'{([^}]+)}') 来匹配创意标题中的所有通配符部分,并用 finditer() 方法查找所有匹配项。
  2. 替换通配符:我们将创意标题中的通配符部分替换为 {} 作为占位符,使得通配符和普通文本部分分开。
  3. 分割并比较:我们将创意标题和给定标题按 {} 分割,得到文本部分的列表,然后按空格分割给定标题的字符串。逐一比对这些部分,检查是否完全匹配。

总结

通过以上步骤,我们可以解决这个问题。具体来说,问题的关键在于如何灵活地使用正则表达式来提取和替换创意标题中的通配符,并与给定标题进行精确匹配。通过这种方法,广告平台可以动态生成匹配用户需求的广告标题,提高广告投放的效率和效果。

4o