2021年4月份 ,NLP算法岗面试题总结

231 阅读3分钟

添加微信:julyedufu77,回复 “ 8 ”,领取最新升级版《名企AI面试100题》电子书!!

面试题

问题 1:怎么处理数据不平衡

问题 2:给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。

问题 3:连续子数组的最大乘积

问题 4:最大子数组

问题 5:一个硬币正面概率p 那么抛到第几次抛正面期望

题目解析

问题1:怎么处理数据不平衡

常用于解决数据不平衡的方法:

欠采样:从样本较多的类中再抽取,仅保留这些样本点的一部分;

过采样:复制少数类中的一些点,以增加其基数;

生成合成数据:从少数类创建新的合成点,以增加其基数。

添加额外特征:除了重采样外,我们还可以在数据集中添加一个或多个其他特征,使数据集更加丰富,这样我们可能获得更好的准确率结果。

问题2:给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。

leetcode-cn.com/problems/re…

定义两个节点cur=None和pre=head

image.png

改变节点方向让pre的next指向cur,实现一次局部反转

image.png

cur和pre向前移动一个位置

image.png

循环交换前进,直至pre为空,遍历结束,完成反转,此时cur节点为开始节head;

image.png 参考代码:

image.png

问题3:连续子数组的最大乘积

leetcode-cn.com/problems/ma…

思路:

遍历数组时计算当前最大值、最小值,不断更新

当前最大值为 ans_max = max(ans_max * nums[i], nums[i])

当前最小值为 ans_min = min(ans_min * nums[i], nums[i])

由于存在负数,那么会导致最大的变最小的,最小的变最大的。

当前最大值为 ans_max = max(ans_min * nums[i], nums[i])

当前最小值为 ans_min = min(ans_max * nums[i], nums[i])

参考代码:

image.png

问题4:最大子数组

leetcode-cn.com/problems/ma…

解题思路:

遍历数组,遍历的时候记录两个值:当前子数组的和 tmpSum,最大值res

image.png

问题5:一个硬币正面概率p 那么抛到第几次抛正面期望

硬币游戏,如果在连续抛出三次正面之前不要停下来,那么我们总计抛硬币的期望次数是多少

假设期望是x

假设第一抛是反面,那么就浪费了一步,平均一共需要x+1步(概率是1/2)

假设第一抛是正面,在此基础上如果第二抛是反面,又浪费了,平均一共需要x+2步 (概率是1/4)

在此基础上如果第二抛是正面

假设第三抛反面,浪费,平均一共x+3步(概率是1/8)

假设第三抛正面,完成,只用了3步(概率是1/8)

所以x的期望即x=(1/2)(x+1)+(1/4)(x+2)+(1/8)(x+3)+(1/8)*3

解得x=14

添加微信:julyedufu77,回复 “ 8 ”,领取最新升级版《名企AI面试100题》电子书!!