169. Majority Element
这是Leetcode面试榜单Top150第5题,难度系数为容易。数据的存储结构为数组:原题传送门。
给定整数数组长度为n,数组中某一个数字重复出现不下n/2次,要求找到并返回这个数字。例如数组[3,2,3]应该返回3,数组[2,2,1,1,1,2,2]应该返回2. 题目明确保证输入数组一定包含有这样重复出现超过半数的数字,数组的长度范围为[1, 500000]之间,其中每个元素取值范围在正负10的9次方之间(很大的整数区间)。
自我感觉理解了题意之后,着手搞解法,题目很简单,会数数的孩子应该都可以有办法解决,沿着数组从左到右挨个数那个数字在数组中出现的次数,一旦不少于数组长度的一半就找到了。(当时脑子里冒出一个小学生的疑问,有没有可能有多个这样的数?)由于程序员的清高,自觉也学过点算法基础和数据结构皮毛,自然不屑于写这样的解法代码(无论Leetcode是否Accept),然后一下子自己有没有思路怎么搞,便随便上网捞到一篇文章的思路:从左到右遍历数组元素,用一个变量key记录一下数组中元素的值,count记录该值的计数,key和count在遍历过程中遵循的规则是当遍历的元素值key相等时count加1,不等时count减1(如果count已经是0时,key取正在遍历的元素nums[i],count为1)。这个方法非常简练,原理就是反正总有一个数出现次数不低于半数,因此数组中各个元素互相PK掉之后,key保存的便是那个超过半数的数值。算法时间复杂度O(n) - 从头到尾一次遍历即可,空间复杂度O(1) - 使用两个额外变量保存key和count。代码如下:
class Solution {
public int majorityElement(int[] nums) {
int count = 0;
Integer candidate = null;
for (int num : nums) {
if (count == 0) {
candidate = num;
}
count += (num == candidate) ? 1 : -1;
}
return candidate;
}
}
后来,搞个付费账号看官方解法列表,除了开始想到的O(n^2)时间复杂度O(1)空间复杂度的解法,和这种O(n)O(1)的称为Boyer-Moore投票算法之外,还有5种其他方法,得!城里人真会玩。
用空间换时间,暴力数数的解法可以简单优化,使用哈希表(字典)这种数据结构来辅助计数,得到时间和空间复杂度都是O(n)的解法。
class Solution {
private Map<Integer, Integer> countNums(int[] nums) {
Map<Integer, Integer> counts = new HashMap<Integer, Integer>();
for (int num : nums) {
if (!counts.containsKey(num)) {
counts.put(num, 1);
}
else {
counts.put(num, counts.get(num)+1);
}
}
return counts;
}
public int majorityElement(int[] nums) {
Map<Integer, Integer> counts = countNums(nums);
Map.Entry<Integer, Integer> majorityEntry = null;
for (Map.Entry<Integer, Integer> entry : counts.entrySet()) {
if (majorityEntry == null || entry.getValue() > majorityEntry.getValue()) {
majorityEntry = entry;
}
}
return majorityEntry.getKey();
}
}
利用目标元素值出现个数过半的特点,结合对应的元素分布特征,如果这些数字有序排列的话,第n/2个位置的数值等于这个数(如果数组长度是偶数的话,n/2 - 1位置也是)。所以可以先排序,然后返回n/2位置数值。排序算法的时间空间复杂度就是这个算法复杂度,比如快速排序的话,O(N.logN)时间复杂度和O(n)或者O(1)的空间复杂度取决于排序算法的库实现。
class Solution {
public int majorityElement(int[] nums) {
Arrays.sort(nums);
return nums[nums.length/2];
}
}
此外,位操作法O(n.logC)和可能有无穷大的时间复杂度的随机化方法空间复杂度都为O(1),暂时不想细细研究了。感兴趣的可以搜搜网上文章,或者搞个会员琢磨琢磨。
class Solution {
public int majorityElement(int[] nums) {
int n = nums.length;
int majority_element = 0;
for (int i = 0; i < 32; i++) {
int bit = 1 << i;
// Count how many numbers have this bit set.
int bit_count = 0;
for (int num : nums) {
if ((num & bit) != 0) {
bit_count++;
}
}
// If this bit is present in more than n / 2 elements
// then it must be set in the majority element.
if (bit_count > n / 2) {
majority_element |= bit;
}
}
return majority_element;
}
}
class Solution {
private int randRange(Random rand, int min, int max) {
return rand.nextInt(max - min) + min;
}
private int countOccurences(int[] nums, int num) {
int count = 0;
for (int i = 0; i < nums.length; i++) {
if (nums[i] == num) {
count++;
}
}
return count;
}
public int majorityElement(int[] nums) {
Random rand = new Random();
int majorityCount = nums.length/2;
while (true) {
int candidate = nums[randRange(rand, 0, nums.length)];
if (countOccurences(nums, candidate) > majorityCount) {
return candidate;
}
}
}
}
还有使用经典算法范式之一,分治法,来解的。算法时间复杂度O(N.lgN),空间复杂度O(lgN).
class Solution {
private int countInRange(int[] nums, int num, int lo, int hi) {
int count = 0;
for (int i = lo; i <= hi; i++) {
if (nums[i] == num) {
count++;
}
}
return count;
}
private int majorityElementRec(int[] nums, int lo, int hi) {
// base case; the only element in an array of size 1 is the majority
// element.
if (lo == hi) {
return nums[lo];
}
// recurse on left and right halves of this slice.
int mid = (hi-lo)/2 + lo;
int left = majorityElementRec(nums, lo, mid);
int right = majorityElementRec(nums, mid+1, hi);
// if the two halves agree on the majority element, return it.
if (left == right) {
return left;
}
// otherwise, count each element and return the "winner".
int leftCount = countInRange(nums, left, lo, hi);
int rightCount = countInRange(nums, right, lo, hi);
return leftCount > rightCount ? left : right;
}
public int majorityElement(int[] nums) {
return majorityElementRec(nums, 0, nums.length-1);
}
}
学也无涯,知也无涯。 啊~