数据结构与算法 - 线性结构: 数组与字符串
集合, 列表 和数组
数组的操作
1. 读取元素
我们在读取数组中的元素是通过访问索引的方式来读取的, 索引一般是从0开始的.
在计算机中,内存可以看成一些已经排列好的格子,每个格子对应一个内存地址。一般情况下,数据会分散地存储在不同的格子中。
而对于数组,计算机会在内存中为其申请一段 连续 的空间,并且会记下索引为 0 处的内存地址。以数组["C", "O", "D", "E", "R"]为例,它的各元素对应的索引及内存地址如下图所示。
假如我们想要访问索引为 2 处的元素 "D" 时,计算机会进行以下计算:
- 找到该数组的索引 0 的内存地址: 2008;
- 将内存地址加上索引值,作为目标元素的地址,即 2008 + 2 = 2010,对应的元素为 "D",这时便找到了目标元素。 我们知道,计算内存地址这个过程是很快的,而我们一旦知道了内存地址就可以立即访问到该元素,因此它的时间复杂度是常数级别,为 O(1)。
2. 查找元素
假如我们对数组中包含哪些元素并不了解,只是想知道其中是否含有元素 "E",数组会如何查找元素 "E" 呢?
与读取元素类似,由于我们只保存了索引为 0 处的内存地址,因此在查找元素时,只需从数组开头逐步向后查找就可以了。如果数组中的某个元素为目标元素,则停止查找;否则继续搜索直到到达数组的末尾。
我们发现,最坏情况下,搜索的元素为 "R",或者数组中不包含目标元素时,我们需要查找 n 次,n 为数组的长度,因此查找元素的时间复杂度为 O(N), N.
3. 插入元素
如果我们想在原有的数组中再个元素 "S" 呢 ?
如果要将该元素插入到数组的末尾,只需要一步。即计算机通过数组的长度和位置计算出即将插入元素的内存地址,然后将该元素插入到指定位置即可。
然而,如果要将该元素插入到数组中的其他位置,则会有所区别,这时我们首先需要为该元素所要插入的位置 腾出 空间,然后进行插入操作。比如,我们想要在索引 2 处插入 "S"。
我们发现,如果需要频繁地对数组元素进行插入操作,会造成时间的浪费。事实上,另一种数据结构,即链表可以有效解决这个问题。
4. 删除元素
删除元素与插入元素的操作类似,当我们删除掉数组中的某个元素后,数组中会留下 空缺 的位置,而数组中的元素在内存中是连续的,这就使得后面的元素需对该位置进行 填补 操作。
以删除索引 1 中的元素 "O" 为例,具体过程如图所示。
当数组的长度为 n 时,最坏情况下,我们删除第一个元素,共需要的步骤数为 1 + (n - 1) = n 步,其中,1 为删除操作,n - 1 为移动其余元素的步骤数。删除操作具有线性时间复杂度,即时间复杂度为 O(N),N 为数组的长度。
数组相关的例题
寻找数组的中心索引
给你一个整数数组 nums ,请计算数组的 中心下标 。
数组 中心下标 是数组的一个下标,其左侧所有元素相加的和等于右侧所有元素相加的和。
如果中心下标位于数组最左端,那么左侧数之和视为 0 ,因为在下标的左侧不存在元素。这一点对于中心下标位于数组最右端同样适用。
如果数组有多个中心下标,应该返回 最靠近左边 的那一个。如果数组不存在中心下标,返回 -1 。
示例 1:
输入: nums = [1, 7, 3, 6, 5, 6]
输出:3
解释:
中心下标是 3 。
左侧数之和 sum = nums[0] + nums[1] + nums[2] = 1 + 7 + 3 = 11 ,
右侧数之和 sum = nums[4] + nums[5] = 5 + 6 = 11 ,二者相等。
示例 2:
输入: nums = [1, 2, 3]
输出: -1
解释:
数组中不存在满足此条件的中心下标。
提示:
1 <= nums.length <= 104-1000 <= nums[i] <= 1000
int pivotIndex(int* num, int numsSize){
int lsum = 0;
int rsum = 0;
int i;
for (i = 1; i < numsSize; ++i) {
rsum += num[i];
}
for (i = 1; i < numsSize && lsum != rsum; ++i) {
lsum += num[i - 1];
rsum -= num[i];
}
if (lsum == rsum) {
return i - 1;
}
return -1;
}
搜索插入位置
给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。
请必须使用时间复杂度为 O(log n) 的算法。
int searchInsert(int* nums, int numsSize, int target){
int low = 0, high = numsSize - 1, mid;
while(low <= high){
mid = (low + high) / 2;
if(nums[mid] == target) {
return mid;
} else if(nums[mid] < target) {
low = mid + 1;
} else if(nums[mid] > target) {
high = mid - 1;
}
}
if(nums[mid] < target) {
return mid + 1;
} else if(nums[mid] > target) {
return mid;
}
return -1;
}
二维数组
二维数组是一种结构较为特殊的数组,只是将数组中的每个元素变成了一维数组。
所以二维数组的本质上仍然是一个一维数组,内部的一维数组仍然从索引 0 开始,我们可以将它看作一个矩阵,并处理矩阵的相关问题。
字符串
- 符串的基本操作对象通常是字符串整体或者其子串
- 字符串操作比其他数据类型更复杂(例如比较、连接操作)
字符串相关题目
最长公共前缀
编写一个函数来查找字符串数组中的最长公共前缀。
如果不存在公共前缀,返回空字符串 ""。
示例 1
输入: strs = ["flower","flow","flight"]
输出: "fl"
示例 2
输入: strs = ["dog","racecar","car"]
输出: ""
解释: 输入不存在公共前缀。
#define STR_LEN 200
void getCommonPrefix(char *prefix, char *s)
{
int minLen = strlen(prefix) < strlen(s) ? strlen(prefix) : strlen(s);
int i;
for (i = 0; i < minLen; i++) {
if (prefix[i] != s[i]) {
prefix[i] = '\0';
break;
}
}
// 当prefix比s更长时
prefix[i] = '\0';
}
char * longestCommonPrefix(char ** strs, int strsSize){
char prefix[STR_LEN] = {'\0'};
strncpy(prefix, strs[0], strlen(strs[0]) + 1);
for (int i = 1; i < strsSize; i++) {
getCommonPrefix(prefix, strs[i]);
}
if (strlen(prefix) == 0) {
return "";
}
char *res = (char *)malloc(strlen(prefix) + 1);
int i;
for (i = 0; i < strlen(prefix); i++) {
res[i] = prefix[i];
}
res[i] = '\0';
return res;
}
最长回文字符串
给你一个字符串 s,找到 s 中最长的回文子串。
如果字符串的反序与原始字符串相同,则该字符串称为回文字符串。
示例 1
输入: s = "babad"
输出: "bab"
解释: "aba" 同样是符合题意的答案。
示例 2
输入: s = "cbbd"
输出: "bb"
算法
char * longestPalindrome(char * s){
int* max = (int*) malloc(sizeof(int));
*max = 0;
int* le = (int*) malloc(sizeof(int));
*le = 0;
for(int i = 0; i < strlen(s); i++){
//一个值为中心的情况
extend(s,i,i,le,max);
//两个值为中心的情况
extend(s,i,i+1,le,max);
}
s[*le+*max]='\0';
printf("%d %d",*le,*max);
int* c=(int*)malloc(sizeof(int));
*c=*le;
return s+*c;
}
void extend(char *s, int left, int right, int *le, int *max){
if(left < 0 && right >= strlen(s)) return;
while(left>= 0 && right < strlen(s) && s[left] == s[right]) {
left--;
right++;
}
if((right - left - 1) > (*max)) {
*max = right - left -1;
*le = left + 1;
}
return;
}