数据结构与算法 - 线性结构: 数组与字符串

221 阅读5分钟

数据结构与算法 - 线性结构: 数组与字符串

集合, 列表 和数组

image.png

数组的操作

image.png

1. 读取元素

我们在读取数组中的元素是通过访问索引的方式来读取的, 索引一般是从0开始的.

在计算机中,内存可以看成一些已经排列好的格子,每个格子对应一个内存地址。一般情况下,数据会分散地存储在不同的格子中。

image.png

而对于数组,计算机会在内存中为其申请一段 连续 的空间,并且会记下索引为 0 处的内存地址。以数组["C", "O", "D", "E", "R"]为例,它的各元素对应的索引及内存地址如下图所示。

image.png

假如我们想要访问索引为 2 处的元素 "D" 时,计算机会进行以下计算:

  • 找到该数组的索引 0 的内存地址: 2008;
  • 将内存地址加上索引值,作为目标元素的地址,即 2008 + 2 = 2010,对应的元素为 "D",这时便找到了目标元素。 我们知道,计算内存地址这个过程是很快的,而我们一旦知道了内存地址就可以立即访问到该元素,因此它的时间复杂度是常数级别,为 O(1)。

2. 查找元素

假如我们对数组中包含哪些元素并不了解,只是想知道其中是否含有元素 "E",数组会如何查找元素 "E" 呢?

与读取元素类似,由于我们只保存了索引为 0 处的内存地址,因此在查找元素时,只需从数组开头逐步向后查找就可以了。如果数组中的某个元素为目标元素,则停止查找;否则继续搜索直到到达数组的末尾。

image.png 我们发现,最坏情况下,搜索的元素为 "R",或者数组中不包含目标元素时,我们需要查找 n 次,n 为数组的长度,因此查找元素的时间复杂度为 O(N), N.

3. 插入元素

如果我们想在原有的数组中再个元素 "S" 呢 ?

如果要将该元素插入到数组的末尾,只需要一步。即计算机通过数组的长度和位置计算出即将插入元素的内存地址,然后将该元素插入到指定位置即可。 image.png 然而,如果要将该元素插入到数组中的其他位置,则会有所区别,这时我们首先需要为该元素所要插入的位置 腾出 空间,然后进行插入操作。比如,我们想要在索引 2 处插入 "S"。 image.png 我们发现,如果需要频繁地对数组元素进行插入操作,会造成时间的浪费。事实上,另一种数据结构,即链表可以有效解决这个问题。

4. 删除元素

删除元素与插入元素的操作类似,当我们删除掉数组中的某个元素后,数组中会留下 空缺 的位置,而数组中的元素在内存中是连续的,这就使得后面的元素需对该位置进行 填补 操作。

以删除索引 1 中的元素 "O" 为例,具体过程如图所示。

image.png

当数组的长度为 n 时,最坏情况下,我们删除第一个元素,共需要的步骤数为 1 + (n - 1) = n 步,其中,1 为删除操作,n - 1 为移动其余元素的步骤数。删除操作具有线性时间复杂度,即时间复杂度为 O(N),N 为数组的长度。

数组相关的例题

寻找数组的中心索引

给你一个整数数组 nums ,请计算数组的 中心下标 。

数组 中心下标 是数组的一个下标,其左侧所有元素相加的和等于右侧所有元素相加的和。

如果中心下标位于数组最左端,那么左侧数之和视为 0 ,因为在下标的左侧不存在元素。这一点对于中心下标位于数组最右端同样适用。

如果数组有多个中心下标,应该返回 最靠近左边 的那一个。如果数组不存在中心下标,返回 -1 。

示例 1:

输入: nums = [1, 7, 3, 6, 5, 6]
输出:3
解释:
中心下标是 3 。
左侧数之和 sum = nums[0] + nums[1] + nums[2] = 1 + 7 + 3 = 11 ,
右侧数之和 sum = nums[4] + nums[5] = 5 + 6 = 11 ,二者相等。

示例 2:

输入: nums = [1, 2, 3]
输出: -1
解释:
数组中不存在满足此条件的中心下标。

提示:

  • 1 <= nums.length <= 104
  • -1000 <= nums[i] <= 1000
int pivotIndex(int* num, int numsSize){
    int lsum = 0;
    int rsum = 0;
    int i;
    for (i = 1; i < numsSize; ++i) {
        rsum += num[i];
    }
    
    for (i = 1; i < numsSize && lsum != rsum; ++i) {
        lsum += num[i - 1];
        rsum -= num[i];
    }
    if (lsum == rsum) {
        return i - 1;
    }
    return -1;
}

搜索插入位置

给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。

请必须使用时间复杂度为 O(log n) 的算法。

int searchInsert(int* nums, int numsSize, int target){
    int low = 0, high = numsSize - 1, mid;
    while(low <= high){
        mid = (low + high) / 2;
        if(nums[mid] == target) {
            return mid;
        } else if(nums[mid] < target) {
            low = mid + 1;
        } else if(nums[mid] > target) {
            high = mid - 1;
        }
    }
    if(nums[mid] < target) {
        return mid + 1;
    } else if(nums[mid] > target) {
        return mid;
    }
    return -1;
}

二维数组

二维数组是一种结构较为特殊的数组,只是将数组中的每个元素变成了一维数组。

image.png

所以二维数组的本质上仍然是一个一维数组,内部的一维数组仍然从索引 0 开始,我们可以将它看作一个矩阵,并处理矩阵的相关问题。

字符串

  1. 符串的基本操作对象通常是字符串整体或者其子串
  2. 字符串操作比其他数据类型更复杂(例如比较、连接操作)

字符串相关题目

最长公共前缀

编写一个函数来查找字符串数组中的最长公共前缀。

如果不存在公共前缀,返回空字符串 ""

示例 1

输入: strs = ["flower","flow","flight"]
输出: "fl"

示例 2

输入: strs = ["dog","racecar","car"]
输出: ""
解释: 输入不存在公共前缀。
#define STR_LEN 200

void getCommonPrefix(char *prefix, char *s)
{
    int minLen = strlen(prefix) < strlen(s) ? strlen(prefix) : strlen(s);
    int i;
    for (i = 0; i < minLen; i++) {
        if (prefix[i] != s[i]) {
            prefix[i] = '\0';
            break;
        }
    }
    // 当prefix比s更长时
    prefix[i] = '\0';
}

char * longestCommonPrefix(char ** strs, int strsSize){

    char prefix[STR_LEN] = {'\0'};

    strncpy(prefix, strs[0], strlen(strs[0]) + 1);

    for (int i = 1; i < strsSize; i++) {
        getCommonPrefix(prefix, strs[i]);
    }
    
    if (strlen(prefix) == 0) {
        return "";
    }

    char *res = (char *)malloc(strlen(prefix) + 1);

    int i;
    for (i = 0; i < strlen(prefix); i++) {
        res[i] = prefix[i];
    }
    res[i] = '\0';

    return res;
}

最长回文字符串

给你一个字符串 s,找到 s 中最长的回文子串。

如果字符串的反序与原始字符串相同,则该字符串称为回文字符串。

示例 1

输入: s = "babad"
输出: "bab"
解释: "aba" 同样是符合题意的答案。

示例 2

输入: s = "cbbd"
输出: "bb"

算法

char * longestPalindrome(char * s){
    int* max = (int*) malloc(sizeof(int));
    *max = 0;
    int* le = (int*) malloc(sizeof(int));
    *le = 0;

    for(int i = 0; i < strlen(s); i++){
        //一个值为中心的情况
        extend(s,i,i,le,max);
        //两个值为中心的情况
        extend(s,i,i+1,le,max);
    }
    s[*le+*max]='\0';
    printf("%d %d",*le,*max);
    int* c=(int*)malloc(sizeof(int));
    *c=*le;
    return s+*c;
}

void extend(char *s, int left, int right, int *le, int *max){
    if(left < 0 && right >= strlen(s)) return;
    while(left>= 0 && right < strlen(s) && s[left] == s[right]) {
        left--;
        right++;
    }

    if((right - left - 1) > (*max)) {
        *max = right - left -1;
        *le = left + 1;
    }
    return;
}