数据库的认识 | 青训营笔记

117 阅读4分钟

数据库的认识 | 青训营笔记

数据的全生命周期

数据在现代社会中起到至关重要的作用。了解数据的生命周期可以帮助我们更好地理解数据的产生、流动和持久化过程。

  1. 数据产生:数据可以通过多种方式产生,如传感器、用户输入、网络爬虫等。重要的是要了解数据的来源和产生方式,以便正确处理和管理数据。
  2. 数据流动:一旦数据产生,它需要通过各种渠道进行传输和流动。数据的流动可以包括内部流动(例如不同系统之间的数据传输)和外部流动(例如数据共享、数据交换等)。在数据流动的过程中,我们需要考虑数据的安全性、可靠性和效率。
  3. 数据持久化:数据的持久化是指将数据存储在持久化介质(如硬盘、数据库等)中,以便长期保存和访问。数据的持久化可以通过备份、冗余存储和灾备等方式来实现,以确保数据的安全性和可靠性。

数据库和存储系统背景知识

image-20230517004634943

数据库和存储系统是数据管理和存储的关键组成部分。它们有各自的特点和功能。

  1. 数据库:数据库是一个结构化数据集合,可以通过数据库管理系统(DBMS)进行访问和管理。数据库可以提供数据的持久化存储、高效的数据查询和修改等功能。常见的数据库类型包括关系型数据库、非关系型数据库和面向对象数据库。
  2. 存储系统:存储系统是用于存储和访问数据的硬件和软件组合。存储系统的主要功能是提供高速、可靠的数据存储和检索。存储系统的特点包括容量、速度、可扩展性和可靠性等。

image-20230517004659735

主流的存储&数据库

主流的存储和数据库系统具有不同的架构和特点。以下是一些经典的产品和其架构剖析。

  1. 关系型数据库(例如MySQL):关系型数据库采用表格结构来组织数据,使用SQL语言进行数据查询和操作。它们具有数据一致性和事务支持的特点,适用于结构化数据的存储和管理。
  2. 非关系型数据库(例如MongoDB):非关系型数据库使用不同的数据模型,如键值对、文档、列族等,适用于半结构化和非结构化数据的存储和管理
  3. 存储系统(例如分布式文件系统):存储系统采用分布式的方式存储数据,将数据分散存储在多个节点上,提供高可用性和可扩展性。常见的存储系统包括Hadoop分布式文件系统(HDFS)和谷歌文件系统(GFS),它们适用于大规模数据的存储和处理。
  4. 内存数据库(例如Redis):内存数据库将数据存储在内存中,提供快速的数据访问和处理速度。它们适用于对实时性要求较高的应用场景,如缓存、会话管理等。

老系统结合新技术

  1. 增量改进:通过逐步引入新技术和功能来改进老系统,而不是一次性进行全面重构。这种方法可以减少风险和影响,并逐步将系统迁移到新的架构和技术上。
  2. 模块化和微服务化:将老系统拆分为独立的模块或微服务,每个模块可以独立进行改进和升级。这样可以提高系统的可维护性和可扩展性,同时降低对整个系统的影响。
  3. 引入新技术:结合新的技术和工具来解决老系统中的痛点和限制。例如,可以引入缓存技术来提高系统的性能,引入数据分析和机器学习技术来优化业务流程等。
  4. 数据迁移和转换:对于需要改变数据存储和格式的老系统,可以进行数据迁移和转换。这样可以更好地适应新的存储和数据库系统,并保留原有数据的完整性和一致性。

总结

学习《认识存储与数据库》这门课程是一次宝贵的学习经历。我通过学习全生命周期、数据库与存储系统的知识,了解了主流系统架构以及老系统持续演进的方法,提高了对数据管理和存储的理解和应用能力。这将对我的职业发展和解决实际问题有着积极的影响。

🎉感谢

青训营-青春造梦,技术未来 (bytedance.com)