单机存储和分布式存储｜青训营笔记

2023-02-15 508 阅读4分钟

这是我参与「第五届青训营」伴学笔记创作活动的第 11 天

今天来谈一谈存储方式的区别

介绍

网络编程中的存储通常指的是将数据存储到计算机或服务器的硬盘或内存中，以便以后可以访问或处理。在网络编程中，存储通常用于以下几个方面：

缓存：将已经获取的数据缓存到内存或磁盘中，以便下次访问相同数据时可以更快地获取。
数据库：将数据存储到数据库中，以便以后可以方便地查询、修改、删除等操作。
文件存储：将文件存储到磁盘中，以便以后可以访问或处理。
会话存储：将会话数据存储到内存或数据库中，以便在用户的多个请求之间共享数据。

在网络编程中，存储通常需要考虑并发、安全、性能等因素，例如对于多个并发请求，需要确保数据的一致性和可靠性，以及避免数据竞争等问题。因此，开发人员需要仔细考虑存储方案，并选择合适的存储技术和工具。

单机存储和分布式存储都是数据存储的方式，但它们的实现方式不同。

单机存储

单机存储指的是将数据存储在单一计算机的硬盘或内存中。在单机存储的场景下，所有的数据处理和存储都在同一台计算机上进行，例如将文件存储在计算机的硬盘上、将数据存储在数据库中等。由于单机存储的容量和性能受到硬件设备的限制，所以它通常适用于小规模的数据存储和处理场景。

下面是单机存储的一些常见用途和案例：

文件存储：将文件存储在计算机的硬盘中，例如文本文件、图片文件、视频文件等。这种方式适用于小型应用的数据存储和处理，例如个人文档、照片、音乐等。
关系型数据库：将数据以表的形式存储在数据库中，例如MySQL、SQL Server、Oracle等。这种方式适用于中小型应用的数据存储和处理，例如网站、管理系统、ERP系统等。
NoSQL数据库：将数据以键值对的形式存储在数据库中，例如Redis、MongoDB、Cassandra等。这种方式适用于结构化数据的存储和处理，例如日志、推荐系统、缓存等。
内存数据库：将数据存储在计算机的内存中，例如Redis、Memcached等。这种方式适用于对数据的实时读写需求比较高的场景，例如在线游戏、广告系统、消息队列等。
文件系统：将文件存储在计算机的文件系统中，例如NTFS、EXT4等。这种方式适用于文件管理和备份，例如文件服务器、云存储等。

分布式存储

分布式存储则是将数据分散存储在多台计算机的硬盘或内存中。在分布式存储的场景下，不同计算机之间通过网络连接进行通信和数据共享，从而实现数据的存储和处理。分布式存储的好处在于可以扩展存储和处理能力，提高数据的可靠性和容错性，同时支持高并发访问和数据共享。

分布式存储在互联网和大规模应用中得到了广泛的应用，例如云计算、分布式数据库、分布式文件系统等。分布式存储的实现需要考虑到网络通信、数据一致性、负载均衡、故障恢复等方面的问题，需要使用特定的技术和工具进行实现。

Hadoop HDFS：是Hadoop分布式计算框架的核心组件之一，将数据分散存储在多台计算机的磁盘中，实现了数据的可靠性和可扩展性，适用于海量数据的存储和分析场景。
Apache Cassandra：是一种开源的分布式NoSQL数据库，采用分布式哈希算法将数据分散存储在多台计算机的磁盘中，支持海量数据的存储和高并发的读写操作，适用于实时数据处理和高可用性的场景。
Amazon S3：是Amazon Web Services提供的一种云存储服务，将数据分散存储在多台计算机的磁盘中，支持海量数据的存储和高可靠性的数据备份，适用于云计算和云存储等场景。
GlusterFS：是一种开源的分布式文件系统，将文件分散存储在多台计算机的磁盘中，支持高可扩展性和高可用性，适用于海量数据的存储和高性能的文件共享等场景。
Apache Hbase：是一种基于Hadoop的分布式列存储数据库，将数据按行存储在多台计算机的内存中，支持高并发的读写操作和高可扩展性，适用于大规模实时数据的存储和处理场景。