- 论坛徽章:
- 8
|
1、为了使分布式存储系统获得更高性能,您会采用哪些措施?
为了使分布式存储系统获得更高性能,需要从硬件和软件两个方面来考量。硬件方面当然是采用性能越优的越好,软件方面则要根据业务逻辑采用合适的分布式协议。
2、分布式存储系统的高并发能力应如何实现?
说起来很简单,就是“分”。如何“分”,简单的说就是把不同的业务分拆到不同的服务器上去跑(垂直拆分),相同的业务压力分拆到不同的服务器去跑(水平拆分),并时刻不要忘记备份、扩展、意外处理等讨厌的问题。说起来都比较简单,但设计和实现起来,就会比较困难。
3、使存储系统获得更高网络带宽的方法有哪些?
由于不同业务系统对存储的性能要求不同,一般小文件(小于1MB)读写型的系统中对IO的要求较高,大文件的读写型系统对存储设备带宽的要求比较高。不用应用模式下系统对存储设备的要求不同,瓶颈点出现的位置和特点也不一样。带宽与所配置的磁盘个数也有一定关系,一般会通过增加磁盘数量、增加扩展柜数量、跨扩展柜创建RAID组、增加主机通道数量等方式最大限度地利用存储控制器前端和后端的总可用带宽,使得磁盘、磁盘通道、主机通道等的总带宽大于控制器的总带宽,这样在工作站访问时存储设备时,才能最大地发挥出控制器的带宽性能。
4、怎样在控制总体成本的情况下,合理地为海量数据提供存储空间,并能满足数据量快速增长的需求?
鱼与熊掌不可兼得,既要合理又要满足快速增长需求,还要控制总成本,如果有这样的方案的话,估计会很受欢迎。
5、真正可靠的数据保护往往需要一套复杂的策略,实现多级数据保护与容灾,这需要分布式存储系统具备哪些功能?
一般使用多幅本技术来提高存储系统的可靠性,也就是数据需要有冗余,比较经典的做法是 3 副本,并且在磁盘损坏时及早修复丢失的数据,以避免所有的副本损坏造成数据丢失。
6、海量非结构化场景下,应用类型、数据类型复杂,为获得高效便捷的数据管理功能,需要在哪些方面做好准备?
从业务层面出发,考虑实际的需求。比如你所处的企业如果数据量很大,则需要在IT架构上做准备,考虑包括数据是怎么收集的、从哪里收集、如何与其他数据进行匹配等问题。而在操作过程中,则可以首先尝试一些开源的工具进行小范围测试,做一些基本了解,然后再找相关的专家仔细进行评估。
7、针对海量非结构化数据场景,您认为分布式存储系统的设计与建设还应关注什么?如何实现?(可选回答)
1)数据的分布方式
·hash分布
·按数据范围分布
·按数据量分布
·一致性哈希
2)副本的保存方式
·以机器为单位
·以数据段为单位
3)副本的控制
·中心化的副本控制
·去中心化,个副本之间没有中心控制
4)节点状态监控
·heartbeat
·lease机制 |
|