可扩展性 – 为什么关系数据库不能满足大数据的规模?
|
经常重复的是,大数据问题是关系数据库无法扩展以处理现在正在创建的大量数据. 但是,像Hadoop这样的大数据解决方案不受约束的这些可扩展性限制是什么?为什么Oracle RAC或MySQL分片或MPD RDBMS不能像Teradata(等)那样实现这些功能? 我对技术限制感兴趣 – 我知道集群RDBMS的财务成本可能过高. 解决方法MS刚在荷兰有一个 tech talk,他们讨论了一些这样的东西.它开始缓慢,但在20分钟左右进入Hadoop的肉.它的要点是“它取决于”.如果你有一个合理安排的(至少在某种程度上)易于分区的数据集(至少在某种程度上)是同构的,那么使用RDBMS扩展到那些高数据量应该相当容易,这取决于你正在做什么. Hadoop和MR似乎更适合于您被迫进行大型分布式数据扫描的情况,特别是当这些数据不一定像我们在RDBMS世界中发现的那样是同构的或结构化的时候. 大数据解决方案有哪些限制?对我而言,他们不受约束的最大限制是必须提前制定严格的架构.使用大数据解决方案,您现在可以将大量数据存入“框”,并在以后为查询添加逻辑,以解决数据缺乏同质性问题.从开发人员的角度来看,权衡是项目前端的易于实施和灵活性,而不是复杂性查询和不太直接的数据一致性. (编辑:南阳站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- sql-server – CPU时钟速度与CPU核心数量 – 更高的GHz,或更
- 腾讯QQ受电信骨干网影响昨日多项服务突中断
- 从具有动态sql的存储过程创建实体
- SQL Server数据库中如何创建表的相关约束?
- sql-server-2008 – SQL 2008镜像,如何从镜像数据库进行故障
- 警惕:出现很危险多组件含病毒的RAR文件蠕虫
- sql-server – SQL Server位列真的使用整个字节的空间吗?
- sql – pgAdmin III错误行为?
- 当数据库与Web服务器分离时,我可以使用powershell脚本来安装
- sql-server – 将SQL Server Express数据库复制到另一台计算

