昨天上午上班的时候客户拿过来7个G的数据要我们进行分析,起初给的是个oracle导出文件(dmp文件),这个文件也就580M的样子,我开始是在桌
面上解压的,后来客户告我有7个G吓着我啦,更紧撤销了,开始了硬盘整理工作,我的电脑是120G的硬盘,好嘛我把能删的全删了,才整理出20多G的空
间,呵呵,空间够了开始执行导入操作,由于一天要出个结果所以导入过程被中途截止了,现在把记录的数据显示如下:
起始E盘空间12.4G,只是导入了三个表就认为的终止了
331398行 table1
2820669 table2
15554217 table3
start time 10:42:43
end time 12:10:10
第一个表33万行数据耗掉了我300M的硬盘空间,最后E盘剩余的空间为:5.05G,可能是因为机器硬件的原因所以比较耗时,之前没有处理这么大的数据的经验,不过真个导入过程还算正常,cpu耗的不是很多,我两个G的物理内存也就只是耗到1G多点...
接下了的处理就更有意思了,由于我们的产品现在还不支持直接连接oracle处理数据,所以就要先导入到sqlServer里,第一个分析我们值是用到了那张33万条记录的那张表,首先我们用软件建立了一个分析模型,这个模型里也就两个实体一个连接,所有的实体属性加恰来也就是20来个,呵呵,由于处理导入的时候要进行数据处理,用的是我们产品里的数据抽取工具,没有用专业的数据抽取工具,这个导入过程的结果太令我吃惊了,33万行数据导入到19.7万行的时候程序就因为把的D盘空间耗完了,结果19.7万行数据竟然耗掉了6288512M空间,我们的软件的原因就不议论了,但这个过程中sqlserver一个进程就耗掉了我1G过的内存,sqlServer真的该向oracle学习下,哈哈,结下了我们用们的一个可视化分析工具,借助那一会建立的模型分析这19.7万行数据,这个分析软件因为是缓存的原因吧在耗掉我2G内存后,已经不能保存数据啦,呵呵,一直处理到晚上六点多才出了点结果,呵呵......
这一天的经历真的蛮珍贵的,呵呵,首先说说缓存的机制吧,之前写东西总是第一反应就是缓存起来,呵呵,进过前一阵的一个项目我明白了在软件登录时最好别把所有的数据都缓存起来,呵呵,要学会分步缓存的机制,呵呵,咋样才能软件接受大数据的处理能力呢?其次是软件执行效率的问题,之前听人说过一款ETL是另一款ETL效率的六至八倍,咋样才能提高处理效率呢?这就是软件价格的差距啦,呵呵....
分享到:
相关推荐
Oracle.10g.Pl.SQL编程Oracle.10g.Pl.SQL编程Oracle.10g.Pl.SQL编程Oracle.10g.Pl.SQL编程Oracle.10g.Pl.SQL编程Oracle.10g.Pl.SQL编程Oracle.10g.Pl.SQL编程Oracle.10g.Pl.SQL编程Oracle.10g.Pl.SQL编程Oracle.10g....
利用delphi 7通过Oracle.Data.Access组件开发oracle数据库表清理数据操作及运行工具含Oracle.Data.Access.Components.v6.80.0.47.FS.forD5-D2009组件及安装方法 里面有自我理解的oracle清理数据思路 运行平台:...
McGraw.Hill.Oracle.Data.Guard.11g.Handbook.Jul.2009.pdf
让Oracle跑得更快.Oracle.10g性能分析与优化思路
oracle11g官方中文帮助 Oracle 11g:ORACLE ACTIVE DATA GUARD.pdf Oracle Database 11g 高可用性.pdf Oracle 数据库 11g 中的分区.pdf Oracle 数据库 11g :真正应用测试与可管理性概述.pdf Oracle 数据库 11g...
让Oracle跑得更快.pdf-Oracle 10g 性能分析与优化思路
Oracle11g和oracle10g之间数据的导入导出.
oracle上传GIS数据方法.doc oracle上传GIS数据方法.doc
oracle数据导出高效工具,详细介绍了sqluldr2的使用方法和各个参数的含义.
oracle数据仓库国宝级资料(全套) 1、Oracle+10g数据仓库实践--数据仓库基础.pdf ...7、Oracle+10g数据仓库实践--数据展现(BI+BEANS).pdf 8、Oracle+10g数据仓库实践--数据挖掘(DATAMINING).pdf
oracle10G和11G的OCI.dll,主要用于navicat工具;oracle10G和11G的OCI.dll,主要用于navicat工具
C#连接Oracle10g,11g,12g所需的DLL(无需安装Oracle客户端,64位,32位通用版)含实例。
Oracle 11g是一款甲骨文公司成功打造的功能强大的关系数据库管理系统,目前共发行了linux版本和windows版本,Oracle数据库的高效性、安全性、稳定性、延展性,是其成功的关键因素,世界上的几乎所有大型信息化系统都...
windows下oracle11g数据泵自动备份脚本含删除过期备份和使用方法 1、先建备份用的路径对象:(注:此处认为用来做备份的用户backupuser已经建好了,且已经有连接数据库的相应权限) sqlplus / as sysdba CREATE OR ...
Oracle.Database.10g.Performance.Tuning.Tips.and.Techniques.
Oracle 9i 11g历史库升级迁移数据至19c CDB
Linux(RHEL5)下ORACLE_10g_10.2.0.1.0升级到10.2.0.5.0操作文档(超给力版本)... 1 目录... 2 1. 文档更新记录... 3 2. 文档说明... 3 3. 升级前,需要做的准备工作:... 4 3.1.1. 临时增加shared pool和java pool...
Oracle 11g 官方中文文档 包括一下部分文档: Oracle 11g:ORACLE ACTIVE DATA GUARD.pdf Oracle Database 11g 高可用性.pdf Oracle 数据库 11g :真正应用测试与可管理性概述.pdf Oracle 数据库 11g 中的分区....
Exam.Guide.Exam.1Z0-052(Oracle 11g OCA)
oracle.ManagedDataAccess.dll(oracle.ManagedDataAccess.Client)全托管驱动。 此驱动对32位和64位oracle数据库具有很好的连接兼容性。 可采用无客户端远程连接oracle,或在本机使用连接。 使用此驱动可以完全替换...