时间:2021-05-20
如下:
Error : cannot allocate vector of size X Gb
1. 可以用matrix尽量不要用data frame;
2. 可以用integer matrix尽量不要用 double matrix;
3. 对于大量运算后最好加上一个gc(), 强制R语言回收内存;
4. 对于大矩阵而言用bigmemory包,可以将大矩阵放到临时文件中,不占用内存。
补充:R语言之内存管理
在处理大型数据过程中,R语言的内存管理就显得十分重要,以下介绍几种常用的处理方法。
注意刚开始时已使用内存和已分配内存是同步增加的,但是随着R中的垃圾被清理,已使用内存会减少,而已分配给R的内存一般不会改变。
R中的对象在内存中存于两种不同的地方,一种是堆内存(heap),其基本单元是“Vcells”,每个大小为8字节,新来一个对象就会申请一块空间,把值全部存在这里,和C里面的堆内存很像。第二种是地址对(cons cells),和LISP里的cons cells道理一样,主要用来存储地址信息,最小单元一般在32位系统中是28字节、64位系统中是56字节。
ls() #查看当前对象 object.size() 查看对象所占内存 #or library(pryr) object_size() #区别于前者,它进行了换算R会将新的对象存储在“连续”的内存中,如果没有这样的空间就会返回“Cannot allocate vector of size...” 的错误,有以下几种处理方法:
a) 如果有多个矩阵需要存储,确保优先存储较大的矩阵,然后依次存储较小的矩阵.
b) 预先分配合适的内存.
大家都知道R中矩阵的维度并不需要赋一个固定的值(很多语言的数组长度不能为变量),这为写程序带来了极大的方便,因此经常在循环中会出现某个矩阵越来越长的情况,实际上,矩阵每增长一次,即使赋给同名的变量,都需要新开辟一块更大的空间,假设初始矩阵为100K,第二个为101K,一直增到120K,那么,将会分别开辟100K、101K一直到120K的连续堆内存,如果一开始就开一块120K的,使之从101K逐渐增长到120K,将会大大地节约内存。cbind函数也是这个道理,所以在循环中要注意不要滥用。
c) 换到64位的计算机,这种问题较少出现.
例如某个矩阵默认就是"double"的,如果这个矩阵的数值都是整数甚至0-1,完全没必要使用double来占用空间,可以将其改为整数型,可以看到该对象的大小会变为原来的一半。
storage.mode(x) #查看对象的存储模式 storage.mode(x) <- "integer" #整数型存储模式
rm() #删除变量的引用,经常用它来清理中间对象,其中比较重要的文件可以存在硬盘里,比如csv文件或者RSqlite等
gc() #清理内存空间
.ls.objects() #查看内存消耗较大的文件,并处理掉其他无关对象.代码如下:
.ls.objects <- function (pos = 1, pattern, order.by = "Size", decreasing=TRUE, head = TRUE, n = 10) { napply <- function(names, fn) sapply(names, function(x) fn(get(x, pos = pos))) names <- ls(pos = pos, pattern = pattern) obj.class <- napply(names, function(x) as.character(class(x))[1]) obj.mode <- napply(names, mode) obj.type <- ifelse(is.na(obj.class), obj.mode, obj.class) obj.size <- napply(names, object.size) / 10^6 # megabytes obj.dim <- t(napply(names, function(x) as.numeric(dim(x))[1:2])) vec <- is.na(obj.dim)[, 1] & (obj.type != "function") obj.dim[vec, 1] <- napply(names, length)[vec] out <- data.frame(obj.type, obj.size, obj.dim) names(out) <- c("Type", "Size", "Rows", "Columns") out <- out[order(out[[order.by]], decreasing=decreasing), ] if (head) out <- head(out, n) out }这部分可参考文献1。在xp系统上试了一下,得到的存储地址总是不变,不知道xp系统上有没有效...
这是没有办法的办法,迟早要处理全部的数据,不过可以借此调试代码或是建模,如在合适的地方清理中间对象
Hadley Wickham 建议写成脚本文件,运行后再清理掉临时文件
它可以将特定对象存储为RData文件并无需加载到内存就能进行分析
r = data.frame(a=rnorm(10,2,.5),b=rnorm(10,3,.5)) library(SOAR) Sys.setenv(R_LOCAL_CACHE=”testsession”) ls() Store(r) ls() mean(r[,1]) r$c = rnorm(10,4,.5) ls()它会告诉你哪一行的代码消耗了多少时间、内存,释放多少内存,复制了多少向量.
library(devtools) devtools::install_github("hadley/lineprof") library(lineprof) source("D:/test/test.R") prof <- lineprof(test("D:/test/testcsv")) shine(prof)以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
大家在应用电脑时一定都遇到过机器提示内存不足的现象吧,那么什么是内存不足,又该如何处理呢,下面我们就来讲一讲有关这方面的内容。 所谓“内存不足&r
在Laravel中使用cursor来查询并处理数据(轻松处理千万级的数据)事发现场最近在项目中遇到内存不足的问题,测试环境中的PHP内存只有64M,在导出的时候
相信大家在使用笔记本电脑的时候,一定都遇到过系统跳出内存不足的提示吧,那么什么是“内存不足”,内存不足的时候,我们又该怎么办呢,下面,针
解决iPhone手机内存不足的诀窍 解决iPhone手机内存不足的诀窍ram等,也会内置“保留原片”的选项,可以根据使用需求适当关
网易MuMu模拟器内存不足怎么办?有很多用过户表示,在使用网易模拟器时,一启动就显示内存不足的情况,下面小编带来了网易mumu模拟器提示内存不足的解决方法,希望