Errores en memorias DRAM
por : Javier Pastor: 05 Oct 2009, 10:38
Un estudio que ha durado dos años y medio y que se ha llevado a cabo en decenas de miles de servidores de Google revela que los errores en módulos DIMM son muchísimo más frecuentes de lo que se pensaba.
De hecho la media de errores es cientos de miles de veces superior a lo que se había estimado, y se estima que según el estudio un DIMM puede tener 3.751 errores corregibles en un año. El estudio incluyó a memorias DDR1, DDR2 y FB-DIMM, y es el más ambicioso que se ha realizado al respecto.
Los servidores de Google usan ECC DRAM que corrige los errores de un solo bit y que informa de los errores de bit doble, pero es raro que los equipos de sobremesa y portátiles dispongan de memoria registrada. Sin embargo, hay algunas buenas noticias: la temperatura no afecta demasiado a los errores, y el problema va a menos con las nuevas generaciones o, como mucho, se mantiene.
vINQulos



Comentarios
por eso MS queria en la fase Beta de Vista poner como requisito de la version de 64bits que el equipo montase memoria ECC. Segun estadisticas de MS el 60% de los errores BSOD son errores de memoria.
@inqui,
No se creen ni ellos. El 99,99% de errores de BSOD es producido por Windows, drivers y demás.
Será casualidad q mientras corres Linux no hay errores de memoria…
#Kikito
Por muy malo que sea el software de microsoft, o por mucho que los odies (a pesar de utilizarlo, que tambien es para hacerselo mirar entonces), los errores BSOD (o pantallazos azules de cuelgue) son o por fallo de memoria ram o por fallo de cualquier otro hardware del equipo, des de placa base, tarjetas pinchadas, disco duro desconectandose (petando), etc…
Lo que esta claro es que aunque te falle el equipo, en MS-Dos no tendras pantallazo azul, pero es que en MS-Dos no usas ni tan solo una infima parte de un equipo.
En linux es posible que en vez de pantalla azul se quede clavado.
+1 minipunto para inqui ;)
Saludos
En linux no tienes BSOD, tienes kernel panic o equipos que van a saltos un rato, hasta que el error hardware se recompone ( caso de un sobrecalentamiento de una grafica por ejemplo).
El 90% de los BSOD son desbordamientos de Buffer .Por errores en drivers o por corrupcion de los mismos ( errores de memoria, o errores fisicos del hardware)
@Joaquim
Eso es falso. Los BSoD no son errores de hardware. Son errores de la comunicación del núcleo del SO con el hardware.
El hardware puede estar perfectamente bien, pero si el núcleo tiene problemas de comunicacion ya sea por culpa del driver o por culpa del SO, ya tienes un BSoD
La mía (la de mi cabeza) también tiene errores.
vamos, son errores cuando se piensa que se puede hacer algo sin comprobar primero que se puede hacer, eso es el tipico pantallazo azul, claro que comprobar si el rescurso es viable cuando nada te ha informado de lo contrario, no les entra en la cabeza a los maicrosferos, y por ende casca, aveces la culpa la tiene un driver, y aveces el propio S.O, pero vamos el problema de los cuelgues es devido a la confianza de que todo siempre ira bien.
maese
Los BSOD noson errores de hardware, son errores provocados por hardware que funciona de forma erronea que no es lo mismo.
Por ejemplo el facilillo de la grafica, una grafica que sobrecaliente su memoria produce corrupcion de datos y respuestas aleatorias que el driver no es capaz de soportar. El driver se cae y arrastra todo el SO, sea el SO que sea ninguno es inmune. Solo que windows es mas aparatoso, pero en mi vida solo he visto BSOD con windows basados en kernel NT en equipos con averias hardware o drivers no WHQL de nula calidad.
@Joaquim,
Antes de hablar informate de pq aparecen las BSOD. Uso windows cuando me obligan a ello (trabajo por ejemplo) así que de momento no me miro nada.
No sé de donde te sacas que odio Windows. No lo odio, tiene algunas cosas muy buenas, pero otras no. Si decir verdades sobre algo es odiarlo a lo mejor el que se tendría que ‘hacerselo mirar’ eres tú.
Por cierto, tampoco te odio a ti, eh!
Pero me sabe malo que M$ siempre culpe de sus fallos o sus practicas ‘oscuras’ a otros.
Supuestamente Microsoft tiene microkernel para evitar cuelges por hardware… ha! Ahora veo que simplemente usa microkernel porque no dá a más…
Lo bueno de Linux y OSX es que si te falla el hardware, no responde y no se puede usar hasta que vuelvas a recargar el módulo (driver para windusers)
Comentando la noticia: Es lógico, una ram que nunca se apaga, tiene muchas posibilidades de corrupción.
cualquiera con dinero compra WHQL, si no pregunten a INTEL.
Dios mío pero si la noticia no tiene nada que ver con sistemas operativos!
Una cosa es ECC dteccion y correccion de errores
y otra el que sea registrada, que mas bien hace referencia al modo de direccionamiento de la memoria.
@Joaquim
Hace muchísimo que no tengo un error irrecuperable en Linux, aún así quedan las interrupciones del Kernel para reiniciar de manera limpia:
[CTRL]+[Pet Sis]+ (en secuencia esperando 1 o 2 segundos)
R E I S U B para reiniciar
R E I S U O para apagar
R* Raw – pone el teclado en modo RAW
E* End – termina todos los procesos
I* kill – mata todos los procesos
S* Sync – sincroniza el HD
U* Umount – desmonta todos los sistemas de archivos
B* reBoot – reinicia la PC
Pues mis equipos me los he montado yo siempre y errores de pantallass azules no tengo nunca, no sé como la gente por ahí está tan quemada con esto. La vez que si que tuve fue con un HD de seagate y una placa gigabyte, cambié el disco y hasta ahora, por lo demás nada.
También uso un mac y tampoco pasa nada, alguna aplicacion ha hecho algo raro, la he matao y bien.
Yo lo que pienso… vaya equipos mangurrinos que tienen algunos jejjj.
Saludos
#Gallego.
curiosamente, el buen manejo de la RAM y la tolerancia de fallos de estos, lo dá el kernel del SO, por ejemplo: Linux desde hace mucho tiempo podía trabajar con memorias RAM dañadas, Windows no admitió esta funcionalidad hasta hace poco. y esto no era con el fin de que le cuelgues cualquier cosa a tu PC, si no como parte de su estructura para Tolerancia de Fallos.
#Kikito
en Linux si hay errores de memoria tambien y relacionados con drivers, errores que son capaces hasta de colgar el kernel, la diferencia solamente es que puedes de igual forma salir a la consola y recuperar el sistema con comandos, pero aun asi para un usuario comun… esto seria un dolor de cabeza.
[...] Continuar Leyendo [...]
Publica un nuevo comentario