Tilera anuncia microprocesadores de 100 núcleos
por : Juan Ranchal: 27 Oct 2009, 8:30
La compañía de semiconductores Tilera, que ya ofrece 32 y 64 núcleos con los Tile64 y Tile32Pro, anuncia ahora una solución denominada TILE-Gx, con cuatro modelos de 16, 36, 64 y 100 núcleos de procesamiento.
Los Tile-Gx estarán fabricados por TSMC en procesos tecnológicos de 40 nanómetros. Tendrán frecuencias de trabajo de hasta 1,5 GHz y soporte para un máximo de 1 Terabyte de memoria DDR3 ECC a 2.133 MHz.
Bajo arquitectura RISC, su consumo variará desde 10 a 55 vatios e incluirán instrucciones de 64 bits y SIMD extendidas y una memoria caché de tercer nivel de 26 Mbytes.
Tilera asegura que sus soluciones están por rendimiento y consumo, cuatro años por delante de sus competidores incluido Intel, de los que dice tener diez veces la eficiencia de los chips de próxima generación de “Westmere”.
vINQulos
The Inquirer UK



Comentarios
[...] Tilera anuncia microprocesadores de 100 núcleos | The Inquirer ES http://www.theinquirer.es/2009/10/27/tilera-anuncia-microprocesadores-de-100-nucleos.html – view page – cached La compañía de semiconductores Tilera, que ya ofrece 32 y 64 núcleos con los Tile64 y Tile32Pro, anuncia ahora una solución denominada TILE-Gx, con cuatro — From the page [...]
Por si alguien lo va a preguntar: No, no creo que suban los fps en el crysis con este procesador xD
Una pena que sigamos usando la ya desfasada tecnología x86.
Unos monstruos para la multitarea y multiproceso. Es de esperar que acaben siendo usados en servidores de alta capacidad de calculo o en futuras consolas. Pero claro, sólo es un suponer.
Supongo que no cuestan 50€ tampoco…
@Invictus: Totalmente de acuerdo.
Para que sirven 100 nucleos si el software esta diseñado para 1
Hasta que no aparezcan herramientas para programar efiientemente varios nucleos de poco sirve.
Rinde mas la frecuencia que los nucleos
@ aaa: tienes toda la razón del mundo.
¿100 nucleos a 1500 Mhz cada con 55 w de consumo????
MODE SIMPSON ON:
aaaaahhhhhgggg¡¡¡¡¡ nucleotástico¡¡¡
MODE SIMPSON OOF, perdon OFF ;)
creo que mis próximas cpu van a ser RISC. Windows, chaval, lo siento, no es nada personal.
Mirando en la pagina de Tilera:
Up to 750 billion operations per second (BOPS)
No he encontrado datos para comparar pero así “a ojo” parece una buena “marca” ¿alguien me ayuda a compararlo?
@Revenarius.
Extremadamente difícil de comparar, incluso cogiendo las especificaciones de los fabricantes.
Vamos a intentar comparar este procesador con otro procesador masivamente paralelo que podemos conseguir por relativamente muy poco dinero.
Tilera :
100 núcleos,
750 BOPS (billones de operaciones por segundo)
Radeon 5870 :
1600 unidades de procesamiento (programables mediante CUDA)
2,72 Teraflops (billones de operaciones con coma flotante por segundo)
La unidad de Terfalops se refiere a billones internacionales (10 elevado a 12). Mientras que ese invento del BOP, que no existe como unidad reconocida, no sabemos si se refiere a billones americanos (10 elevado a 9) o internacionales. Aunque mucho me temo que es el primer caso.
Así que tenemos 2,73 * 10^12 operacions de coma flotante por segundo contra 750 * 10^9 (aunque podrían ser 10^12) operaciones por segundo.
Aunque nos decantemos por un valor o por otro, esto no acaba aquí. Y es que no son valores directamente comparables. Puesto que las operaciones de coma flotante por segundo todos sabemos lo que son. ¿ Pero que puñetas es este invento de BOPS ?, ¿ operaciones con enteros ?, … Depende de cual sea el caso es totalmente injusto comparar el uno con el otro.
En mi opinión, esta gente se ha lucido dando su rendimiento en esto de BOPS en lugar de usar una unidad reconocida, con la que podamos comparar. Esto me hace sospechar que usan billones americanos y mesuran operaciones sencillas, como las que implican enteros, para poder presumir de un valor alto.
En lo único que me parece destacable este procesador es en consumo. Para lo demás, si no dan especificaciones claras me quedo con una 5870 o la futra GT300.
Es lo de siempre, cualquier CPU es “infinitamente” superior a las de Intel y AMD, pero si se usan estas ultimas, por algo será, no?
Porque será que esta comañia llamada Tilera, la conocerán tan solo en su casa?
Salu2
Marc ¿¿que huevos tiene que ver una grafica con un procesador RISC??
@OvEr0n
Los mismos huevos que comparar procesadores CISC (Intel Core 2 Duo y Core 2 Quad) con procesadores RISC (estos Tile-Gx), como hacen la misma gente de Tilera en esa gráfica.
A fin de cuentas lo que nos interesa de un procesador es lo que puede hacer y no su arquitectura interna. Y las gráficas de última generación ya puede hacer exactamente lo mismo que los procesadores genéricos, como confirmó recientemente la misma nVidia cuando aseguró que su nuevo GT300 podría correr perfectamente un Sistema Operativo.
@Marc
+1
Uy! Tanto el RV870 como Fermi, están lejos de poder ejecutar cualquier sentencia destinada a un procesador de propódito general, aunque eso sí, parece que Fermi se acerca algo más. Que fermi pueda ejecutar un SO es una tremenda mentira.
Respecto a la unidad BOP, es precisamente lo que indica, una unidad clara y concisa, billones americanos de operaciones RISC (arquitectura Tile) por segundo, no hablamos de operaciones ni con enteros (MIPS) o coma flotante (FLOPS), que siempre son operaciones matematicas; sino, de operaciones en general, que pueden ser todas las contempladas en el set de instrucciones de Tile. Esto son 750 x 10^9 operaciones por segundo, pero ojo, pasado a MIPS o FLOPS pues dependería del número de datos que puedan tratar en paralelo las unidades SIMD de cálculos matemáticos. De momento las gráficas se acercan más a estas unidades SIMD que a un procesador.
a ver si esto es más aclaratorio:
15 Gbps SNORT® processing
• 20 Gbps iptables (firewall)
• 20+ Gbps nProbe
• H.264 HD video encode: 10 streams of 1080p – baseline profile
• 15+ channels of OFDM baseband receiver processing (wireless
Supongo que si puede mover 20Gbps haciendo de firewall se podría decir que es capaz de procesar más o menos la misma cantidad de intormación en otros programas ¿no?
@Marc
Creo que el invento del BOPS es una mutación aberrante de MIPS xD
Siendo MIPS millones de instrucciones por segundo de los cpu y Mflops idem para operaciones de punto flotante, si no le erré al cálc_ulo sería:
750 BOPS = 750000 MIPS
O sea algo así como 750GIPS internacional xD
La gráfica que mencionas es de 2.72Tflops o 2720Gflops
En comparación para saber cuanto es esto:
750GIPS internacional < 2720Gflops
O lo que es lo mismo:
750 bananas < 2720 sandías
xD
Repito, no es comprable el BOP con el FLOP, puesto que el segundo carece de toda lógica y son cálculos puros y duros, sin embargo el BOP puede aplicar cualquier algoritmo que deseemos. Por eso nos dan los benchmarks en aplicaciones: VPN, IPS, H264 encode, etc.
Por cierto, Tile es una arquitectura VLIW (very long instruction word), como el Itanium, es decir, los cores son muy simples pues eliminan toda la lógica destinada al reparto de recursos y su planificación, quedando todo en manos del compilador; pero insisto siguen siendo procesadores completos, no como los stream processors, que son megasimples.
Su mercado potencial es el mismo que el Itanium. La cuestion, es hasta donde ha llegado Intel con el experimento 80 cores en la plataforma Itanium, con 16 cores se merienda a los 100 de este Tile, pero sin QPI etc Itanium tiene problemas para interconectar mas de 8.
@pecoso, te equivocas.
La 5870 y la GT300 no necesitan ejecutar instrucciones destinadas a procesadores de propósito general (imagino que te refieres al conjunto de instrucciones x86). En realidad solo necesita cuatro instrucciones básicas para poder implementar cualquier algoritmo imaginable.
Solo necesitas instrucciones de condicional, suma, multiplicación, acceso a memoria, … y muy poco más. Con eso ya tienes una máquina de Turing completa y puedes programar cualquier algoritmo. La única diferencia con el superordenador más moderno solo está en el tiempo que va a tardar en darte el resultado, pero vas a poder calcular exactamente lo mismo con los dos.
Y desde luego las unidades de procesamiento de las gráficas actuales ya tienen las instrucciones básicas que permiten reconocerlas como máquinas de Turing y programar algoritmos para resolver cualquier problema de complejidad determinista. Tienen esas instrucciones y más (instrucciones para las operaciones de coma flotante, etc. … que se podrían calcular igualmente con las instrucciones básicas, pero que iba a tardar mucho más).
La GT300 (al igual que la 5870) podría correr perfectamente un sistema operativo (Linux claro, puesto que hay que compilarlo especialmente para ese procesador, cosa que no se puede hacer con Windows).
http://www.noticias3d.com/noticia.asp?idnoticia=35772
@Pecoso, no todas las instrucciones de un procesador se ejecutan en los mismos ciclos de reloj. En función del algoritmo que ejecutes siempre obtendrás valores distintos.
Mesurar en Bops si que carece de toda lógica. Eso solo sirve para comparar dos procesadores con exactamente la misma arquitectura. Fuera de eso es un valor totalmente inútil.
En cambio los Flops permiten comparaciones fidedignas entre procesadores y arquitecturas totalmente distintas.
Gracias @magtec
750 bananas < 2720 sandías
Ahora ya me ha quedado muy claro XD XD.
Yo veo mucho humo en esta noticia. Empezando con el valor de rendimiento, que es puro humo, puesto que no se puede comparar con nada, no nos indica absolutamente nada del rendimiento general del procesador. Y acabando con su misma arquitectura.
El artículo dice que está hecho con arquitectura RISC, pero también dice que tiene instrucciones SIMD, y ahora @pecoso nos dice que la arquitectura es VLIW (conjuunto de instrucciones muy largas).
Vaya solo falta que alguien más nos diga que lleva arquitectura CISC, y ese procesador abarca todo el espectro de arquitecturas conocidas. Que monstruo. XD XD.
Veamos:
En esta página:
http://www.tgdaily.com/content/view/39408/118/
se hacen unas pruebas con los procesadores anteriores.
El Tilepro64 y el Tile64 rinden según la gráfica 221 Gflps en 16 bits. Si según Tilera rinde 443 Bops…. entonces 2 bops aproximadamente son 1 Gflop….entonces 750 Bops son más menos ¡¡¡375 gflops!!!
¿que os parece ahora? ¿Podriamos comparar ahora?
@Revenarius, entonces mejor no hacemos la comparación puesto que este procesador queda en muy mal lugar :XD.
Da un rendimiento de 0,37 Teraflops comparado con los 2,73 Teraflops de la 5870. Prácticamente diez veces menos su rendimiento.
@Marc
Si, pero este procesador es de propósito general y las gráficas aún no lo son.
No se, ¿cuanto rinde un procesador de gama alta para servidores?
The Tile64/32 useed MIPS as basis. Usease, que esta cosa es a MIPS lo que Tegra es a ARM.
Habria que verlos como compiten con un Nehalem EX con Larrabe en el PCIe, en teoria esos 100cores rinden al nivel de 24 Atom, un Larrabe con 32cores lo adelantara por la derecha.
@Magtec, las nuevas gráficas las han preparado para ejecutar OpenCL que es código en C. ¿ Un procesador optimizado para ejecutar C no es un procesador de propósito general ?. Entonces lo siento, no tengo ni idea de lo que es un procesador de propósito general.
Yo pensaba que un procesador que puede correr un sistema operativo completo como Linux, era un procesador de propósito general.
http://www.noticias3d.com/noticia.asp?idnoticia=35772
Cierto que las gráficas están optimizadas para acelerar los renderizados 3D, pero ahora también son procesadores de propósito general, sus unidades de procesamiento sirven para cualquier tipo de cálculo y no solo para el renderizado de vídeo.
Bueno, lo intente duramente y fui vencido.
Una mie*da de sitio…
i7-965 3.2 GHz 51.20 Gflops
@Marc
No sabía que las gráficas estaban tan avanzadas.
PD: es posible que en un momento vean unos 30 mensajes míos anteriores a este… o no.
mie*da de sitio…
En teoria esos micros rinden igual que una placa Quadsocket Nehalem EX.
Es el rendimiento teorico de un Nehalem EX acompañado de un Larrabe 32cores.
@magtec
Según esos datos que das el “100nucleos” es como 7 veces y pico más potente que el i7 ¿no?
@Revenarius
Casi 15 veces más potente. Sería como tener un servidor con 15 i7 965…
ohhh ahhhh¡¡¡
Pues sí que hay diferencia…. y no creo que cueste como 15 i7….por no hablar del consumo.
#asiduo, QPI no valdría para nada cuando se intenta una interconexion de tal magnitud, puesto que es un bus punto a punto, al estilo de Hypertransport. Este micro utiliza un red de interconexión, realmente el aspecto de diseño más importante en este tipo de sistemas; sin una buena red de inerconexión no hay micro.
Itanium no ha demostrado nada por ahora, bueno sí, que nadie lo quiere.
#Marc, no lo son, porque dependen de la cpu+driver para cargar en la memoria las tareas a desempeñar, y la lógica no se implementa en las GPU, sino en las CPU. Dile tu a una GPU que ejecute un bucle condicional, que acceda a una base de datos, etc, etc. Ahora mismo se le dice, pilla esta matriz y esta otra y sumalas, o multiplica este vector por tal valor; cosas que hará rapidisimamente.
@Revenarius
No había visto tu mensaje anterior, cosas de este sitio que no me lo mostraba.
cito:
Si es así tenías razón antes, este Tilera rinde lo mismo que más de 7 procesadores i7 965, y con tan solo 55W!!!
Y digo yo, la mejor forma de comparar los 2 procesadores no sería hacerles ejecutar la misma aplicación para servidores con mismo SO pero en ambos casos todo generado con un compilador que optimice para cada arquitectura?
Al fin y al cabo lo importante no es cuantos núcleos tenga o no se que historias si no cuantas transacciones contra una BBDD pueda hacer en un determinado tiempo, el resto es como muy bien han dicho, comprarar bananas con sandías XD
Uff, me asuste con el titular,
Pense que iban a ser los requisitos para Win 7 …. pero menos mal el vista sirvio para que no lo fuese asi…. que salvada madre mia !!!.
@ Roger:
ahora mismo estamos especulando, si hubiera salido al mercado, entonces ya los hubieran probado completamente
@Roger
Trabajamos con lo que hay …. y no hay muchos datos por el momento. Esto es todo especulativo, pero más menos vamos comparando en plan “andar por casa”. En cuanto tengamos una comparativa real o al menos un analisis ya podremos hacernos alguna idea mejor… por el momento….Todo especulación (calculada)
Chicos 1 duda….. Usando Linux con este tipo de procesador no hay problema…..pero si se virtualizase windows en ese linux …..¿correría más que sobre el i7 directamente o simplemente iría “a su ritmo”?
!!!!!Se admiten todo tipo de opiniones¡¡¡¡¡
@Revenarius
No puedes virtualizarlo con Vbox o vmware, necesitas un emulador de un micro x86.
Algo como esto:
http://www.theregister.co.uk/2007/03/23/java_emulator/
O dosbox, aunque dosbox emula a DOS sobre un x86.
JPC is the fast pure Java™ x86 PC emulator
http://www-jpc.physics.ox.ac.uk/home_home.html
Teóricamente se podría con QEMU Emulator:
http://www.nongnu.org/qemu/
QEMU CPU Emulator supports the emulation of x86 processors, ARM, SPARC and PowerPC. Host CPUs (processors that can run the QEMU emulator) include x86, PowerPC, Alpha, Sparc32, ARM, S390, Sparc64, ia64, and m68k (some of these are still in development). When emulating a PC (x86), supported guest operating systems include MSDOS, Fre_eDOS, Windows 3.11, Windows 98SE, Windows 2000, Linux, SkyOS, ReactOS, NetBSD, Minix, etc. When emulating a PowerPC, currently tested guest OSes include Debian Linux.
@pecoso, ¿ donde has estado metido este último lustro ?.
¿ No te has enterado que las unidades de procesado de los procesadores gráficos ya ejecutan algoritmos complejos ?, ¿ sabes lo que es OpenCL, CUDA, Direct Compute, … ?, pues vete consultándolo.
Los centenares (cuando no, miles) de núcleos que llevan los procesadores gráficos de última generación tienen un set de instrucciones más que suficiente para ejecutar los bucles condicionales que dices, y acceder a memoria no es ningún problema para ellos, esos procesadores llevan incorporados rapidísimos controladores de memoria DDR5 con buses de 256 bits.
Hace mucho tiempo eep-Alive: 300
Connection: close
Referer: http://www.theies. ¿ Te has perdido toda la movida GPGPU de estos años ?.
Por supuesto que podría acceder a una Base de Datos. Solo tienes que poner Linux y cualquier base de datos de ese sistema, y podrás acceder a ella. NOTA: no me digas que no se le puede adaptar un Linux, porqué no es solo que lo haya confirmado nVidia, es que es de pura lógica. Linux se ha portado a decenas de arquitecturas, algunas tan pedestres como la consola PS1 ¿ y no se va a poder portar a este procesador, con un conjunto de instrucciones más rico, más recursos, etc. … ?.
NOTA: Evidentemente para montar un ordenador con Linux y este procesador habría que hacer una placa base a medida. El hecho de que no haya ninguna no tiene nada que ver, estamos hablando de la capacidad del procesador, no de que nadie vaya a hacerlo en realidad (si ni siquiera se aprovecha hoy, tantos años después, el Cell de la PS3 en un Linux adaptado a él, como para empezar un nuevo port de Linux por pura diversión. Primero que se estabilice la arquitectura de esos procesadores, y después quien sabe …).
ehhh¡¡¡ que no estoy preguntando COMO se virtualiza, la pregunta es ¿se gana en velocidad o no?. Con tanta potencia tendría que ser un tiro,aún con la virtualización de por medio. ¿no?
No lo creo @Revenarius, la virtualización, cuando encima hay que emular toda una arquitectura distinta es lentísima.
Un ARM de varios cientos de megaherzios emulando un x86 obtiene rendimientos como si fuera un 486, para que te hagas una idea.
La virtualización solo sirve para ejecutar ese código heredado al que no puedes renunciar, ese programa de contabilidad al que ya estás acostumbrado y donde ya tienes metidos todos los datos, por poner un ejemplo. Pero a poco que puedas hay que utilizar aplicaciones nativas, allí es cuando aprovechas la máquina que estés usando.
@ Marc
Ok. En conclusión Windows no lo “cata” ni siquiera virtualizado. Bueno…..tampoco importa mucho Tenemos Linux, y sobre ese procesador seguro que vuela, planea, rompe la barrera del sonido, hace tirabuzones……(creo que ya se pilla la idea)
La emulacion fue lo que mato al Itanium. Ejecutaba windows corriendo codigo x86 emulado con rendimientos inferiores al P3 necesitando el doble de frecuencia para igualar, pero con codigo nativo se merendaba todo lo que habia en mercado.
ok vierualización de máquina distinta malaaaaaaa¡¡¡¡¡
* No virtualizarás x86 sobre ARM
* Amarás el código nativo
* Usarás siempre formatos abiertos para no tener que virtualizar “dinosaurios”.
ok virtualización de máquina distinta malaaaaaaa¡¡¡¡¡
* No virtualizarás x86 sobre ARM
* Amarás el código nativo
* Usarás siempre formatos abiertos para no tener que virtualizar “dinosaurios”.
Interesante :)
En todo caso el día que me compre un ARM le voy a meter Linux y también QEMU + XP aunque no tire mucho…un windows siempre te puede sacar de un apuro.
ehh¡¡¡ quietos parados todos¡¡¡¡
que estamos hablando de un “bicho” 15 veces superior en potencia al “buque insignia” de Intel. Aunque se pierda la décima parte de la potencia, aún debería ser 1,5 veces más potente que el I7 de “referencia” ¿no?
Si estoy equivocado, “porfa” que alguien postee y me corrija.
[...] Vía The Inquirer ES [...]
Publica un nuevo comentario