Page Content

Artículo

Tilera anuncia microprocesadores de 100 núcleos

por : Juan Ranchal: 27 Oct 2009, 8:30

La compañía de semiconductores Tilera, que ya ofrece 32 y 64 núcleos con los Tile64 y Tile32Pro, anuncia ahora una solución denominada TILE-Gx, con cuatro modelos de 16, 36, 64 y 100 núcleos de procesamiento.

Los Tile-Gx estarán fabricados por TSMC en procesos tecnológicos de 40 nanómetros. Tendrán frecuencias de trabajo de hasta 1,5 GHz y soporte para un máximo de 1 Terabyte de memoria DDR3 ECC a 2.133 MHz.

Bajo arquitectura RISC, su consumo variará desde 10 a 55 vatios e incluirán instrucciones de 64 bits y SIMD extendidas y una memoria caché de tercer nivel de 26 Mbytes.

Tilera asegura que sus soluciones están por rendimiento y consumo, cuatro años por delante de sus competidores incluido Intel, de los que dice tener diez veces la eficiencia de los chips de próxima generación de “Westmere”.

vINQulos
The Inquirer UK


Comentarios

[...] Tilera anuncia microprocesadores de 100 núcleos | The Inquirer ES http://www.theinquirer.es/2009/10/27/tilera-anuncia-microprocesadores-de-100-nucleos.html – view page – cached La compañía de semiconductores Tilera, que ya ofrece 32 y 64 núcleos con los Tile64 y Tile32Pro, anuncia ahora una solución denominada TILE-Gx, con cuatro — From the page [...]

Por si alguien lo va a preguntar: No, no creo que suban los fps en el crysis con este procesador xD

  • por philsmock
  • 27 Oct 2009, 9:14
  • comment

Una pena que sigamos usando la ya desfasada tecnología x86.

  • por Invictus
  • 27 Oct 2009, 10:17
  • comment

Unos monstruos para la multitarea y multiproceso. Es de esperar que acaben siendo usados en servidores de alta capacidad de calculo o en futuras consolas. Pero claro, sólo es un suponer.

  • por Invictus
  • 27 Oct 2009, 10:19
  • comment

Supongo que no cuestan 50€ tampoco…

@Invictus: Totalmente de acuerdo.

  • por GITANO
  • 27 Oct 2009, 10:55
  • comment

Para que sirven 100 nucleos si el software esta diseñado para 1

Hasta que no aparezcan herramientas para programar efiientemente varios nucleos de poco sirve.

Rinde mas la frecuencia que los nucleos

  • por aaa
  • 27 Oct 2009, 11:15
  • comment

@ aaa: tienes toda la razón del mundo.

  • por bitarin
  • 27 Oct 2009, 11:37
  • comment

¿100 nucleos a 1500 Mhz cada con 55 w de consumo????
MODE SIMPSON ON:

aaaaahhhhhgggg¡¡¡¡¡ nucleotástico¡¡¡

MODE SIMPSON OOF, perdon OFF ;)

creo que mis próximas cpu van a ser RISC. Windows, chaval, lo siento, no es nada personal.

  • por Revenarius
  • 27 Oct 2009, 11:42
  • comment

Mirando en la pagina de Tilera:

Up to 750 billion operations per second (BOPS)

No he encontrado datos para comparar pero así “a ojo” parece una buena “marca” ¿alguien me ayuda a compararlo?

  • por Revenarius
  • 27 Oct 2009, 12:03
  • comment

@Revenarius.

Extremadamente difícil de comparar, incluso cogiendo las especificaciones de los fabricantes.

Vamos a intentar comparar este procesador con otro procesador masivamente paralelo que podemos conseguir por relativamente muy poco dinero.

Tilera :
100 núcleos,
750 BOPS (billones de operaciones por segundo)

Radeon 5870 :
1600 unidades de procesamiento (programables mediante CUDA)
2,72 Teraflops (billones de operaciones con coma flotante por segundo)

La unidad de Terfalops se refiere a billones internacionales (10 elevado a 12). Mientras que ese invento del BOP, que no existe como unidad reconocida, no sabemos si se refiere a billones americanos (10 elevado a 9) o internacionales. Aunque mucho me temo que es el primer caso.

Así que tenemos 2,73 * 10^12 operacions de coma flotante por segundo contra 750 * 10^9 (aunque podrían ser 10^12) operaciones por segundo.

Aunque nos decantemos por un valor o por otro, esto no acaba aquí. Y es que no son valores directamente comparables. Puesto que las operaciones de coma flotante por segundo todos sabemos lo que son. ¿ Pero que puñetas es este invento de BOPS ?, ¿ operaciones con enteros ?, … Depende de cual sea el caso es totalmente injusto comparar el uno con el otro.

En mi opinión, esta gente se ha lucido dando su rendimiento en esto de BOPS en lugar de usar una unidad reconocida, con la que podamos comparar. Esto me hace sospechar que usan billones americanos y mesuran operaciones sencillas, como las que implican enteros, para poder presumir de un valor alto.

En lo único que me parece destacable este procesador es en consumo. Para lo demás, si no dan especificaciones claras me quedo con una 5870 o la futra GT300.

  • por Marc
  • 27 Oct 2009, 12:43
  • comment

Es lo de siempre, cualquier CPU es “infinitamente” superior a las de Intel y AMD, pero si se usan estas ultimas, por algo será, no?
Porque será que esta comañia llamada Tilera, la conocerán tan solo en su casa?
Salu2

  • por David
  • 27 Oct 2009, 13:08
  • comment

Marc ¿¿que huevos tiene que ver una grafica con un procesador RISC??

@OvEr0n

Los mismos huevos que comparar procesadores CISC (Intel Core 2 Duo y Core 2 Quad) con procesadores RISC (estos Tile-Gx), como hacen la misma gente de Tilera en esa gráfica.

A fin de cuentas lo que nos interesa de un procesador es lo que puede hacer y no su arquitectura interna. Y las gráficas de última generación ya puede hacer exactamente lo mismo que los procesadores genéricos, como confirmó recientemente la misma nVidia cuando aseguró que su nuevo GT300 podría correr perfectamente un Sistema Operativo.

  • por Marc
  • 27 Oct 2009, 13:18
  • comment

@Marc

+1

Uy! Tanto el RV870 como Fermi, están lejos de poder ejecutar cualquier sentencia destinada a un procesador de propódito general, aunque eso sí, parece que Fermi se acerca algo más. Que fermi pueda ejecutar un SO es una tremenda mentira.

Respecto a la unidad BOP, es precisamente lo que indica, una unidad clara y concisa, billones americanos de operaciones RISC (arquitectura Tile) por segundo, no hablamos de operaciones ni con enteros (MIPS) o coma flotante (FLOPS), que siempre son operaciones matematicas; sino, de operaciones en general, que pueden ser todas las contempladas en el set de instrucciones de Tile. Esto son 750 x 10^9 operaciones por segundo, pero ojo, pasado a MIPS o FLOPS pues dependería del número de datos que puedan tratar en paralelo las unidades SIMD de cálculos matemáticos. De momento las gráficas se acercan más a estas unidades SIMD que a un procesador.

  • por pecoso
  • 27 Oct 2009, 15:03
  • comment

a ver si esto es más aclaratorio:

15 Gbps SNORT® processing
• 20 Gbps iptables (firewall)
• 20+ Gbps nProbe
• H.264 HD video encode: 10 streams of 1080p – baseline profile
• 15+ channels of OFDM baseband receiver processing (wireless

Supongo que si puede mover 20Gbps haciendo de firewall se podría decir que es capaz de procesar más o menos la misma cantidad de intormación en otros programas ¿no?

  • por Revenarius
  • 27 Oct 2009, 15:11
  • comment

@Marc

Creo que el invento del BOPS es una mutación aberrante de MIPS xD

Siendo MIPS millones de instrucciones por segundo de los cpu y Mflops idem para operaciones de punto flotante, si no le erré al cálc_ulo sería:

750 BOPS = 750000 MIPS

O sea algo así como 750GIPS internacional xD
La gráfica que mencionas es de 2.72Tflops o 2720Gflops

En comparación para saber cuanto es esto:

750GIPS internacional < 2720Gflops

O lo que es lo mismo:

750 bananas < 2720 sandías

xD

  • por magtec
  • 27 Oct 2009, 15:18
  • comment

Repito, no es comprable el BOP con el FLOP, puesto que el segundo carece de toda lógica y son cálculos puros y duros, sin embargo el BOP puede aplicar cualquier algoritmo que deseemos. Por eso nos dan los benchmarks en aplicaciones: VPN, IPS, H264 encode, etc.

Por cierto, Tile es una arquitectura VLIW (very long instruction word), como el Itanium, es decir, los cores son muy simples pues eliminan toda la lógica destinada al reparto de recursos y su planificación, quedando todo en manos del compilador; pero insisto siguen siendo procesadores completos, no como los stream processors, que son megasimples.

  • por pecoso
  • 27 Oct 2009, 15:34
  • comment

Su mercado potencial es el mismo que el Itanium. La cuestion, es hasta donde ha llegado Intel con el experimento 80 cores en la plataforma Itanium, con 16 cores se merienda a los 100 de este Tile, pero sin QPI etc Itanium tiene problemas para interconectar mas de 8.

  • por asiduo
  • 27 Oct 2009, 15:46
  • comment

@pecoso, te equivocas.

La 5870 y la GT300 no necesitan ejecutar instrucciones destinadas a procesadores de propósito general (imagino que te refieres al conjunto de instrucciones x86). En realidad solo necesita cuatro instrucciones básicas para poder implementar cualquier algoritmo imaginable.

Solo necesitas instrucciones de condicional, suma, multiplicación, acceso a memoria, … y muy poco más. Con eso ya tienes una máquina de Turing completa y puedes programar cualquier algoritmo. La única diferencia con el superordenador más moderno solo está en el tiempo que va a tardar en darte el resultado, pero vas a poder calcular exactamente lo mismo con los dos.

Y desde luego las unidades de procesamiento de las gráficas actuales ya tienen las instrucciones básicas que permiten reconocerlas como máquinas de Turing y programar algoritmos para resolver cualquier problema de complejidad determinista. Tienen esas instrucciones y más (instrucciones para las operaciones de coma flotante, etc. … que se podrían calcular igualmente con las instrucciones básicas, pero que iba a tardar mucho más).

La GT300 (al igual que la 5870) podría correr perfectamente un sistema operativo (Linux claro, puesto que hay que compilarlo especialmente para ese procesador, cosa que no se puede hacer con Windows).

http://www.noticias3d.com/noticia.asp?idnoticia=35772

  • por Marc
  • 27 Oct 2009, 15:55
  • comment

@Pecoso, no todas las instrucciones de un procesador se ejecutan en los mismos ciclos de reloj. En función del algoritmo que ejecutes siempre obtendrás valores distintos.

Mesurar en Bops si que carece de toda lógica. Eso solo sirve para comparar dos procesadores con exactamente la misma arquitectura. Fuera de eso es un valor totalmente inútil.

En cambio los Flops permiten comparaciones fidedignas entre procesadores y arquitecturas totalmente distintas.

  • por Marc
  • 27 Oct 2009, 16:01
  • comment

Gracias @magtec

750 bananas < 2720 sandías

Ahora ya me ha quedado muy claro XD XD.

  • por Marc
  • 27 Oct 2009, 16:03
  • comment

Yo veo mucho humo en esta noticia. Empezando con el valor de rendimiento, que es puro humo, puesto que no se puede comparar con nada, no nos indica absolutamente nada del rendimiento general del procesador. Y acabando con su misma arquitectura.

El artículo dice que está hecho con arquitectura RISC, pero también dice que tiene instrucciones SIMD, y ahora @pecoso nos dice que la arquitectura es VLIW (conjuunto de instrucciones muy largas).

Vaya solo falta que alguien más nos diga que lleva arquitectura CISC, y ese procesador abarca todo el espectro de arquitecturas conocidas. Que monstruo. XD XD.

  • por Marc
  • 27 Oct 2009, 16:15
  • comment

Veamos:

En esta página:
http://www.tgdaily.com/content/view/39408/118/
se hacen unas pruebas con los procesadores anteriores.

El Tilepro64 y el Tile64 rinden según la gráfica 221 Gflps en 16 bits. Si según Tilera rinde 443 Bops…. entonces 2 bops aproximadamente son 1 Gflop….entonces 750 Bops son más menos ¡¡¡375 gflops!!!

¿que os parece ahora? ¿Podriamos comparar ahora?

  • por Revenarius
  • 27 Oct 2009, 16:16
  • comment

@Revenarius, entonces mejor no hacemos la comparación puesto que este procesador queda en muy mal lugar :XD.

Da un rendimiento de 0,37 Teraflops comparado con los 2,73 Teraflops de la 5870. Prácticamente diez veces menos su rendimiento.

  • por Marc
  • 27 Oct 2009, 16:25
  • comment

@Marc

Si, pero este procesador es de propósito general y las gráficas aún no lo son.

No se, ¿cuanto rinde un procesador de gama alta para servidores?

  • por magtec
  • 27 Oct 2009, 16:32
  • comment

The Tile64/32 useed MIPS as basis. Usease, que esta cosa es a MIPS lo que Tegra es a ARM.

Habria que verlos como compiten con un Nehalem EX con Larrabe en el PCIe, en teoria esos 100cores rinden al nivel de 24 Atom, un Larrabe con 32cores lo adelantara por la derecha.

  • por asiduo
  • 27 Oct 2009, 16:40
  • comment

@Magtec, las nuevas gráficas las han preparado para ejecutar OpenCL que es código en C. ¿ Un procesador optimizado para ejecutar C no es un procesador de propósito general ?. Entonces lo siento, no tengo ni idea de lo que es un procesador de propósito general.

Yo pensaba que un procesador que puede correr un sistema operativo completo como Linux, era un procesador de propósito general.

http://www.noticias3d.com/noticia.asp?idnoticia=35772

Cierto que las gráficas están optimizadas para acelerar los renderizados 3D, pero ahora también son procesadores de propósito general, sus unidades de procesamiento sirven para cualquier tipo de cálculo y no solo para el renderizado de vídeo.

  • por Marc
  • 27 Oct 2009, 16:47
  • comment

Bueno, lo intente duramente y fui vencido.

Una mie*da de sitio…

  • por magtec
  • 27 Oct 2009, 17:04
  • comment

i7-965 3.2 GHz 51.20 Gflops

  • por magtec
  • 27 Oct 2009, 17:06
  • comment

@Marc

No sabía que las gráficas estaban tan avanzadas.

PD: es posible que en un momento vean unos 30 mensajes míos anteriores a este… o no.

mie*da de sitio…

  • por magtec
  • 27 Oct 2009, 17:08
  • comment

En teoria esos micros rinden igual que una placa Quadsocket Nehalem EX.

Es el rendimiento teorico de un Nehalem EX acompañado de un Larrabe 32cores.

  • por asiduo
  • 27 Oct 2009, 17:10
  • comment

@magtec

Según esos datos que das el “100nucleos” es como 7 veces y pico más potente que el i7 ¿no?

  • por Revenarius
  • 27 Oct 2009, 17:53
  • comment

@Revenarius

Casi 15 veces más potente. Sería como tener un servidor con 15 i7 965…

  • por magtec
  • 27 Oct 2009, 18:00
  • comment

ohhh ahhhh¡¡¡

Pues sí que hay diferencia…. y no creo que cueste como 15 i7….por no hablar del consumo.

  • por Revenarius
  • 27 Oct 2009, 18:46
  • comment

#asiduo, QPI no valdría para nada cuando se intenta una interconexion de tal magnitud, puesto que es un bus punto a punto, al estilo de Hypertransport. Este micro utiliza un red de interconexión, realmente el aspecto de diseño más importante en este tipo de sistemas; sin una buena red de inerconexión no hay micro.

Itanium no ha demostrado nada por ahora, bueno sí, que nadie lo quiere.

#Marc, no lo son, porque dependen de la cpu+driver para cargar en la memoria las tareas a desempeñar, y la lógica no se implementa en las GPU, sino en las CPU. Dile tu a una GPU que ejecute un bucle condicional, que acceda a una base de datos, etc, etc. Ahora mismo se le dice, pilla esta matriz y esta otra y sumalas, o multiplica este vector por tal valor; cosas que hará rapidisimamente.

  • por pecoso
  • 27 Oct 2009, 21:35
  • comment

@Revenarius

No había visto tu mensaje anterior, cosas de este sitio que no me lo mostraba.
cito:

El Tilepro64 y el Tile64 rinden según la gráfica 221 Gflps en 16 bits. Si según Tilera rinde 443 Bops…. entonces 2 bops aproximadamente son 1 Gflop….entonces 750 Bops son más menos ¡¡¡375 gflops!!!

Si es así tenías razón antes, este Tilera rinde lo mismo que más de 7 procesadores i7 965, y con tan solo 55W!!!

  • por magtec
  • 27 Oct 2009, 23:03
  • comment

Y digo yo, la mejor forma de comparar los 2 procesadores no sería hacerles ejecutar la misma aplicación para servidores con mismo SO pero en ambos casos todo generado con un compilador que optimice para cada arquitectura?

Al fin y al cabo lo importante no es cuantos núcleos tenga o no se que historias si no cuantas transacciones contra una BBDD pueda hacer en un determinado tiempo, el resto es como muy bien han dicho, comprarar bananas con sandías XD

  • por Roger
  • 27 Oct 2009, 23:10
  • comment

Uff, me asuste con el titular,

Pense que iban a ser los requisitos para Win 7 …. pero menos mal el vista sirvio para que no lo fuese asi…. que salvada madre mia !!!.

  • por youwin
  • 28 Oct 2009, 3:33
  • comment

@ Roger:

ahora mismo estamos especulando, si hubiera salido al mercado, entonces ya los hubieran probado completamente

  • por gdsahj
  • 28 Oct 2009, 3:37
  • comment

@Roger

Trabajamos con lo que hay …. y no hay muchos datos por el momento. Esto es todo especulativo, pero más menos vamos comparando en plan “andar por casa”. En cuanto tengamos una comparativa real o al menos un analisis ya podremos hacernos alguna idea mejor… por el momento….Todo especulación (calculada)

  • por Revenarius
  • 28 Oct 2009, 11:56
  • comment

Chicos 1 duda….. Usando Linux con este tipo de procesador no hay problema…..pero si se virtualizase windows en ese linux …..¿correría más que sobre el i7 directamente o simplemente iría “a su ritmo”?

!!!!!Se admiten todo tipo de opiniones¡¡¡¡¡

  • por Revenarius
  • 28 Oct 2009, 15:51
  • comment

@Revenarius

No puedes virtualizarlo con Vbox o vmware, necesitas un emulador de un micro x86.

Algo como esto:
http://www.theregister.co.uk/2007/03/23/java_emulator/

O dosbox, aunque dosbox emula a DOS sobre un x86.

  • por magtec
  • 28 Oct 2009, 15:58
  • comment

JPC is the fast pure Java™ x86 PC emulator

http://www-jpc.physics.ox.ac.uk/home_home.html

  • por magtec
  • 28 Oct 2009, 16:01
  • comment

Teóricamente se podría con QEMU Emulator:

http://www.nongnu.org/qemu/

QEMU CPU Emulator supports the emulation of x86 processors, ARM, SPARC and PowerPC. Host CPUs (processors that can run the QEMU emulator) include x86, PowerPC, Alpha, Sparc32, ARM, S390, Sparc64, ia64, and m68k (some of these are still in development). When emulating a PC (x86), supported guest operating systems include MSDOS, Fre_eDOS, Windows 3.11, Windows 98SE, Windows 2000, Linux, SkyOS, ReactOS, NetBSD, Minix, etc. When emulating a PowerPC, currently tested guest OSes include Debian Linux.

  • por magtec
  • 28 Oct 2009, 16:22
  • comment

@pecoso, ¿ donde has estado metido este último lustro ?.

¿ No te has enterado que las unidades de procesado de los procesadores gráficos ya ejecutan algoritmos complejos ?, ¿ sabes lo que es OpenCL, CUDA, Direct Compute, … ?, pues vete consultándolo.

Los centenares (cuando no, miles) de núcleos que llevan los procesadores gráficos de última generación tienen un set de instrucciones más que suficiente para ejecutar los bucles condicionales que dices, y acceder a memoria no es ningún problema para ellos, esos procesadores llevan incorporados rapidísimos controladores de memoria DDR5 con buses de 256 bits.

Hace mucho tiempo eep-Alive: 300
Connection: close
Referer: http://www.theies. ¿ Te has perdido toda la movida GPGPU de estos años ?.

Por supuesto que podría acceder a una Base de Datos. Solo tienes que poner Linux y cualquier base de datos de ese sistema, y podrás acceder a ella. NOTA: no me digas que no se le puede adaptar un Linux, porqué no es solo que lo haya confirmado nVidia, es que es de pura lógica. Linux se ha portado a decenas de arquitecturas, algunas tan pedestres como la consola PS1 ¿ y no se va a poder portar a este procesador, con un conjunto de instrucciones más rico, más recursos, etc. … ?.

NOTA: Evidentemente para montar un ordenador con Linux y este procesador habría que hacer una placa base a medida. El hecho de que no haya ninguna no tiene nada que ver, estamos hablando de la capacidad del procesador, no de que nadie vaya a hacerlo en realidad (si ni siquiera se aprovecha hoy, tantos años después, el Cell de la PS3 en un Linux adaptado a él, como para empezar un nuevo port de Linux por pura diversión. Primero que se estabilice la arquitectura de esos procesadores, y después quien sabe …).

  • por Marc
  • 28 Oct 2009, 16:45
  • comment

ehhh¡¡¡ que no estoy preguntando COMO se virtualiza, la pregunta es ¿se gana en velocidad o no?. Con tanta potencia tendría que ser un tiro,aún con la virtualización de por medio. ¿no?

  • por Revenarius
  • 28 Oct 2009, 16:55
  • comment

No lo creo @Revenarius, la virtualización, cuando encima hay que emular toda una arquitectura distinta es lentísima.

Un ARM de varios cientos de megaherzios emulando un x86 obtiene rendimientos como si fuera un 486, para que te hagas una idea.

La virtualización solo sirve para ejecutar ese código heredado al que no puedes renunciar, ese programa de contabilidad al que ya estás acostumbrado y donde ya tienes metidos todos los datos, por poner un ejemplo. Pero a poco que puedas hay que utilizar aplicaciones nativas, allí es cuando aprovechas la máquina que estés usando.

  • por Marc
  • 28 Oct 2009, 17:25
  • comment

@ Marc

Ok. En conclusión Windows no lo “cata” ni siquiera virtualizado. Bueno…..tampoco importa mucho Tenemos Linux, y sobre ese procesador seguro que vuela, planea, rompe la barrera del sonido, hace tirabuzones……(creo que ya se pilla la idea)

  • por Revenarius
  • 28 Oct 2009, 17:36
  • comment

La emulacion fue lo que mato al Itanium. Ejecutaba windows corriendo codigo x86 emulado con rendimientos inferiores al P3 necesitando el doble de frecuencia para igualar, pero con codigo nativo se merendaba todo lo que habia en mercado.

  • por asiduo
  • 28 Oct 2009, 18:13
  • comment

ok vierualización de máquina distinta malaaaaaaa¡¡¡¡¡

* No virtualizarás x86 sobre ARM
* Amarás el código nativo
* Usarás siempre formatos abiertos para no tener que virtualizar “dinosaurios”.

  • por Revenarius
  • 28 Oct 2009, 18:35
  • comment

ok virtualización de máquina distinta malaaaaaaa¡¡¡¡¡

* No virtualizarás x86 sobre ARM
* Amarás el código nativo
* Usarás siempre formatos abiertos para no tener que virtualizar “dinosaurios”.

  • por Revenarius
  • 28 Oct 2009, 18:35
  • comment

Interesante :)
En todo caso el día que me compre un ARM le voy a meter Linux y también QEMU + XP aunque no tire mucho…un windows siempre te puede sacar de un apuro.

  • por Roger
  • 28 Oct 2009, 23:40
  • comment

ehh¡¡¡ quietos parados todos¡¡¡¡

que estamos hablando de un “bicho” 15 veces superior en potencia al “buque insignia” de Intel. Aunque se pierda la décima parte de la potencia, aún debería ser 1,5 veces más potente que el I7 de “referencia” ¿no?

Si estoy equivocado, “porfa” que alguien postee y me corrija.

  • por Revenarius
  • 29 Oct 2009, 11:51
  • comment

Publica un nuevo comentario

  • Nombre:
  • E-mail :
  • URL:
  • Tu comentario:

     

Skip to main navigation