Tip:
Highlight text to annotate it
X
Bien, probablemente escucharon sobre esto en los blogs,
lo escucharon en una cantidad de sitios. Es un producto muy interesante.
Y es realmente importante para mucha gente.
Va a hacer que muchas compañías, muchas empresas del gobierno ahorren mucho dinero.
Es el Procesador de computación Nvidia Tesla C1060.
Y qué hace el Tesla, le da a los científicos de la informática y a los investigadores,
les da la potencia de un super cluster de computación de pequeño a mediano
pero en un factor de forma de una estación de trabajo.
Es como una tarjeta de video, parece una tarjeta de video.
Se adaptará a su ordenador pero le da la potencia de un ambiente de sistemas rack.
Ahora, mejora mucho el GPU y el procesamiento paralelo.
Lo pone en un factor de forma pequeño, con un bus PCI express 2.0,
entonces lo ubicas en una estación de trabajo y obtienes esta inmensa cantidad de potencia.
Tiene una potencia de cálculo de más de un teraflop.
E introduce algo nuevo, que se llama Punto Flotante de Doble Precisión.
Que es algo nuevo. Todavía tiene el único, obviamente,
pero también tiene los dobles. Lo que esto significa depende de para qué lo vayas a usar.
Algo como esto se va a usar para hacer exploraciones de petróleo y gas,
finanzas computacional, dinámica de fluidos, investigación médica, diseño del tiempo.
No es para la gente común.
Van a estar usando esto y lo que hace todo esto posible
es que están utilizando CUDA API de Nvidia, que es el idioma de programación C.
Tiene un SDK (kit de desarrollo de software) grandioso para que puedan bajar programas
para este tipo de hardware. Mucho mejor que usar tu CPU o un cluster de CPUs,
para hacer estas tareas intensamente paralelas, usas procesadores en paralelo.
Y éste tiene 240 stream processors o uso de ALE.
Entonces van a hacer todo realmente rápido, y todo al mismo tiempo, en paralelo.
Y si no comprendes el concepto de paralelo, no es una tarjeta para tí.
Pero, si les da curiosidad y quieren ver este video,
en Envision 08, los muchachos de MythBusters hicieron una gran demostración.
Mírenlo y les dará idea de cómo funciona la computación en paralelo.
Ahora, además de los stream processors de 240 a 1300 MHz,
tiene 4 GB de GDDR3 a 800 MHz.
Tiene una interfaz de 512 MB de memoria. Fácilmente te da más de 100 GB por segundo
de banda ancha de memoria.
Para alimentar esto, vas a necesitar por lo menos 2, 6 clavijas PCI,
que puedes hacer 1 aquí, y 1 creo que bloquear uno de estos, 1 allí.
O puedes hacer un 8. Si haces un 8, está bien.
Pero si no, necesitas hacer 2 6s.
No creas que vas a hacer el 8 y el 6, vas a hacer uno o el otro.
Ahora, esos 240 stream processors que están aquí, son literalmente muy potentes.
Son los stream processors de 10 series de Nvidia. Tienen una unidad de punto flotante,
tiene una unidad lógica, tienen una unidad de movimiento y comparación, y tienen una unidad
branch. También aquí está el thread manager. No estoy seguro si es aquí o aquí.
Pero hay un thread manager que puede soportar hasta 12.000 threads con 0 sobrecarga
por thread switching. Se puede manejar sets de datos masivos.
También tiene 4 GB de memoria. se van a compilar enormes
y masivos sets de datos.
Si miran aquí, es simplemente una unidad computacional,
no van a haber ninguna ranura para gráficos aquí, no es para lo que es.
Y aquí abajo esta el bus PCI express 2.0.
Ahora, si quieren saber: ¿puedo usar una única express Y PCI? ¿Una X16 en vez de una X16 2.0
Sí, pueden, pero van a perder algo del ancho de banda,
y no es lo que quieren cuando tratan de obtener cantidades masivas de potencia
computacional de más de 1 teraflop por tarjeta, entonces ténganlo en cuenta.
Necesitan una buena cantidad de potencia. Necesitará cerca de 150 Watt,
entonces está bueno si tienen un suministro de potencia de 600 Watt para correr uno de estos
Pero, la mejor parte sobre el Procesador de Computación Tesla C1060 es que con este
tipo de tecnología y el tipo correcto de motherboard y el tipo correcto de sistema,
se pueden construir un súper ordenador que entre en la caja de un ordenador común.
Y hablo en serio. Así es como lo hacen.
Lo primero que necesitan es el motherboard correcto. Necesitan un motherboard que
soporte los procesadores Optrons o Xenon, o, ahora pueden usar el Core I 7,
que es la última plataforma, que es asombrosa Muy, muy rápida.
Lo que es más importante aun, es que necesitan por lo menos un mínimo de
3 ó 4 ranuras PCI express 2.0. Esta es PCI 2.0 y funciona mejor.
Éstas tienen 4 GB de memoria cada una, necesitan 4 GB de memoria adicional por
tarjeta. Van a conseguir un motherboard increíble
como un SkullTrail que tenga ranuras PCI Express 2.0, o un motherboard Core I 7
que es muy bueno. Especialmente uno que tenga drives SAS.
Y luego van a conseguir un mínimo de 12 GB de FB dims o DDR3 de triple canal,
lo que sea que se necesite, dependiendo del tablero. Y van a conseguir 3 de estas taretas
Tesla. Van a cargar las tres y se escalarán completamente.
Y no es como SLI o lo que pasa con los ordenadores y los juegos.
Estamos hablando de escalar a un ratio de 1 a 1.
Su última tarjeta será o una quardro FX para modelos 3D,
o una quardro CX para editr. Un NVS, si necesitan instalar varios monitores,
y asegúrense de tener ranuras de expansión
porque van a necesitar 2, 2, 2, y luego la tarjeta. Los gráficos.
La tarjeta de estación de trabajo y luego un PS usa puertos probablemente de 1200-1500 Watts,
porque lo van a usar. Si van a usar todo esto junto,
cargan Windows XP 64 bit, o Lynx 64 bit.
Y después van a tener uno para Vista y Windows 7 en el futuro pero no todavía.
Por ahora XP o Lynx, y literalmente construyen un super ordenador.
Un ambiente de racks de CPUs, en una carcaza.
Ponen algunos drives SAS, algunos monitores grandes,
y tienen una estación de trabajo asombrosa para un científico, para un investigador, para medicina.
Pueden hacer mucho con esto, y lo mejor es que como pueden construir un sistema como éste
por $10.000, en lugar de un super ordenador de 5 millones, le pueden dar a todo su personal
una de estas estaciones de trabajo. Y van a tener la potencia del cluster, en su escritorio.
Y ya no tiene que compartir el cluster.
Si tienen un problema y necesitan solucionarlo, simplemente insertan
sus cálculos y hacen lo que tienen que hacer con sus modelos,
y lo tienen en su escritorio. No necesitan agendar
con el cluster para que lo procese.
Y va a ser realmente más rápido que algunos de los ordenadores de
5-10 millones de dólares que andan por ahí.
Y esto les va a mostrar cuán potente es la plataforma Nvidia CUTA,
cuán potente es el procesador GPU y esto que ahora está bien para los científicos,
se va a establecer en el futuro, lo van a ver con
tarjetas quardro CX de Nvidia. Hacen lo mismo, pero para sistemas hogareños.
Y están diseñadas para CS4, para hacer edición de videos. Y para Photo Shop.
Usa potencia GPU para procesar, que es mejor si lo hacen en paralelo.
Y les brinda un gran rendimiento, pero eso es otro nivel.
Esto es para científicos e investigadores de computación y locos como esos.
Finanzas computacionales, que en realidad no entiendo.
Pero es un gran producto, definitivamente investíguenlo para su empresa.
Y considérenlo si llevan a cabo muchas investigaciones que requieren
este tipo de procesamiento en paralelo.
Si tienen preguntas, no me las envíen a mí, envíenlas a Nvidia.
Porque no sé tanto sobre este producto. Y... adiós.
Si son científicos o investigadores, y quieren más información
sobre el Procesador de Computación Tesla C1060, tipeen P56-1060
en el motor de búsqueda de cualquiera de estas importantes tiendas.
Para ComputerTV, soy Albert.
(C) 2008 SYX Services, Inc. All Rights Reserved Channel: TigerDirectBlog