Esta discussão foi arquivada. Não se pode acrescentar nenhum comentário. |
E bus? (Pontos:3, Esclarecedor) |
| | Desculpem-me, por não andar actualizado em termos de bus, mas não me parece que consigas utilizar 25 GFlops se estiveres a utilizar barramentos como PCI e PCMCIA. |
| |
|
| | Ummm... Faz-me lembrar os transputer: http://vl.fmnet.info/transputer/ (A bueda anos) cheguei a ver na PCW uma review de um desses computadores com multiplos processadores montados em placas de expansao. O sistema base (386) estava la para gerir o disco e correr o office, se nao me engano. Devia ser giro pilotar um destes. ## I see offline people. |
| |
| | A bueda anos) cheguei a ver na PCW uma review de um desses computadores com multiplos processadores montados em placas de expansao. O sistema base (386) estava la para gerir o disco e correr o office, se nao me engano. Devia ser giro pilotar um destes. Ainda me lembro dessa edicao :-) (onde eles usavam os Transputers para paralelizar o rendering de um conjunto de Mandelbrot). Mas o 386 nao estava la' para correr o office, era usado para fazer a distribuicao de tarefas por entre os Transputers (que eram programados numa linguagem chamada Occam -- a linguagem mais horrivel de todos os tempos). "I triple guarantee you, there are no American soldiers in Baghdad.", Mohammed Saeed al-Sahaf, Iraqi Minister of Information
|
| |
| | ja la vai muito tempo e ja nao sei onde para a revista. ;) ## I see offline people. |
| |
| | 25 GFlops são operações por segundo executadas. Não equivalem necessariamente a 25G opcodes entregues ao CPU através de um bus, do mesmo modo que, mesmo os buses especializados ram-cpu, não conseguem entregar 32bits * 4GHZ * N pipes ao cpu (considerando apenas o fluxo das instruções). |
| |
| | Sim, mas a não ser que estejas a correr um gerador de números pseudo-aleatórios, as operações serão sobre dados. E dados para 25 GFlops não é algo que passes por um bus pci ou pcmcia. |
| |
| | Para UM processador, vc tem razão. Mas num treco destes, enquanto um processador trabalha o outro está sendo alimentado e o terceiro está com o resultado na mão. Algoritmos para computação paralela são bem complexos por causa disto : estuda-se a melhor forma de alimentar os processadores levando em conta, inclusive, as restrições de barramento.
[]s, Pink@Manaus.Amazon.Brazil.America.Earth.SolarSystem.OrionArm.MilkyWay.Universe |
| |
| | Não tem a ver com o número de processadores mas sim com a possibilidade de manter os dados suficientemente próximos do processador. Caches, memória local, etc. No caso do CS301, além de 256+128KB de RAM integrada no chip, as boards com CS301 que se podem ligar no bus PCI/PCMCIA têm até 1GB de RAM exactamente por causa disto.
Remember to be the Killer, not the Victim! (Nuklear Girl) |
| |
Misc (Pontos:3, Informativo) |
| | Primeiro, o CS301 não tem nada a ver com Altivec. Altivec é uma extensão SIMD ao conjunto de instruções dos PowerPC, implementada pela Motorola no G4 e pela IBM no G5, semelhante às extensões MMX/3dNow!/SSE/SSE2 nos processadores x86. A Apple acaba por ser quem menos teve a ver com isto, uma vez que não participou no desenvolvimento deste extensão nem tem direitos sobre ela. E já agora, no G4 a Motorola usou um co-processador (integrado no chip) para implementar Altivec mas no G5 a IBM integrou totalmente o suporte a Altivec no CPU. O CS301 por sua vez um processador autónomo, extremamente vectorial que pode ser integrado noutros sistemas mas não é um verdadeiro co-processador como os antigos 80x87. Num PC moderno, a coisa mais análoga são as GPUs nas placas aceleradoras 3D. Segundo, o CS301 não foi pensado exactamente para ser ligado num PC através de um bus PCI/PCMCIA porque estes são demasiado lentos. Isso é mais uma soluçao de recurso, para a avaliação e desenvolvimento. Mas a performance está limitada pela necessidade de manter todos os dados na RAM da development board. Para quem não quiser ler o PDF, cada development board pode conter um ou dois CS301 e 256MB a 1 GB de DDR SDRAM. Remember to be the Killer, not the Victim! (Nuklear Girl) |
| |
|
| | Pequena correcção. Enganei-me, esta coisa não é um processador vectorial. É formada por uma array de pequenos FPUs independentes.
Remember to be the Killer, not the Victim! (Nuklear Girl) |
| |
| | Similar capabilities are already built into Apple's G4 and G5 Macs, which have a floating-point co-processor called AltiVec, which handles complex, data-intensive calculations for the main processor. But whereas AltiVec is four-way parallel, ClearSpeed's chip is 64-way, the company said. "You might class it as a big evolutionary step of AltiVec," said Mike Calise, ClearSpeed's president.
My soul is painted like the wings of butterflies Fairy tales of yesterday will grow but never die I can fly - my friends |
| |
| | Eu tinha lido isso quando escrevi. ;)
Remember to be the Killer, not the Victim! (Nuklear Girl) |
| |
| | Realmente tens razão o Altivec é mesmo uma SIMD, tal como se pode ver aqui. Quando submiti o artigo e fiz o comentário acima não fiz mais investigação sobre o assunto, daí ter referido a citaçao do presidente da ClearStep. Parece que o senhor também precisa de se informar melhor :)
My soul is painted like the wings of butterflies Fairy tales of yesterday will grow but never die I can fly - my friends |
| |
| | Em termos de resultados reais e práticos não será melhor actualizar o CPU "normal" e por uns discos mais rápidos? Penso que será mais barato, eficiente e com maior performace. É um brinquedo engraçado mas parece daquelas coisas que a gente acaba de gastar uma pipa de massa e no fim tudo espremido o molho é pouco. imho.
"Big brother is watching you, and little brother is too. When big brother goes to sleep, little brother goes through his stuff." |
| |
|
| | UH? Agora estás a aplicar cegamente o tradicional "os discos fazem mais diferença que o CPU" a algo que não tem nada a ver. Isto não vai ser usado para melhorar a performance do software habitual em PCs comuns. Isto é para os casos em que toda a performance FP que conseguires é bem vinda e estás disposto a escrever software a partir do zero para isso. Num PC, talvez fosse interessante para comprimir video, se puder ser paralelizado adequadamente. Remember to be the Killer, not the Victim! (Nuklear Girl) |
| |
| | Em termos de resultados reais e práticos não será melhor actualizar o CPU "normal" e por uns discos mais rápidos? Discos mais rapidos pode nao resultar em nada -- o que conta mais e' a velocidade do bus, RAM e Cache. Tudo o resto conta pouco ou nada. "I triple guarantee you, there are no American soldiers in Baghdad.", Mohammed Saeed al-Sahaf, Iraqi Minister of Information
|
| |
| | "I triple garantee you, a nanosec is more important in performance than a microsec", Minister of Desinformation. Bem, mas o que está em questão - e como eu disse - é preferivel actualizar o CPU "normal" para quem precisa de poder de processamento em vez de andar com estes remendos.
"Big brother is watching you, and little brother is too. When big brother goes to sleep, little brother goes through his stuff." |
| |
| | Bem.. isto de comparar MIPS e FLOPS é uma grande treta mas se me descobrires um CPU normal com uma performance de 25GFLOPS e que consuma tipicamente 2-3 watts (o que dá uns 10GFLOPS/watt).. :-) Mas na prática, isto é capaz de ser interessante para aplicações embebidas ou muito especificas. Não há milagres. É preciso muito paralelismo para explorar a performance e muita localidade nos dados porque o chip não tem muita memória e o interface com o exterior não é nada de especial para os dias de hoje (1.6 GB/s para cada lado).
Remember to be the Killer, not the Victim! (Nuklear Girl) |
| |